说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211153215.8 (22)申请日 2022.09.21 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 许顺楠 付琰 陈亮辉 范斌  孙珂  (74)专利代理 机构 北京柏杉松知识产权代理事 务所(普通 合伙) 11413 专利代理师 丁芸 马敬 (51)Int.Cl. G06F 16/583(2019.01) G06V 40/16(2022.01) G06V 10/74(2022.01) (54)发明名称 基于人工智能的图像检索方法、 装置、 设备 及存储介质 (57)摘要 本公开提供了一种基于人工智能的图像检 索方法、 装置、 设备及存储介质, 涉及人工智能领 域, 具体涉及图像识别、 视频分析技术, 可应用在 智慧城市、 城市治理以及应急管理等场景下。 具 体实现方案为: 对待搜索图像的人脸特征进行提 取, 得到目标人脸特征; 基于目标人脸特征, 从人 脸特征库中召回待搜索图像对应的召回图像, 得 到一次召回图像集; 基于待搜索图像与一次召回 图像集中各召回图像之间的相似度, 从一次召回 图像集中确定正样本图像; 基于正样本图像的人 脸特征, 从人脸特征库中召回正样 本图像对应的 召回图像, 得到二次召回图像集; 从一次召回图 像集和二次召回图像集中, 确定待搜索图像的检 索结果, 提高了待搜索图像的召回率和召回准确 率。 权利要求书5页 说明书15页 附图5页 CN 115481276 A 2022.12.16 CN 115481276 A 1.一种基于人工智能的图像 检索方法, 包括: 对待搜索图像的人脸特 征进行提取, 得到目标 人脸特征; 基于所述目标人脸特征与 人脸特征库中各图像的人脸特征之间的相似度, 从所述人脸 特征库中召回所述待搜索图像对应的召回图像, 得到一次召回图像集; 所述人脸特征库中 包含多个图像的人脸特 征; 基于所述待搜索图像与所述一 次召回图像集中各召回图像之间的相似度, 从所述一 次 召回图像集中确定正样本图像; 基于所述正样本图像的人脸特征, 与所述人脸特征库中各图像的人脸特征之间的相似 度, 从所述人脸特 征库中召回所述 正样本图像对应的召回图像, 得到二次召回图像集; 从所述一次召回图像集和所述 二次召回图像集中, 确定所述待搜索图像的检索结果。 2.根据权利要求1所述的方法, 还 包括: 对所述待搜索图像的属性特 征进行提取, 得到目标属性特 征; 基于所述目标属性特 征, 确定所述待搜索图像的图像质量 值; 获取所述待搜索图像的拍摄信息; 所述基于所述待搜索图像与 所述一次召回图像集中各召回图像之间的相似度, 从所述 一次召回图像集中确定正样本图像, 包括: 基于所述图像质量值、 所述目标属性特征、 所述拍摄信 息、 以及所述待搜索图像与所述 一次召回图像集中各召回图像之间的相似度, 从所述一次召回图像集中确定预设数量个正 样本图像。 3.根据权利要求2所述的方法, 其中, 所述基于所述目标属性特征, 确定所述待搜索图 像的图像质量 值, 包括: 对所述目标属性特 征进行编码, 得到属性特 征编码; 将所述属性特征编码输入预先训练 的人脸质量判别模型中进行人脸质量预测, 得到所 述待搜索图像的图像质量值; 其中, 所述预先训练的人脸质量判别模型是根据样本属 性特 征编码, 以及样本属性特 征编码对应的图像质量 值训练得到的。 4.根据权利要求2所述的方法, 其中, 所述目标属性特征包括: 图像 中人脸是否 戴口罩、 人脸是否戴眼镜、 人脸对应的年龄、 人脸对应的性别、 人脸的亮度、 人脸的模糊度、 人脸的俯 仰角以及人脸的旋转角度中的至少一项; 所述拍摄信息包括: 图像的拍摄设备类型、 拍摄时 间、 图像中车牌信息中的至少一项。 5.根据权利要求2所述的方法, 其中, 所述基于所述图像质量值, 所述目标属性特征、 所 述拍摄信息, 以及所述待搜索图像与所述一次召回图像集中各召回图像之间的相似度, 从 所述一次召回图像集中确定预设数量个正样本图像, 包括: 获取所述待搜索图像分别与 所述一次召回图像集中各召回图像之间的相似度, 得到各 图像相似度; 遍历所述一 次召回图像集中各召回图像, 在所述待搜索图像的拍摄信 息包括第 一指定 信息的情况下, 将图像相似度大于第一阈值的、 拍摄信息包括第二指定信息的召回图像加 入正样本图像集中; 在所述正样本图像集中正样本图像数量小于预设数量 时, 遍历所述一 次召回图像集中 各召回图像, 将图像相似度大于第二阈值的、 图像质量值与所述待搜索图像的图像质量值权 利 要 求 书 1/5 页 2 CN 115481276 A 2相反、 且当前不是正样本图像的召回图像加入正样本图像集中; 在所述正样本图像集中正样本图像数量小于预设数量 时, 遍历所述一 次召回图像集中 各召回图像, 在所述待搜索图像的目标属 性特征包括第一指定属 性的情况下, 将图像相似 度大于第三阈值的、 属 性特征包括第二指定属 性、 且当前不是正样本图像的召回图像加入 正样本图像集中; 在所述正样本图像集中正样本图像数量小于预设数量 时, 遍历所述一 次召回图像集中 各召回图像, 将图像相似度在第四阈值和第 五阈值之间、 且当前不是正样本图像的召回图 像加入正样本图像集中, 至所述正样本图像集中正样本图像数量达到预设数量; 其中, 第五 阈值随所确定的在前正样本图像与所述待搜索图像之间的相似度变化。 6.根据权利要求1所述的方法, 其中, 所述从所述一 次召回图像集和所述二 次召回图像 集中, 确定所述待搜索图像的检索结果, 包括: 对所述一 次召回图像集和所述二 次召回图像集中各召回图像进行去重, 得到候选图像 集; 确定所述 候选图像集中每一 候选图像的召回 次数; 确定所述 候选图像集中每一 候选图像的召回分数值; 基于每一候选 图像的召回分数值, 以及每一候选 图像的召回次数, 对各候选 图像进行 排序; 将召回分数值大于第六阈值、 排序靠前的目标数量个候选 图像, 确定为所述待搜索图 像的检索结果。 7.根据权利要求6所述的方法, 其中, 所述确定所述候选图像集中每一候选图像的召回 分数值, 包括: 获取所述候选图像集中每一候选图像的召回相似度, 所述召回相似度表示该候选图像 与召回该候选图像的图像之间的相似度; 针对每一 候选图像, 确定该候选图像对应的预设维度属性特 征; 基于所述预设维度属性特征, 对该候选 图像的相似度调权值进行预测, 得到预测调权 值; 利用所述预测调权值, 对该候选图像的召回相似度进行修 正, 得到修 正相似度; 将该候选图像的修 正相似度均值, 确定为该候选图像的召回分数值。 8.根据权利要求7所述的方法, 其中, 所述基于所述预设维度属性特征, 对该候选 图像 的相似度调权值进行 预测, 得到预测调权值, 包括: 将所述预设维度属性特征输入预先训练的调权模型中, 得到该候选图像的召回相似度 对应的预测调权值; 其中, 所述预先训练的调权模 型是根据样本预设维度属性特征, 以及样 本预设维度属性特 征对应的调权值训练得到的。 9.根据权利要求7所述的方法, 其中, 所述预设维度属性特征包括: 候选 图像与目标图 像之间的空间距离、 候选图像中包含的车牌信息与目标图像中包含的车牌信息是否相同、 候选图像与目标图像之 间的拍摄时间差、 候选图像的图像质量值以及目标图像的图像质量 值, 所述目标图像为召回候选图像的图像。 10.根据权利要求6 ‑9任一所述的方法, 其中, 所述基于每一候选图像的召回分数值, 以 及每一候选图像的召回 次数, 对各候选图像进行排序, 包括:权 利 要 求 书 2/5 页 3 CN 115481276 A 3

.PDF文档 专利 基于人工智能的图像检索方法、装置、设备及存储介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于人工智能的图像检索方法、装置、设备及存储介质 第 1 页 专利 基于人工智能的图像检索方法、装置、设备及存储介质 第 2 页 专利 基于人工智能的图像检索方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:22:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。