专利基于人工智能的图像检索方法、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211153215.8 (22)申请日 2022.09.21 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人许顺楠　付琰　陈亮辉　范斌　孙珂　 (74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙) 11413 专利代理师丁芸　马敬 (51)Int.Cl. G06F 16/583(2019.01) G06V 40/16(2022.01) G06V 10/74(2022.01) (54)发明名称基于人工智能的图像检索方法、装置、设备及存储介质 (57)摘要本公开提供了一种基于人工智能的图像检索方法、装置、设备及存储介质，涉及人工智能领域，具体涉及图像识别、视频分析技术，可应用在智慧城市、城市治理以及应急管理等场景下。具体实现方案为：对待搜索图像的人脸特征进行提取，得到目标人脸特征；基于目标人脸特征，从人脸特征库中召回待搜索图像对应的召回图像，得到一次召回图像集；基于待搜索图像与一次召回图像集中各召回图像之间的相似度，从一次召回图像集中确定正样本图像；基于正样本图像的人脸特征，从人脸特征库中召回正样本图像对应的召回图像，得到二次召回图像集；从一次召回图像集和二次召回图像集中，确定待搜索图像的检索结果，提高了待搜索图像的召回率和召回准确率。权利要求书5页说明书15页附图5页 CN 115481276 A 2022.12.16 CN 115481276 A 1.一种基于人工智能的图像检索方法，包括：对待搜索图像的人脸特征进行提取，得到目标人脸特征；基于所述目标人脸特征与人脸特征库中各图像的人脸特征之间的相似度，从所述人脸特征库中召回所述待搜索图像对应的召回图像，得到一次召回图像集；所述人脸特征库中包含多个图像的人脸特征；基于所述待搜索图像与所述一次召回图像集中各召回图像之间的相似度，从所述一次召回图像集中确定正样本图像；基于所述正样本图像的人脸特征，与所述人脸特征库中各图像的人脸特征之间的相似度，从所述人脸特征库中召回所述正样本图像对应的召回图像，得到二次召回图像集；从所述一次召回图像集和所述二次召回图像集中，确定所述待搜索图像的检索结果。 2.根据权利要求1所述的方法，还包括：对所述待搜索图像的属性特征进行提取，得到目标属性特征；基于所述目标属性特征，确定所述待搜索图像的图像质量值；获取所述待搜索图像的拍摄信息；所述基于所述待搜索图像与所述一次召回图像集中各召回图像之间的相似度，从所述一次召回图像集中确定正样本图像，包括：基于所述图像质量值、所述目标属性特征、所述拍摄信息、以及所述待搜索图像与所述一次召回图像集中各召回图像之间的相似度，从所述一次召回图像集中确定预设数量个正样本图像。 3.根据权利要求2所述的方法，其中，所述基于所述目标属性特征，确定所述待搜索图像的图像质量值，包括：对所述目标属性特征进行编码，得到属性特征编码；将所述属性特征编码输入预先训练的人脸质量判别模型中进行人脸质量预测，得到所述待搜索图像的图像质量值；其中，所述预先训练的人脸质量判别模型是根据样本属性特征编码，以及样本属性特征编码对应的图像质量值训练得到的。 4.根据权利要求2所述的方法，其中，所述目标属性特征包括：图像中人脸是否戴口罩、人脸是否戴眼镜、人脸对应的年龄、人脸对应的性别、人脸的亮度、人脸的模糊度、人脸的俯仰角以及人脸的旋转角度中的至少一项；所述拍摄信息包括：图像的拍摄设备类型、拍摄时间、图像中车牌信息中的至少一项。 5.根据权利要求2所述的方法，其中，所述基于所述图像质量值，所述目标属性特征、所述拍摄信息，以及所述待搜索图像与所述一次召回图像集中各召回图像之间的相似度，从所述一次召回图像集中确定预设数量个正样本图像，包括：获取所述待搜索图像分别与所述一次召回图像集中各召回图像之间的相似度，得到各图像相似度；遍历所述一次召回图像集中各召回图像，在所述待搜索图像的拍摄信息包括第一指定信息的情况下，将图像相似度大于第一阈值的、拍摄信息包括第二指定信息的召回图像加入正样本图像集中；在所述正样本图像集中正样本图像数量小于预设数量时，遍历所述一次召回图像集中各召回图像，将图像相似度大于第二阈值的、图像质量值与所述待搜索图像的图像质量值权　利　要　求　书 1/5 页 2 CN 115481276 A 2相反、且当前不是正样本图像的召回图像加入正样本图像集中；在所述正样本图像集中正样本图像数量小于预设数量时，遍历所述一次召回图像集中各召回图像，在所述待搜索图像的目标属性特征包括第一指定属性的情况下，将图像相似度大于第三阈值的、属性特征包括第二指定属性、且当前不是正样本图像的召回图像加入正样本图像集中；在所述正样本图像集中正样本图像数量小于预设数量时，遍历所述一次召回图像集中各召回图像，将图像相似度在第四阈值和第五阈值之间、且当前不是正样本图像的召回图像加入正样本图像集中，至所述正样本图像集中正样本图像数量达到预设数量；其中，第五阈值随所确定的在前正样本图像与所述待搜索图像之间的相似度变化。 6.根据权利要求1所述的方法，其中，所述从所述一次召回图像集和所述二次召回图像集中，确定所述待搜索图像的检索结果，包括：对所述一次召回图像集和所述二次召回图像集中各召回图像进行去重，得到候选图像集；确定所述候选图像集中每一候选图像的召回次数；确定所述候选图像集中每一候选图像的召回分数值；基于每一候选图像的召回分数值，以及每一候选图像的召回次数，对各候选图像进行排序；将召回分数值大于第六阈值、排序靠前的目标数量个候选图像，确定为所述待搜索图像的检索结果。 7.根据权利要求6所述的方法，其中，所述确定所述候选图像集中每一候选图像的召回分数值，包括：获取所述候选图像集中每一候选图像的召回相似度，所述召回相似度表示该候选图像与召回该候选图像的图像之间的相似度；针对每一候选图像，确定该候选图像对应的预设维度属性特征；基于所述预设维度属性特征，对该候选图像的相似度调权值进行预测，得到预测调权值；利用所述预测调权值，对该候选图像的召回相似度进行修正，得到修正相似度；将该候选图像的修正相似度均值，确定为该候选图像的召回分数值。 8.根据权利要求7所述的方法，其中，所述基于所述预设维度属性特征，对该候选图像的相似度调权值进行预测，得到预测调权值，包括：将所述预设维度属性特征输入预先训练的调权模型中，得到该候选图像的召回相似度对应的预测调权值；其中，所述预先训练的调权模型是根据样本预设维度属性特征，以及样本预设维度属性特征对应的调权值训练得到的。 9.根据权利要求7所述的方法，其中，所述预设维度属性特征包括：候选图像与目标图像之间的空间距离、候选图像中包含的车牌信息与目标图像中包含的车牌信息是否相同、候选图像与目标图像之间的拍摄时间差、候选图像的图像质量值以及目标图像的图像质量值，所述目标图像为召回候选图像的图像。 10.根据权利要求6 ‑9任一所述的方法，其中，所述基于每一候选图像的召回分数值，以及每一候选图像的召回次数，对各候选图像进行排序，包括：权　利　要　求　书 2/5 页 3 CN 115481276 A 3

专利 基于人工智能的图像检索方法、装置、设备及存储介质

专利基于人工智能的图像检索方法、装置、设备及存储介质