专利用于识别图像中目标对象的方法、装置和设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210758316.1 (22)申请日 2022.06.29 (71)申请人科大讯飞股份有限公司地址 230088 安徽省合肥市高新区望江西路666号申请人北京航空航天大学 (72)发明人鲁盈悦　刘祥龙　陶仁帅　王天博　支洪平　吴子扬　刘聪　 (74)专利代理机构北京磐华捷成知识产权代理有限公司 1 1851 专利代理师谢栒 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/80(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06V 10/82(2022.01) (54)发明名称用于识别图像中目标对象的方法、装置和设备 (57)摘要本发明公开了用于识别图像中目标对象的方法、装置和设备，方法包括：获取待检测的图像，所述图像包含待识别的目标对象；将所述图像输入到经训练的特征增强模型中，以基于所存储的与所述目标对象相关联的全局类别原型特征来增强所述目标对象的特征，其中所述全局类别原型特征在对所述特征增强模型进行训练期间得到并存储；以及根据经增强的目标对象的特征来识别所述图像中的目标对象。本发明的方案能够增强目标的表示特征，根据增强后的表示特征来识别目标，有效地解决了因目标的表示特征微弱而导致的目标检测任务性能下降的问题，能够更容易分辨出目标类别，提升了机器模型的目标检测性能。权利要求书2页说明书9页附图2页 CN 115240135 A 2022.10.25 CN 115240135 A 1.一种用于识别图像中目标对象的方法，其特征在于，所述方法包括：获取待检测的图像，所述图像包含待识别的目标对象；将所述图像输入到经训练的特征增强模型中，以基于所存储的与所述目标对象相关联的全局类别原型特征来增强所述目标对象的特征，其中所述全局类别原型特征在对所述特征增强模型进行训练期间得到并存储；以及根据经增强的目标对象的特征来识别所述图像中的目标对象。 2.如权利要求1所述的方法，其特征在于，其中所述将所述图像输入到经训练的特征增强模型中，以基于所存储的与所述目标对象相关联的全局类别原型特征来增强所述目标对象的特征，包括：对所述图像进行特征提取，得到所述图像的图像特征图；对所述图像特征图进行目标检测，得到包围所述目标对象的候选框；以及将所述候选框映射到所述图像特征图上，得到所述候选框特征；以及将所述候选框特征和与所述候选框对应的全局类别原型特征进行融合，以增强所述目标对象的特征。 3.如权利要求2所述的方法，其特征在于，其中所述将所述候选框特征和与所述候选框对应的全局类别原型特征进行融合，以增强所述目标对象的特征，包括：计算所述候选框特征与每个全局类别原型特征的相似度，以确定与所述候选框对应的全局类别原型特征。 4.如权利要求1所述的方法，其特征在于，所述待检测的图像是X光图像，所述目标对象是违禁品。 5.如权利要求1所述的方法，其特征在于，其中所述经训练的特征增强模型包括目标检测网络、原型聚合网络和特征融合网络，其通过以下步骤进行训练而得到：获取包含目标对象的训练图像集，对所述训练图像集中的各个对象进行标注；经由所述特征增强模型中的目标检测网络对所述训练图像集中每个训练图像进行特征提取，得到所述训练图像的图像特征图，对所述图像特征图进行目标检测和过滤，得到包围所述训练图像中的目标对象的候选框；经由所述特征增强模型中的原型聚合网络对所述图像特征图和所述候选框进行处理，得到与所述候选框相对应的候选框特征和针对目标对象所属类别的所述全局类别原型特征，所述全局类别原型特征被存储并用于在测试阶段基于所述全局类别原型特征来增强待检测的图像中的待识别的目标对象的特征；经由所述特征增强模型中的特征融合网络对所述候选框特征和与所述候选框对应的全局类别原型特征进行融合，以增强所述目标对象的特征；以及基于所述全局类别原型特征计算损失，并基于所述损失更新所述特征增强模型的参数。 6.如权利要求5所述的方法，其特征在于，其中所述经由所述特征增强模型中的原型聚合网络对所述图像特征图和所述候选框进行处理，得到与所述候选框相对应的候选框特征和针对目标对象所属类别的全局类别原型特征，包括：将所述候选框映射到所述图像特征图上，得到所述候选框特征；将所述候选框特征按照不同目标对象进行划分，得到目标候选框特征集合；以及权　利　要　求　书 1/2 页 2 CN 115240135 A 2基于所述目标候选框特征集合建立针对每个目标对象的目标原型特征；基于所述目标原型特征得到所述目标对象所属类别的类别概率向量；基于所述目标原型特征和所述类别概率向量计算针对所述目标对象所属类别的类别原型特征；以及基于所述类别原型特征建立全局类别原型特征，并在每次训练迭代中进行更新所述全局类别原型特征。 7.如权利要求5所述的方法，其特征在于，其中所述经由所述特征增强模型中的特征融合网络对所述候选框特征和与所述候选框对应的全局类别原型特征进行融合，以增强所述目标对象的特征，包括：基于所述候选框特征对应的目标对象的类别标签来确定与所述候选框对应的全局类别原型特征。 8.一种用于识别图像中目标对象的装置，其特征在于，所述装置包括存储器和处理器，所述存储器上存储有由所述处理器运行的计算机程序，所述计算机程序在被所述处理器运行时，使得所述处理器执行如权利要求1 ‑7中的任一项所述的用于识别图像中目标对象的方法。 9.一种设备，其特征在于，所述设备包括图像采集装置和权利要求8所述的用于识别图像中目标对象的装置，其中所述图像采集装置用于采集待检测物品的图像以得到待检测的图像，所述用于识别图像中目标对象的装置用于对所述待检测的图像进行处理以根据经增强的目标对象的特征来识别所述图像中的所述目标对象。 10.一种计算机可读介质，其特征在于，所述计算机可读介质上存储有计算机可执行指令，所述计算机可执行指令在被执行时，执行如权利要求 1‑7中的任一项所述的用于识别图像中目标对象的方法。权　利　要　求　书 2/2 页 3 CN 115240135 A 3

专利 用于识别图像中目标对象的方法、装置和设备

专利用于识别图像中目标对象的方法、装置和设备