专利样本图像标注、模型训练方法、装置、设备以及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210565038.8 (22)申请日 2022.05.23 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人王鹏　谢群义　钦夏孟　姚锟　 (74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙) 11413 专利代理师孟维娜　项京 (51)Int.Cl. G06V 30/19(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01)G06V 10/80(2022.01) (54)发明名称样本图像标注、模型训练方法、装置、设备以及存储介质 (57)摘要本公开提供了一种样本图像标注、模型训练方法、装置、设备以及存储介质，涉及人工智能技术领域，具体为深度学习、图像处理、计算机视觉技术领域，可应用于OCR等场景。具体实现方案为：提取未标注的第一样本图像的图像特征；根据所述图像特征，获得表征所述第一样本图像中对象位置的位置特征、以及表征所述第一样本图像中对象分类的多种分类特征；根据所述多种分类特征，确定所述第一样本图像的伪标注信息；根据所述图像特征、位置特征以及多种分类特征，获得表征所述伪标注信息正确性的置信度；根据所述置信度和所述伪标注信息，对所述第一样本图像进行标注。应用本公开实施例提供的方案，能够提高样本图像标注的准确性。权利要求书4页说明书16页附图8页 CN 114998908 A 2022.09.02 CN 114998908 A 1.一种样本图像标注方法，包括：提取未标注的第一样本图像的图像特征；根据所述图像特征，获取所述第一样本图像中对象的位置特征、和所述对象的多种分类特征；根据所述多种分类特征，确定所述第一样本图像的伪标注信息；根据第一参考特征，获取所述伪标注信息的置信度，所述第一参考特征包括：所述图像特征、所述位置特征和所述多种分类特征；根据所述置信度和所述伪标注信息，对所述第一样本图像进行标注。 2.根据权利要求1所述的方法，其中，所述根据所述置信度和所述伪标注信息，对所述第一样本图像进行标注，包括：响应于确定所述置信度大于预设的阈值程度，确定所述伪标注信息为所述第一样本图像的标注信息；响应于确定所述置信度小于或等于所述阈值程度，对所述第一样本图像进行标注，得到标注信息。 3.根据权利要求1所述的方法，其中，所述根据所述多种分类特征，确定所述第一样本图像的伪标注信息，包括：获取所述多种分类特征的融合特征；根据所述融合特征，确定所述伪标注信息；所述第一参考特征还包括：所述融合特征。 4.根据权利要求1所述的方法，其中，所述提取未标注的第一样本图像的图像特征，包括：将未标注的第一样本图像输入预先训练的图像标注模型中检测子网络的图像特征提取层，得到所述图像特征；其中，所述图像标注模型还包括：置信度预测子网络，所述检测子网络还包括：位置特征获得层和多个分类特征获得层；所述根据所述图像特征，获取所述第一样本图像中对象的位置特征、和所述对象的多种分类特征，包括：将所述图像特征输入所述位置特征获得层和所述多个分类特征获得层，分别得到所述位置特征和所述多种分类特征；所述根据所述第一参考特征，获取所述伪标注信息的置信度，包括：将所述第一参考特征输入所述置信度预测子网络，得到所述置信度。 5.一种模型训练方法，包括：将第二样本图像输入待训练的图像标注模型中检测子网络的图像特征提取层，得到所述第二样本图像的样本图像特征，其中，所述图像标注模型还包括：置信度预测子网络，所述检测子网络还包括：位置特征获得层和多个分类特征获得层；将所述样本图像特征输入所述位置特征获得层和所述多个分类特征获得层，分别得到所述第二样本图像中对象的样本位置特征和所述对象的多种样本分类特征；获取所述第二样本图像的标注信息；基于所述第一参考特征，确定所述检测子网络进行对象检测的网络损失，所述第一参权　利　要　求　书 1/4 页 2 CN 114998908 A 2考特征包括：所述标注信息和所述多种样本分类特征；将所述第二参考特征输入所述置信度预测子网络，得到所述标注信息的样本置信度，所述第二参考特征包括：所述样本图像特征、所述样本位置特征和所述多种样本分类特征；基于所述网络损失和所述样本置信度，调整所述图像标注模型的网络参数。 6.根据权利要求5所述的方法，其中，所述第二样本图像为未标注图像；所述获取所述第二样本图像的标注信息，包括：根据所述多种样本分类特征，确定所述第二样本图像的伪标注信息，并将所确定的伪标注信息作为所述第二样本图像的标注信息。 7.根据权利要求6所述的方法，其中，所述检测子网络还包括：融合特征获得层；所述根据所述多种样本分类特征，确定所述第二样本图像的伪标注信息，包括：将所述多种样本分类特征输入所述融合特征获得层进行特征融合，得到样本融合特征；根据所述样本融合特征，确定所述伪标注信息；所述第一参考特征还包括：所述样本融合特征；所述第二参考特征还包括：所述样本融合特征。 8.根据权利要求5所述的方法，其中，所述第二样本图像为已标注图像，所述第一参考特征还包括：样本位置特征。 9.一种样本图像标注装置，包括：图像特征提取模块，用于提取未标注的第一样本图像的图像特征；第一特征获得模块，用于根据所述图像特征，获取所述第一样本图像中对象的位置特征、和所述对象的多种分类特征；伪标注信息确定模块，用于根据所述多种分类特征，确定所述第一样本图像的伪标注信息；置信度获得模块，用于根据第一参考特征，获取所述伪标注信息的置信度，所述第一参考特征包括：所述图像特征、所述位置特征和所述多种分类特征；样本图像标注模块，用于根据所述置信度和所述伪标注信息，对所述第一样本图像进行标注。 10.根据权利要求9所述的装置，其中，所述样本图像标注模块，具体用于响应于确定所述置信度大于预设的阈值程度，确定所述伪标注信息为所述第一样本图像的标注信息；响应于确定所述置信度小于或等于所述阈值程度，对所述第一样本图像进行标注，得到标注信息。 11.根据权利要求9所述的装置，其中，所述伪标注信息确定模块，具体用于获取所述多种分类特征的融合特征；根据所述融合特征，确定所述伪标注信息；所述第一参考特征还包括：所述融合特征。 12.根据权利要求9所述的装置，其中，所述图像特征提取模块，具体用于将未标注的第一样本图像输入预先训练的图像标注模型中检测子网络的图像特征提取层，得到所述图像特征，其中，所述图像标注模型还包括：置信度预测子网络，所述检测子网络还包括：位置特征获得层和多个分类特征获得层；权　利　要　求　书 2/4 页 3 CN 114998908 A 3

专利 样本图像标注、模型训练方法、装置、设备以及存储介质

专利样本图像标注、模型训练方法、装置、设备以及存储介质