说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210565038.8 (22)申请日 2022.05.23 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 王鹏 谢群义 钦夏孟 姚锟  (74)专利代理 机构 北京柏杉松知识产权代理事 务所(普通 合伙) 11413 专利代理师 孟维娜 项京 (51)Int.Cl. G06V 30/19(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01)G06V 10/80(2022.01) (54)发明名称 样本图像标注、 模 型训练方法、 装置、 设备以 及存储介质 (57)摘要 本公开提供了一种样 本图像标注、 模 型训练 方法、 装置、 设备以及存储介质, 涉及人工智能技 术领域, 具体为深度学习、 图像处理、 计算机视觉 技术领域, 可应用于OCR等场景。 具体实现方案 为: 提取未标注的第一样本图像的图像特征; 根 据所述图像特征, 获得表征所述第一样本图像中 对象位置的位置特征、 以及表征所述第一样本图 像中对象分类的多种分类特征; 根据所述多种分 类特征, 确定所述第一样本图像的伪标注信息; 根据所述图像特征、 位置特征以及多种分类特 征, 获得表征所述伪标注信息正确性的置信度; 根据所述置信度和所述伪标注信息, 对所述第一 样本图像进行标注。 应用本公开实施例提供的方 案, 能够提高样本图像标注的准确性。 权利要求书4页 说明书16页 附图8页 CN 114998908 A 2022.09.02 CN 114998908 A 1.一种样本图像标注方法, 包括: 提取未标注的第一样本图像的图像特 征; 根据所述图像特征, 获取所述第一样本 图像中对象的位置特征、 和所述对象的多种分 类特征; 根据所述多种分类特 征, 确定所述第一样本图像的伪标注信息; 根据第一参考特征, 获取所述伪标注信 息的置信度, 所述第 一参考特征包括: 所述图像 特征、 所述位置特征和所述多种分类特 征; 根据所述置信度和所述伪标注信息, 对所述第一样本图像进行 标注。 2.根据权利要求1所述的方法, 其中, 所述根据所述置信度和所述伪标注信息, 对所述 第一样本图像进行 标注, 包括: 响应于确定所述置信度 大于预设的阈值程度, 确定所述伪标注信 息为所述第 一样本图 像的标注信息; 响应于确定所述置信度小于或等于所述阈值程度, 对所述第一样本 图像进行标注, 得 到标注信息 。 3.根据权利要求1所述的方法, 其中, 所述根据所述多种分类特征, 确定所述第一样本 图像的伪标注信息, 包括: 获取所述多种分类特 征的融合特 征; 根据所述融合特 征, 确定所述伪标注信息; 所述第一 参考特征还包括: 所述融合特 征。 4.根据权利要求1所述的方法, 其中, 所述提取未标注的第一样本 图像的图像特征, 包 括: 将未标注的第一样本图像输入预先训练的图像标注模型中检测子网络的图像特征提 取层, 得到所述图像特 征; 其中, 所述图像标注模型还包括: 置信度预测子网络, 所述检测子网络还包括: 位置特 征获得层和多个分类特 征获得层; 所述根据所述图像特征, 获取所述第一样本 图像中对象的位置特征、 和所述对象的多 种分类特 征, 包括: 将所述图像特征输入所述位置特征获得层和所述多个分类特征获得层, 分别得到所述 位置特征和所述多种分类特 征; 所述根据所述第一 参考特征, 获取所述伪标注信息的置信度, 包括: 将所述第一 参考特征输入所述置信度预测子网络, 得到所述置信度。 5.一种模型训练方法, 包括: 将第二样本图像输入待训练 的图像标注模型中检测子网络的图像特征提取层, 得到所 述第二样本图像的样本图像特征, 其中, 所述图像标注模型还包括: 置信度预测子网络, 所 述检测子网络还 包括: 位置特 征获得层和多个分类特 征获得层; 将所述样本图像特征输入所述位置特征获得层和所述多个分类特征获得层, 分别得到 所述第二样本图像中对象的样本位置特 征和所述对象的多种样本分类特 征; 获取所述第二样本图像的标注信息; 基于所述第一参考特征, 确定所述检测子网络进行对象检测的网络损 失, 所述第一参权 利 要 求 书 1/4 页 2 CN 114998908 A 2考特征包括: 所述标注信息和所述多种样本分类特 征; 将所述第二参考特征输入所述置信度预测子网络, 得到所述标注信息的样本置信度, 所述第二 参考特征包括: 所述样本图像特 征、 所述样本位置特 征和所述多种样本分类特 征; 基于所述网络损失和所述样本 置信度, 调整所述图像标注模型的网络参数。 6.根据权利要求5所述的方法, 其中, 所述第二样本图像为未 标注图像; 所述获取 所述第二样本图像的标注信息, 包括: 根据所述多种样本分类特征, 确定所述第二样本 图像的伪标注信息, 并将所确定的伪 标注信息作为所述第二样本图像的标注信息 。 7.根据权利要求6所述的方法, 其中, 所述检测子网络还 包括: 融合特 征获得层; 所述根据所述多种样本分类特 征, 确定所述第二样本图像的伪标注信息, 包括: 将所述多种样本分类特征输入所述融合特征获得层进行特征融合, 得到样本融合特 征; 根据所述样本融合特 征, 确定所述伪标注信息; 所述第一 参考特征还包括: 所述样本融合特 征; 所述第二 参考特征还包括: 所述样本融合特 征。 8.根据权利要求5所述的方法, 其中, 所述第二样本 图像为已标注图像, 所述第一参考 特征还包括: 样本位置特 征。 9.一种样本图像标注装置, 包括: 图像特征提取模块, 用于提取 未标注的第一样本图像的图像特 征; 第一特征获得模块, 用于根据所述图像特征, 获取所述第一样本 图像中对象的位置特 征、 和所述对象的多种分类特 征; 伪标注信息确定模块, 用于根据所述多种分类特征, 确定所述第一样本 图像的伪标注 信息; 置信度获得模块, 用于根据第 一参考特征, 获取所述伪标注信 息的置信度, 所述第一参 考特征包括: 所述图像特 征、 所述位置特征和所述多种分类特 征; 样本图像标注模块, 用于根据所述置信度和所述伪标注信息, 对所述第一样本 图像进 行标注。 10.根据权利要求9所述的装置, 其中, 所述样本 图像标注模块, 具体用于响应于确定所述置信度大于预设的阈值程度, 确定 所述伪标注信息为所述第一样本图像的标注信息; 响应于确定所述置信度小于或等于所述 阈值程度, 对所述第一样本图像进行 标注, 得到标注信息 。 11.根据权利要求9所述的装置, 其中, 所述伪标注信息确定模块, 具体用于获取所述多种分类特征的融合特征; 根据所述融 合特征, 确定所述伪标注信息; 所述第一 参考特征还包括: 所述融合特 征。 12.根据权利要求9所述的装置, 其中, 所述图像特征提取模块, 具体用于将未标注的第 一样本图像输入预先训练的图像标注 模型中检测子网络的图像特征提取层, 得到所述图像特征, 其中, 所述图像标注模型还包 括: 置信度预测子网络, 所述检测子网络还 包括: 位置特 征获得层和多个分类特 征获得层;权 利 要 求 书 2/4 页 3 CN 114998908 A 3

.PDF文档 专利 样本图像标注、模型训练方法、装置、设备以及存储介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 样本图像标注、模型训练方法、装置、设备以及存储介质 第 1 页 专利 样本图像标注、模型训练方法、装置、设备以及存储介质 第 2 页 专利 样本图像标注、模型训练方法、装置、设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:50:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。