说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210940102.6 (22)申请日 2022.08.05 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 李超 薛松 辛颖 王云浩 张滨  冯原 韩树民  (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 专利代理师 王姗姗 武晨燕 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/26(2022.01) G06V 10/80(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种数据标注方法、 装置、 电子设备及存储 介质 (57)摘要 本公开提供了一种数据标注方法、 装置、 电 子设备及存储介质, 涉及人工智 能技术领域, 尤 其涉及深度学习、 图像处理、 计算机视觉等技术 领域, 可应用于物体检测等场景。 具体实现方案 为: 根据第一标注信息确定第一标注框; 根据所 述第一标注框对第一图像进行抠图处理, 得到构 成所述第一图像中第一对象 的第一零部件实例; 通过对所述第一标注框与用于对第二图像中目 标对象进行语义分割的第二标注框之间执行叠 加操作, 将所述第一零部件实例与所述目标对象 的目标零部件进行图像融合, 得到第一图像融合 结果; 根据所述第一图像融合结果获取第一数据 标注结果。 采用本公开, 可 以实现自动的数据标 注, 降低了数据标注的成本, 提高了数据标注效 率。 权利要求书3页 说明书13页 附图6页 CN 115375987 A 2022.11.22 CN 115375987 A 1.一种数据标注方法, 包括: 根据第一标注信息确定第一标注框; 根据所述第 一标注框对第 一图像进行抠图处理, 得到构 成所述第 一图像中第 一对象的 第一零部件实例; 通过对所述第一标注框与用于对第二图像中目标对象进行语义分割的第二标注框之 间执行叠加操作, 将所述第一零部件实例与所述 目标对象的目标零部件进行图像融合, 得 到第一图像融合结果; 根据所述第一图像融合结果获取第一数据标注结果。 2.根据权利要求1所述的方法, 所述根据所述第 一标注框对第 一图像进行抠图处理, 得 到构成所述第一图像中第一对象的第一 零部件实例, 包括: 根据预设条件调整所述第一标注框, 得到第三标注框; 根据所述第三标注框进行 所述抠图处理, 得到所述第一 零部件实例; 其中, 所述预设条件包括: 改变所述第一标注框的大小、 改变所述第一标注框的位置、 改变所述第一标注框的旋转角度中的至少一种条件。 3.根据权利要求1所述的方法, 还 包括: 对所述第一标注框与所述第二标注框进行 所述叠加操作, 得到第四标注框; 其中, 所述第四标注框中包括不同类别零部件, 根据所述第 四标注框中的各类零部件 在所述第二图像中的面积占比, 确定用于在模型训练中进行损失函数补偿的分类权 重。 4.根据权利要求1所述的方法, 其中, 所述目标零部件包括: 与所述零部件实例对应的 零部件、 与所述对应的零部件相关联的零部件中的至少一种零部件。 5.一种模型训练方法, 包括: 将数据标注结果作为训练数据, 输入所述训练数据到初始的检测模型中; 其中, 所述数 据标注结果 根据权利要求1至 权利要求 4中的任一项数据标注方法得到; 根据所述数据标注结果, 以有监督学习的方式对所述初始 的检测模型进行训练, 得到 用于反映预测值与真实值之间差异的第一损失函数; 根据所述第一损失函数的反向传播更新模型参数, 得到训练后的目标检测模型。 6.一种模型训练方法, 包括: 将数据标注结果作为训练数据, 输入所述训练数据到初始的检测模型中; 其中, 所述数 据标注结果 根据权利要求1至 权利要求 4中的任一项数据标注方法得到; 根据所述数据标注结果, 以有监督学习的方式对所述初始 的检测模型进行训练, 得到 用于反映预测值与真实值之间差异的第一损失函数; 对所述第一损失函数进行补偿, 得到第二损失函数; 根据所述第二损失函数的反向传播更新模型参数, 得到训练后的目标检测模型。 7.根据权利要求6所述的方法, 其中, 所述对所述第一损 失函数进行补偿, 得到第二损 失函数, 包括: 所述训练数据包括用于在模型训练中进行损失函数补偿的分类权重的情况下, 根据 所 述分类权 重对所述第一损失函数进行补偿, 得到所述第二损失函数。 8.一种数据标注装置, 包括: 标注框确定模块, 用于根据第一标注信息确定第一标注框;权 利 要 求 书 1/3 页 2 CN 115375987 A 2抠图模块, 用于根据所述第一标注框对第一图像进行抠图处理, 得到构成所述第一图 像中第一对象的第一 零部件实例; 融合标注模块, 用于通过对所述第 一标注框与用于对第 二图像中目标对象进行语义分 割的第二标注框之 间执行叠加操作, 将所述第一零部件实例与所述目标对象的目标零部件 进行图像融合, 得到第一图像融合结果; 标注获取模块, 用于根据所述第一图像融合结果获取第一数据标注结果。 9.根据权利要求8所述的装置, 其中, 所述 抠图模块, 用于: 根据预设条件调整所述第一标注框, 得到第三标注框; 根据所述第三标注框进行 所述抠图处理, 得到所述第一 零部件实例; 其中, 所述预设条件包括: 改变所述第一标注框的大小、 改变所述第一标注框的位置、 改变所述第一标注框的旋转角度中的至少一种条件。 10.根据权利要求8所述的装置, 还 包括权重确定模块, 用于: 对所述第一标注框与所述第二标注框进行 所述叠加操作, 得到第四标注框; 其中, 所述第四标注框中包括不同类别零部件, 根据所述第 四标注框中的各类零部件 在所述第二图像中的面积占比, 确定用于在模型训练中进行损失函数补偿的分类权 重。 11.根据权利要求8所述的装置, 其中, 所述目标零部件包括: 与 所述零部件实例对应的 零部件、 与所述对应的零部件相关联的零部件中的至少一种零部件。 12.一种模型训练装置, 包括: 第一输入模块, 用于将数据标注结果作为训练数据, 输入所述训练数据到初始 的检测 模型中; 其中, 所述数据标注结果根据权利要求1至权利要求4中的任一项数据标注方法得 到; 第一训练模块, 用于根据所述数据标注结果, 以有监督学习的方式对所述初始 的检测 模型进行训练, 得到用于反 映预测值与真实值之间差异的第一损失函数; 根据所述第一损 失函数的反向传播更新模型参数, 得到训练后的目标检测模型。 13.一种模型训练装置, 包括: 第二输入模块, 用于将数据标注结果作为训练数据, 输入所述训练数据到初始 的检测 模型中; 其中, 所述数据标注结果根据权利要求1至权利要求4中的任一项数据标注方法得 到; 第二训练模块, 用于根据所述数据标注结果, 以有监督学习的方式对所述初始 的检测 模型进行训练, 得到用于反 映预测值与真实值之间差异的第一损失函数; 对所述第一损失 函数进行补偿, 得到第二损失函数; 根据所述第二损失函数的反向传播更新模型参数, 得到 训练后的目标检测模型。 14.根据权利要求13所述的模型训练装置, 其中, 所述第二训练模块, 用于: 所述训练数据包括用于在模型训练中进行损失函数补偿的分类权重的情况下, 根据 所 述分类权 重对所述第一损失函数进行补偿, 得到所述第二损失函数。 15.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处权 利 要 求 书 2/3 页 3 CN 115375987 A 3

.PDF文档 专利 一种数据标注方法、装置、电子设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据标注方法、装置、电子设备及存储介质 第 1 页 专利 一种数据标注方法、装置、电子设备及存储介质 第 2 页 专利 一种数据标注方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:12:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。