说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111640049.X (22)申请日 2021.12.2 9 (71)申请人 上海高德威智能交通系统有限公司 地址 201821 上海市嘉定区云谷路59 9弄6 号620室J 1452 (72)发明人 陈明健  (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 代理人 王剑 (51)Int.Cl. G06N 3/08(2006.01) G06K 9/62(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) (54)发明名称 主动学习方法、 装置、 电子设备及可读存储 介质 (57)摘要 本申请提供一种主动学习方法、 装置、 电子 设备及可读存储介质, 该主动学习方法包括: 对 于无标签样 本集中的任一样本, 利用预设增强方 法对该样本进行增强处理, 得到N个不同的增强 样本; 利用查询模型对该N个不同的增强样本进 行预测, 分别得到各增强样本中的目标实例的预 测结果; 对于该样本中的任一目标实例, 依据各 增强样本中该目标实例的预测结果, 确定该目标 实例的不确定度; 依据该目标 实例的不确定度确 定该目标 实例使用伪标签或需要人工标注。 该方 法可以降低标注人员的标注代 价, 提高标注人员 的标注效率, 降低数据集的标注成本 。 权利要求书3页 说明书10页 附图3页 CN 114298304 A 2022.04.08 CN 114298304 A 1.一种主动学习方法, 其特 征在于, 包括: 对于无标签样本集中的任一样本, 利用预设增强方法对该样本进行增强处理, 得到N个 不同的增强样本; 该N个不同的增强样本的语义信息一 致, N≥2; 利用查询模型对该N个不同的增强样本进行预测, 分别得到各增强样本中的目标实例 的预测结果; 对于该样本中的任一目标实例, 依据各增强样本中该目标实例的预测结果, 确定该目 标实例的不确定度; 依据该目标实例的不确定度确定该目标实例使用伪标签或需要人工标注。 2.根据权利要求1所述的方法, 其特征在于, 所述依据该目标实例的不确定度确定该目 标实例使用伪标签或需要人工标注, 包括: 若该目标实例的不确定度大于第一 不确定度阈值, 则确定该目标实例需要人工标注; 若该目标实例的不确定度小于或等于所述第 一不确定度阈值, 则确定该目标实例使用 伪标签。 3.根据权利要求1所述的方法, 其特 征在于, 所述 查询模型为目标检测模型; 所述对于该样本中的任一目标实例, 依据各增强样本中该目标实例的预测结果, 确定 该目标实例的不确定度, 包括: 选择该N个不同的增强样本中的任一增强样本中的任一检测框, 以该增强样本中的该 检测框为聚类中心, 依据其它增强样本中的检测框与该检测框的重叠情况, 进 行聚类, 得到 该聚类中心对应的聚类簇; 依据该聚类簇中各检测框, 确定该聚类中心对应的目标实例的不确定度。 4.根据权利要求3所述的方法, 其特征在于, 所述依据该目标实例的不确定度确定该目 标实例使用伪标签或需要人工标注, 还 包括: 依据该目标实例的不确定度, 确定该目标实例的类型; 其中, 目标实例的类型包括使用伪标签的第一类型、 需要部分标注的第 二类型, 以及需 要人工全标注的第三类型; 第一类型目标实例、 第二类型目标实例以及第三类型目标实例的不确定度依次升高。 5.根据权利要求4所述的方法, 其特征在于, 所述第 二类型目标实例通过人工标注方式 进行类别标注; 所述第二类型目标实例的类别损失用于对目标检测模型进行监 督训练。 6.根据权利要求1所述的方法, 其特 征在于, 所述 查询模型为分割模型; 所述对于该样本中的任一目标实例, 依据各增强样本中该目标实例的预测结果, 确定 该目标实例的不确定度, 包括: 以预设大小的像素块为目标实例, 对于该样本中的任一目标实例, 依据各增强样本中 相同位置的像素块的预测结果, 确定该目标实例的不确定度。 7.根据权利要求6所述的方法, 其特征在于, 所述对于该样本中的任一目标实例, 依据 各增强样本中相同位置的目标实例的预测结果, 确定该目标实例的不确定度, 包括: 对于该目标实例中的任一像素点, 依据各增强样本中相同位置的像素点的分类结果, 确定该像素点的不确定度; 依据该目标实例中各像素点的不确定度的平均值, 确定该目标实例的不确定度。权 利 要 求 书 1/3 页 2 CN 114298304 A 28.根据权利要求1所述的方法, 其特征在于, 对于使用伪标签的目标实例, 依据该目标 实例的不确定度确定该目标实例的损失用于对查询模型进行监督训练的权重; 其中, 该权 重与该目标实例的不确定度负相关。 9.一种主动学习装置, 其特 征在于, 包括: 增强处理单元, 用于对于无标签样本集中的任一样本, 利用预设增强方法对该样本进 行增强处 理, 得到N个不同的增强样本; 该N个不同的增强样本的语义信息一 致, N≥2; 预测单元, 用于利用查询模型对该N个不同的增强样本进行预测, 分别得到各增强样本 中的目标实例的预测结果; 第一确定单元, 用于对于该样本中的任一目标实例, 依据各增强样本中该目标实例的 预测结果, 确定该目标实例的不确定度; 第二确定单元, 用于依据该目标实例的不确定度确定该目标实例使用伪标签或需要人 工标注。 10.根据权利要求9所述的装置, 其特征在于, 所述第二确定单元依据该目标实例的不 确定度确定该目标实例使用伪标签或需要人工标注, 包括: 若该目标实例的不确定度大于第一 不确定度阈值, 则确定该目标实例需要人工标注; 若该目标实例的不确定度小于或等于所述第 一不确定度阈值, 则确定该目标实例使用 伪标签; 和/或, 所述查询模型为目标检测模型; 所述第一确定单元对于该样本 中的任一目标实例, 依据 各增强样本 中该目标实例的预 测结果, 确定该目标实例的不确定度, 包括: 选择该N个不同的增强样本中的任一增强样本中的任一检测框, 以该增强样本中的该 检测框为聚类中心, 依据其它增强样本中的检测框与该检测框的重叠情况, 进 行聚类, 得到 该聚类中心对应的聚类簇; 依据该聚类簇中各检测框, 确定该聚类中心对应的目标实例的不确定度; 其中, 所述第 二确定单元依据 该目标实例的不确定度确定该目标实例使用伪标签或需 要人工标注, 还 包括: 依据该目标实例的不确定度, 确定该目标实例的类型; 其中, 目标实例的类型包括使用伪标签的第一类型、 需要部分标注的第 二类型, 以及需 要人工全标注的第三类型; 第一类型目标实例、 第二类型目标实例以及第三类型目标实例的不确定度依次升高; 其中, 所述第二类型目标实例通过 人工标注方式进行类别标注; 所述第二类型目标实例的类别损失用于对目标检测模型进行监 督训练; 和/或, 所述查询模型为分割模型; 所述第一确定单元对于该样本 中的任一目标实例, 依据 各增强样本 中该目标实例的预 测结果, 确定该目标实例的不确定度, 包括: 以预设大小的像素块为目标实例, 对于该样本中的任一目标实例, 依据各增强样本中 相同位置的像素块的预测结果, 确定该目标实例的不确定度;权 利 要 求 书 2/3 页 3 CN 114298304 A 3

.PDF文档 专利 主动学习方法、装置、电子设备及可读存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 主动学习方法、装置、电子设备及可读存储介质 第 1 页 专利 主动学习方法、装置、电子设备及可读存储介质 第 2 页 专利 主动学习方法、装置、电子设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:43:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。