说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111456043.7 (22)申请日 2021.12.01 (71)申请人 上海高德威智能交通系统有限公司 地址 201821 上海市嘉定区云谷路59 9弄6 号2010室 (72)发明人 傅剑文  (74)专利代理 机构 北京博思佳知识产权代理有 限公司 1 1415 代理人 王茹 (51)Int.Cl. G06K 9/62(2022.01) G06V 10/774(2022.01) G06N 20/00(2019.01) (54)发明名称 主动学习方法、 装置、 电子设备及可读存储 介质 (57)摘要 本申请提供一种主动学习方法、 装置、 电子 设备及可读存储介质, 该目标检测方法包括: 在 样本集上进行无监督学习, 得到无监督特征提取 网络; 其中, 所述样本集包括无标签样本集, 所述 无标签样本集包括N1个无标签样本, N1为大于1 的正整数; 依据所述无监督特征提取网络, 确定 所述样本集中各样本的无监督特征; 依据所述样 本集中各样 本的无监督特征, 在所述样本集上进 行主动学习, 确定出需要标注的无标签样本。 该 方法可以实现同样标注量下, 训练得到比随机标 注集性能更为优异的模型。 权利要求书5页 说明书13页 附图3页 CN 114298154 A 2022.04.08 CN 114298154 A 1.一种主动学习方法, 其特 征在于, 包括: 在样本集上进行无监督学习, 得到无监督特征提取网络; 其中, 所述样本集包括无标签 样本集, 所述无 标签样本集包括 N1个无标签样本, N1为大于1的正整数; 依据所述无监 督特征提取网络, 确定所述样本集中各样本的无监 督特征; 依据所述样本集中各样本的无监督特征, 在所述样本集上进行主动学习, 确定出需要 标注的无 标签样本 。 2.根据权利要求1所述的方法, 其特征在于, 所述依据所述样本集中各样本的无监督特 征, 在所述样本集上进行主动学习, 确定出需要标注的无 标签样本, 包括: 依据所述样本集中各样本的无监督特征, 确定所述样本集中有标签样本与 无标签样本 之间的距离; 依据所述有标签样本与无 标签样本的之间的距离, 确定出需要标注的无 标签样本 。 3.根据权利要求2所述的方法, 其特征在于, 当所述样本集中包括的样本均为无标签样 本时, 所述依据所述样本集中各样本的无监督特征, 确定所述样本集中有标签样本与无标 签样本的之间的距离之前, 还 包括: 随机选择一个所述无标签样本作为所述样本集中的第 一个有标签样本, 并将该有标签 样本从所述无 标签样本集中移入有标签样本集; 所述依据所述有标签样本与无标签样本的之间的距离, 确定出需要标注的无标签样 本, 包括: 依据所述有标签样本集中各有标签样本与所述无标签样本集中各无标签样本之间的 距离, 确定出需要标注的无标签样本, 并将所确定的需要标注的无标签样本作为有标签样 本从所述无 标签样本集中移入所述有标签样本集。 4.根据权利要求3所述的方法, 其特征在于, 所述依据所述有标签样本集中各有标签样 本与所述无 标签样本集中各 无标签样本之间的距离, 确定出需要标注的无 标签样本, 包括: 对于所述无标签样本集中的任一无标签样本, 依据 该无标签样本与 所述有标签样本集 中各有标签样本之间的距离, 确定该无标签样 本与有标签样本的最小距离; 其中, 该无标签 样本与有标签样本的最小距离为该 无标签样本与各有标签样本之间的距离中的最小值; 依据所述无标签样本集中各无标签样本与有标签样本的最小距离, 确定出各无标签样 本与有标签样本的最小距离中的最大值, 并将该最大值对应的无标签样本确定为需要标注 的无标签样本 。 5.根据权利要求2所述的方法, 其特征在于, 所述样本集还包括有标签样本集, 所述有 标签样本集包括 N2个有标签样本, N2为大于1的正整数; 所述依据 所述样本集中各样本的无监督特征, 确定所述样本集中有标签样本与无标签 样本之间的距离之前, 还 包括: 依据所述样本集中的有标签样本对 任务模型进行训练, 得到有监 督任务模型; 依据所述有监 督任务模型, 确定所述样本集中各样本的有监 督先验特 征; 所述依据 所述样本集中各样本的无监督特征, 确定所述样本集中有标签样本与无标签 样本之间的距离, 包括: 依据所述样本集中各样本的无监督特征以及有监督先验特征, 确定所述样本集中有标 签样本与无 标签样本之间的距离 。权 利 要 求 书 1/5 页 2 CN 114298154 A 26.根据权利要求5所述的方法, 其特 征在于, 所述任务模型为图像分类任务模型; 所述依据 所述样本集中各样本的无监督特征以及有监督先验特征, 确定所述样本集中 有标签样本与无 标签样本之间的距离, 包括: 对于任一样本, 将该样本的无监 督特征与有监 督先验特 征进行拼接, 得到拼接特 征; 依据各样本的拼接特 征, 确定所述样本集中有标签样本与无 标签样本之间的距离 。 7.根据权利要求5所述的方法, 其特 征在于, 所述任务模型为目标检测任务模型; 所述依据所述有监 督任务模型, 确定所述样本集中各样本的有监 督先验特 征, 包括: 依据所述有监 督任务模型, 确定所述样本集中各 无标签样本中的各目标的置信度; 依据所述样本集中各无标签样本 中的各目标的置信度, 确定各无标签样本的第 一不确 定度分数; 所述依据 所述样本集中各样本的无监督特征以及有监督先验特征, 确定所述样本集中 有标签样本与无 标签样本之间的距离, 包括: 对于任一有标签样本和任一无标签样本, 确定该有标签样本的无监督特征与 该无标签 样本的无监 督特征之间的第一距离; 依据该无标签样本的第一不确定度分数, 以及所述第一距离, 确定该有标签样本与该 无标签样本之间的距离 。 8.根据权利要求7所述的方法, 其特征在于, 所述确定该有标签样本的无监督特征与 该 无标签样本的无监 督特征之间的第一距离之前, 还 包括: 依据所述有监 督任务模型, 确定所述样本集中各样本中的各目标的位置信息; 对于任一样本, 依据该样本中各目标的位置信息, 将该样本的无监督特征转化为感兴 趣区域的分布特 征; 所述确定该有标签样本的无监督特征与 该无标签样本的无监督特征之间的第 一距离, 包括: 确定该有标签样本的感兴趣区域的分布特征与该无标签样本的感兴趣区域的分布特 征之间的第一距离 。 9.根据权利要求5所述的方法, 其特 征在于, 所述任务模型为语义分割任务模型; 所述依据所述有监 督任务模型, 确定所述样本集中各样本的有监 督先验特 征, 包括: 对于任一样本, 依据 所述有监督任务模型对该样本进行T次前向预测, 得到该样本各像 素点的类别预测概 率; 其中, T≥2; 依据该样本各像素点的类别预测, 确定该样本的第二 不确定度分数; 所述依据 所述样本集中各样本的无监督特征以及有监督先验特征, 确定所述样本集中 有标签样本与无 标签样本之间的距离, 包括: 对于任一有标签样本和任一无标签样本, 确定该有标签样本的无监督特征与 该无标签 样本的无监 督特征之间的第二距离; 依据该无标签样本的第二不确定度分数, 以及所述第二距离, 确定该有标签样本与该 无标签样本之间的距离 。 10.一种主动学习装置, 其特 征在于, 包括: 第一学习单元, 用于在样本集上进行无监督学习, 得到无监督特征提取网络; 其中, 所 述样本集包括无标签样本集, 所述无标签样本集包括N1个无标签样本, N1为大于1的正整权 利 要 求 书 2/5 页 3 CN 114298154 A 3

.PDF文档 专利 主动学习方法、装置、电子设备及可读存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 主动学习方法、装置、电子设备及可读存储介质 第 1 页 专利 主动学习方法、装置、电子设备及可读存储介质 第 2 页 专利 主动学习方法、装置、电子设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:20:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。