说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111646817.2 (22)申请日 2021.12.2 9 (66)本国优先权数据 202110042956.8 2021.01.13 CN (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 彭瑾龙 蒋正锴 罗泽坤 王昌安  李剑 王亚彪 汪铖杰 李季檩  黄飞跃  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 毛丹 (51)Int.Cl. G06V 10/764(2022.01)G06V 10/25(2022.01) G06V 10/82(2022.01) G06V 10/778(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 对象定位模型处理、 对象定位方法、 装置及 计算机设备 (57)摘要 本申请涉及一种对象定位模 型处理方法、 装 置、 计算机设备和存储介质, 以及一种对象定位 方法、 装置、 计算机设备和存储介质。 该对象定位 模型处理方法包括: 基于训练样 本图像的图像特 征及对象定位模 型的回归网络确定回归区域; 基 于训练样本图像对应的目标对象标注区域计算 回归准确度, 基于回归准确度计算回归损失; 基 于训练样本图像的图像特征及对象定位模型的 分类网络确定分类置信度, 基于分类置信度计算 分类损失; 基于回归准确度更新分类损失, 并基 于分类置信度更新回归损失; 根据更新后的分类 损失和更新后的回归损失训练对象定位模型, 得 到训练后的对象定位模型; 训练后的对象定位模 型用于对输入图像进行对象定位。 采用本方法能 够提高定位 准确性。 权利要求书5页 说明书22页 附图10页 CN 114764870 A 2022.07.19 CN 114764870 A 1.一种对象定位模型处 理方法, 其特 征在于, 所述方法包括: 获取包括目标对象的训练样本图像; 基于所述训练样本图像的图像特征及对象定位模型的回归网络确定所述训练样本图 像对应的回归区域; 基于训练样本图像对应的目标对象标注区域计算所述 回归区域的回归准确度, 基于所 述回归准确度计算回归损失; 基于所述训练样本图像的图像特征及所述对象定位模型的分类网络确定所述回归区 域的分类置信度, 基于所述分类置信度计算分类损失; 基于所述回归准确度更新所述分类损失, 并基于所述分类置信度更新所述回归损失; 根据更新后的分类损失和更新后的回归损失训练所述对象定位模型, 直至满足训练停 止条件时, 得到训练后的对象定位模型; 其中, 所述训练后的对象定位模型用于对输入图像进行对象定位。 2.根据权利要求1所述的方法, 其特征在于, 在所述根据 更新后的分类损失和更新后的 回归损失训练所述对象定位模型之前, 所述方法还 包括: 基于所述对象定位模型的回归准确度预测网络确定所述回归区域的回归准确度预测 值; 基于所述回归区域的回归准确度预测值及所述回归区域的回归准确度确定回归准确 度损失; 所述根据更新后的分类损失和更新后的回归损失训练所述对象定位模型包括: 根据所述 回归准确度损失、 更新后的分类损失和更新后的回归损失训练所述对象定位 模型。 3.根据权利要求2所述的方法, 其特征在于, 所述目标对象为待识别对象; 所述获取包 含目标对象的训练样本图像包括: 获取包括目标对象的训练样本图像及所述训练样本图像对应的训练参考图像; 所述训 练参考图像与所述训练样本图像包括相同的目标对象; 所述基于所述训练样本图像的图像特征及对象定位模型的回归网络确定所述训练样 本图像对应的回归区域包括: 基于所述训练样本图像的图像特征及所述训练参考图像的图像特征确定所述训练样 本图像与所述训练参 考图像之间的第一互相关训练特 征; 将所述第一互相关训练特征输入所述 回归网络, 以确定所述训练样本图像对应的回归 区域; 所述基于所述对象定位模型的回归准确度预测网络确定所述回归区域的回归准确度 预测值包括: 将所述第一互相关训练特征输入所述 回归准确度 预测网络, 以确定所述 回归区域的回 归准确度预测值; 所述基于所述训练样本图像的图像特征及所述对象定位模型的分类网络确定所述回 归区域的分类置信度包括: 基于所述训练样本图像的图像特征及所述训练参考图像的图像特征确定所述训练样 本图像与所述训练参 考图像之间的第二互相关训练特 征;权 利 要 求 书 1/5 页 2 CN 114764870 A 2将所述第二互相关训练特 征输入所述分类网络, 以确定所述回归区域的分类置信度; 所述第一互相关训练特征、 所述第 二互相关训练特征用于表征所述训练样本图像与 所 述训练参 考图像之间的相似程度。 4.根据权利要求3所述的方法, 其特征在于, 在所述基于所述训练样本图像的图像特征 及所述训练参考图像的图像特征确定所述训练样本图像与所述训练参考图像之间的第一 互相关训练特 征之前, 所述方法还 包括: 基于所述对象定位模型获取所述训练样本图像的图像特征及所述训练参考图像的图 像特征; 所述基于所述训练样本图像的图像特征及所述训练参考图像的图像特征确定所述训 练样本图像与所述训练参 考图像之间的第一互相关训练特 征包括: 基于所述对象定位模型分别对所述训练样本图像的图像特征和所述训练参考图像的 图像特征进行卷积操作, 得到所述训练样本图像的第一训练中间特征和所述训练参考图像 的第一参考中间特 征; 基于所述对象定位模型对所述第一训练中间特征和第一参考中间特征进行互相关操 作, 得到所述训练样本图像与所述训练参 考图像之间的第一互相关训练特 征。 5.根据权利要求4所述的方法, 其特征在于, 所述对象定位模型包括模型结构相同、 且 共享模型参数的两个特征提取网络; 所述基于所述对象定位模型获取所述训练样本图像的 图像特征及所述训练参 考图像的图像特 征包括: 将所述训练样本图像与所述训练参 考图像分别输入所述两个特 征提取网络; 通过所述两个特征提取网络, 并行且分别 输出所述训练样本图像的图像特征和所述训 练参考图像的图像特 征。 6.根据权利要求1所述的方法, 其特征在于, 所述基于训练样本图像对应的目标对象标 注区域计算所述回归区域的回归准确度包括: 获取所述目标对象标注区域与所述回归区域之间的交集区域; 获取所述目标对象标注区域与所述回归区域之间的并集区域; 根据所述回归区域对应的交集区域与所述并集区域的面积比值确定所述回归准确度。 7.根据权利要求1所述的方法, 其特征在于, 所述基于所述分类置信度计算分类损失包 括: 获取所述目标对象标注区域与所述回归区域之间的交集区域; 获取所述目标对象标注区域与所述回归区域之间的并集区域; 获取所述回归区域对应的交集区域与并集区域的面积比值; 当所述面积比值大于第 一预设阈值 时, 根据所述训练样本图像对应的正样本标签及所 述分类置信度确定分类损失; 当所述面积比值小于第 二预设阈值 时, 根据所述训练样本图像对应的负样本标签及所 述分类置信度确定分类损失。 8.根据权利要求2所述的方法, 其特征在于, 所述目标对象为待识别对象; 所述方法还 包括: 获取待识别视频; 在所述待识别视频中确定包括所述待识别对象的首帧视频帧, 得到待识别参 考图像;权 利 要 求 书 2/5 页 3 CN 114764870 A 3

.PDF文档 专利 对象定位模型处理、对象定位方法、装置及计算机设备

文档预览
中文文档 38 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共38页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对象定位模型处理、对象定位方法、装置及计算机设备 第 1 页 专利 对象定位模型处理、对象定位方法、装置及计算机设备 第 2 页 专利 对象定位模型处理、对象定位方法、装置及计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:44:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。