说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210611399.1 (22)申请日 2022.05.30 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 陈子亮  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 吴晓兵 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 深度学习模 型的训练方法、 目标对象检测方 法和装置 (57)摘要 本公开提供了一种深度学习模型的训练方 法和装置、 一种目标对象检测方法和装置、 电子 设备、 存储介质和计算机程序产品, 涉及人工智 能领域, 尤其涉及深度学习、 图像处理和计算机 视觉技术领域, 可用于物体检测和物体识别等场 景。 具体实现方案为: 根据 样本图像, 确定样本图 像中目标对象的样本类别和样 本边框; 样本图像 包括目标对象的标签; 根据样本类别、 样本边框 和标签, 确定分类损失值和第一回归损失值; 利 用调整因子修正第一回归损失值, 得到第二回归 损失值, 调整因子指示了样本图像的回归难易程 度; 以及根据分类损失值和第二回归损失值来调 整深度学习模型的参数。 权利要求书3页 说明书11页 附图5页 CN 114882321 A 2022.08.09 CN 114882321 A 1.一种深度学习模型的训练方法, 包括: 根据样本 图像, 确定所述样本 图像中目标对象的样本类别和样本边框; 所述样本 图像 包括所述目标对象的标签; 根据所述样本类别、 所述样本边框和所述标签, 确定分类损失值和第一回归损失值; 利用调整因子修正所述第一回归损 失值, 得到第二回归损 失值, 所述调整因子指示了 所述样本图像的回归 难易程度; 以及 根据所述分类损失值和所述第二回归损失值 来调整所述深度学习模型的参数。 2.根据权利要求1所述的方法, 其中, 所述标签包括类别标签和位置标签; 所述方法还 包括: 根据所述样本边框和所述 位置标签, 确定所述调整因子 。 3.根据权利要求2所述的方法, 其中, 所述根据所述样本边框和所述位置标签, 确定所 述调整因子包括: 计算所述样本边框与所述 位置标签的交并比; 以及 根据所述交并比, 确定所述调整因子 。 4.根据权利要求3所述的方法, 其中, 所述调整因子与所述交并比呈负相关 关系。 5.根据权利要求2所述的方法, 其中, 所述根据所述样本类别、 所述样本边框和所述标 签, 确定分类损失值和第一回归损失值包括: 根据所述样本类别和所述类别标签, 确定所述分类损失值; 以及 根据所述样本边框和所述 位置标签, 确定所述第一回归损失值。 6.根据权利要求5所述的方法, 其中, 所述根据所述样本类别和所述类别标签, 确定所 述分类损失值包括: 根据所述样本类别和所述类别标签 基于Focal  loss损失函数来确定所述分类损失值。 7.根据权利要求1所述的方法, 其中, 所述根据样本 图像, 确定所述样本 图像中目标对 象的样本类别和样本边框包括: 对所述样本图像执 行特征提取操作, 得到多个多尺度特 征图; 对所述多个多尺度特 征图进行多尺度融合处 理, 得到多个多尺度融合特 征图; 以及 根据所述多个多尺度融合特征图, 确定所述样本图像中目标对象的样本类别和样本边 框。 8.根据权利要求1所述的方法, 其中, 所述深度学习模型包括特征提取模块、 特征融合 模块和目标检测模块; 所述根据所述分类损失值和所述第二回归损失值来调整所述深度学 习模型的参数包括: 根据所述分类损失值和所述第二回归损失值, 确定联合损失值; 以及 根据所述联合损失值 来调整特 征提取模块、 特 征融合模块和目标检测模块的参数。 9.一种目标对象检测方法, 包括: 将待检测图像输入深度 学习模型, 得到所述待检测图像中目标对象的类别信 息和定位 信息, 其中, 所述深度学习模型 是利用权利要求1~8中任一项所述的方法训练得到的。 10.一种深度学习模型的训练装置, 包括: 第一确定模块, 用于根据样本 图像, 确定所述样本 图像中目标对象的样本类别和样本权 利 要 求 书 1/3 页 2 CN 114882321 A 2边框; 所述样本图像包括所述目标对象的标签; 计算模块, 用于根据 所述样本类别、 所述样本边框和所述标签, 确定分类损失值和第一 回归损失值; 修正模块, 用于利用调整因子修正所述第一 回归损失值, 得到第二 回归损失值, 所述调 整因子指示了所述样本图像的回归 难易程度; 以及 调整模块, 用于根据 所述分类损失值和所述第 二回归损失值来调整所述深度 学习模型 的参数。 11.根据权利要求10所述的装置, 其中, 所述标签包括类别标签和位置标签; 所述装置 还包括: 第二确定模块, 用于根据所述样本边框和所述 位置标签, 确定所述调整因子 。 12.根据权利要求1 1所述的装置, 其中, 所述第二确定模块包括: 第一计算单 元, 用于计算所述样本边框与所述 位置标签的交并比; 以及 确定单元, 用于根据所述交并比, 确定所述调整因子 。 13.根据权利要求12所述的装置, 其中, 所述调整因子与所述交并比呈负相关 关系。 14.根据权利要求1 1所述的装置, 其中, 所述计算模块包括: 第二计算单 元, 用于根据所述样本类别和所述类别标签, 确定所述分类损失值; 以及 第三计算单 元, 用于根据所述样本边框和所述 位置标签, 确定所述第一回归损失值。 15.根据权利要求14所述的装置, 其中, 所述第二计算单 元包括: 计算子单元, 用于根据所述样本类别和所述类别标签基于Focal  loss损失函数来确定 所述分类损失值。 16.根据权利要求10所述的装置, 其中, 所述第一确定模块包括: 特征提取单元, 用于对所述样本图像执 行特征提取操作, 得到多个多尺度特 征图; 融合单元, 用于对所述多个多尺度特征图进行多尺度融合处理, 得到多个多尺度融合 特征图; 以及 检测单元, 用于根据所述多个多尺度融合特征图, 确定所述样本 图像中目标对象的样 本类别和样本边框 。 17.根据权利要求10所述的装置, 其中, 所述深度学习模型包括特征提取模块、 特征融 合模块和目标检测模块; 所述调整模块包括: 第四计算单元, 用于根据 所述分类损失值和所述第 二回归损失值, 确定联合损失值; 以 及 调整单元, 用于根据所述联合损 失值来调整特征提取模块、 特征融合模块和目标检测 模块的参数。 18.一种目标对象检测装置, 包括: 检测模块, 用于将待检测图像输入深度学习模型, 得到所述待检测图像中目标对象的 类别信息和定位信息, 其中, 所述深度学习模型 是利用权利要求10~17中任一项所述的装置训练得到的。 19.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中,权 利 要 求 书 2/3 页 3 CN 114882321 A 3

.PDF文档 专利 深度学习模型的训练方法、目标对象检测方法和装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 深度学习模型的训练方法、目标对象检测方法和装置 第 1 页 专利 深度学习模型的训练方法、目标对象检测方法和装置 第 2 页 专利 深度学习模型的训练方法、目标对象检测方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:50:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。