专利深度学习模型的训练方法、目标对象检测方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210611399.1 (22)申请日 2022.05.30 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人陈子亮　 (74)专利代理机构中科专利商标代理有限责任公司 11021 专利代理师吴晓兵 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称深度学习模型的训练方法、目标对象检测方法和装置 (57)摘要本公开提供了一种深度学习模型的训练方法和装置、一种目标对象检测方法和装置、电子设备、存储介质和计算机程序产品，涉及人工智能领域，尤其涉及深度学习、图像处理和计算机视觉技术领域，可用于物体检测和物体识别等场景。具体实现方案为：根据样本图像，确定样本图像中目标对象的样本类别和样本边框；样本图像包括目标对象的标签；根据样本类别、样本边框和标签，确定分类损失值和第一回归损失值；利用调整因子修正第一回归损失值，得到第二回归损失值，调整因子指示了样本图像的回归难易程度；以及根据分类损失值和第二回归损失值来调整深度学习模型的参数。权利要求书3页说明书11页附图5页 CN 114882321 A 2022.08.09 CN 114882321 A 1.一种深度学习模型的训练方法，包括：根据样本图像，确定所述样本图像中目标对象的样本类别和样本边框；所述样本图像包括所述目标对象的标签；根据所述样本类别、所述样本边框和所述标签，确定分类损失值和第一回归损失值；利用调整因子修正所述第一回归损失值，得到第二回归损失值，所述调整因子指示了所述样本图像的回归难易程度；以及根据所述分类损失值和所述第二回归损失值来调整所述深度学习模型的参数。 2.根据权利要求1所述的方法，其中，所述标签包括类别标签和位置标签；所述方法还包括：根据所述样本边框和所述位置标签，确定所述调整因子。 3.根据权利要求2所述的方法，其中，所述根据所述样本边框和所述位置标签，确定所述调整因子包括：计算所述样本边框与所述位置标签的交并比；以及根据所述交并比，确定所述调整因子。 4.根据权利要求3所述的方法，其中，所述调整因子与所述交并比呈负相关关系。 5.根据权利要求2所述的方法，其中，所述根据所述样本类别、所述样本边框和所述标签，确定分类损失值和第一回归损失值包括：根据所述样本类别和所述类别标签，确定所述分类损失值；以及根据所述样本边框和所述位置标签，确定所述第一回归损失值。 6.根据权利要求5所述的方法，其中，所述根据所述样本类别和所述类别标签，确定所述分类损失值包括：根据所述样本类别和所述类别标签基于Focal loss损失函数来确定所述分类损失值。 7.根据权利要求1所述的方法，其中，所述根据样本图像，确定所述样本图像中目标对象的样本类别和样本边框包括：对所述样本图像执行特征提取操作，得到多个多尺度特征图；对所述多个多尺度特征图进行多尺度融合处理，得到多个多尺度融合特征图；以及根据所述多个多尺度融合特征图，确定所述样本图像中目标对象的样本类别和样本边框。 8.根据权利要求1所述的方法，其中，所述深度学习模型包括特征提取模块、特征融合模块和目标检测模块；所述根据所述分类损失值和所述第二回归损失值来调整所述深度学习模型的参数包括：根据所述分类损失值和所述第二回归损失值，确定联合损失值；以及根据所述联合损失值来调整特征提取模块、特征融合模块和目标检测模块的参数。 9.一种目标对象检测方法，包括：将待检测图像输入深度学习模型，得到所述待检测图像中目标对象的类别信息和定位信息，其中，所述深度学习模型是利用权利要求1～8中任一项所述的方法训练得到的。 10.一种深度学习模型的训练装置，包括：第一确定模块，用于根据样本图像，确定所述样本图像中目标对象的样本类别和样本权　利　要　求　书 1/3 页 2 CN 114882321 A 2边框；所述样本图像包括所述目标对象的标签；计算模块，用于根据所述样本类别、所述样本边框和所述标签，确定分类损失值和第一回归损失值；修正模块，用于利用调整因子修正所述第一回归损失值，得到第二回归损失值，所述调整因子指示了所述样本图像的回归难易程度；以及调整模块，用于根据所述分类损失值和所述第二回归损失值来调整所述深度学习模型的参数。 11.根据权利要求10所述的装置，其中，所述标签包括类别标签和位置标签；所述装置还包括：第二确定模块，用于根据所述样本边框和所述位置标签，确定所述调整因子。 12.根据权利要求1 1所述的装置，其中，所述第二确定模块包括：第一计算单元，用于计算所述样本边框与所述位置标签的交并比；以及确定单元，用于根据所述交并比，确定所述调整因子。 13.根据权利要求12所述的装置，其中，所述调整因子与所述交并比呈负相关关系。 14.根据权利要求1 1所述的装置，其中，所述计算模块包括：第二计算单元，用于根据所述样本类别和所述类别标签，确定所述分类损失值；以及第三计算单元，用于根据所述样本边框和所述位置标签，确定所述第一回归损失值。 15.根据权利要求14所述的装置，其中，所述第二计算单元包括：计算子单元，用于根据所述样本类别和所述类别标签基于Focal loss损失函数来确定所述分类损失值。 16.根据权利要求10所述的装置，其中，所述第一确定模块包括：特征提取单元，用于对所述样本图像执行特征提取操作，得到多个多尺度特征图；融合单元，用于对所述多个多尺度特征图进行多尺度融合处理，得到多个多尺度融合特征图；以及检测单元，用于根据所述多个多尺度融合特征图，确定所述样本图像中目标对象的样本类别和样本边框。 17.根据权利要求10所述的装置，其中，所述深度学习模型包括特征提取模块、特征融合模块和目标检测模块；所述调整模块包括：第四计算单元，用于根据所述分类损失值和所述第二回归损失值，确定联合损失值；以及调整单元，用于根据所述联合损失值来调整特征提取模块、特征融合模块和目标检测模块的参数。 18.一种目标对象检测装置，包括：检测模块，用于将待检测图像输入深度学习模型，得到所述待检测图像中目标对象的类别信息和定位信息，其中，所述深度学习模型是利用权利要求10～17中任一项所述的装置训练得到的。 19.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，权　利　要　求　书 2/3 页 3 CN 114882321 A 3

专利 深度学习模型的训练方法、目标对象检测方法和装置

专利深度学习模型的训练方法、目标对象检测方法和装置