专利模型的训练方法、目标检测方法、装置、电子设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111642695.X (22)申请日 2021.12.2 9 (71)申请人亚信科技（中国）有限公司地址 100193 北京市海淀区西北旺东路10 号院东区19号楼1层101 (72)发明人何振军　蒋乐　李国明　刘洋　刘敏　宋勇　欧阳晔　 (74)专利代理机构北京市立方律师事务所 11330 专利代理师张筱宁 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) G06V 10/44(2022.01)G06V 10/774(2022.01) G06V 10/82(2022.01) (54)发明名称模型的训练方法、目标检测方法、装置、电子设备及介质 (57)摘要本申请实施例提供了一种模型的训练方法、目标检测方法、装置、电子设备及介质，涉及计算机领域。该模型的训练方法包括：从预设的神经网络中筛选出符合预设的性能效率条件的神经卷积网络，对筛选出的神经卷积网络进行参数重构，得到包含跳跃连接结构的残差网络，对残差网络进行训练，将训练后的残差网络重构成等效的视觉几何组VGG网络，以便基于视觉几何组VGG 网络构建所述主干网络。该目标检测方法包括：获取待处理图像，利用由如上所述的模型的训练方法生成的目标检测模型对所述待处理图像进行目标检测，得到目标信息。本申请实施例用于解决现有边缘设备在运行目标检测算法的过程中存在运行速度慢和资源消耗大的问题。权利要求书2页说明书14页附图7页 CN 114626503 A 2022.06.14 CN 114626503 A 1.一种模型的训练方法，其特征在于，模型包括主干网络；所述主干网络的训练步骤，包括：从预设的神经网络中筛选出符合预设的性能效率条件的神经卷积网络；对筛选出的神经卷积网络进行参数重构，得到包含跳跃连接结构的残差网络；对所述残差网络进行训练；将训练后的残差网络重构成等效的视觉几何组VGG网络，以便基于所述视觉几何组VGG 网络构建所述主干网络。 2.根据权利要求1所述的模型的训练方法，其特征在于，所述将训练后的残差网络重构成等效的视觉几何组VGG网络，包括：对训练后的残差网络中的卷积层和BN层进行合并；基于合并后的残差网络中的第一卷积结构，对合并后的残差网络中的第二卷积结构和直连结构进行填充；将所述第一卷积结构、填充后的第二卷积结构及填充后的直连结构进行组合，获得等效的视觉几何组VGG网络。 3.根据权利要求1所述的模型的训练方法，其特征在于，模块还包括与所述主干网络连接的金字塔注意力网络；其中，所述主干网络包括级联排序的多个第一特征层；所述金字塔注意力网络包括上采样单元和下采样单元；所述上采样单元包括级联排序布设的多个第二特征层；所述下采样单元包括级联排序布设的多个第三特征层；所述第一特征层与所述第二特征层之间至少一层具有横向连接结构；所述第二特征层与所述第三特征层之间至少一层具有横向连接结构；所述金字塔注意力网络的训练步骤，包括：将所述第一特征层所提取到的特征信息传输到相应的第二特征层，以进行特征融合，使得更新所述第二特征层对应的特征信息；将所述第二特征层对应的特征信息传输到相应的第三特征层，以进行特征融合，使得更新所述第三特征层对应的特征信息，并将其作为所述金字塔注意力网络的输出结果。 4.根据权利要求3所述的模型的训练方法，其特征在于，所述将所述第一特征层所提取到的特征信息传输到相应的第二特征层，以进行特征融合，使得更新所述第二特征层对应的特征信息，包括：每一第二特征层执行下述上采样步骤：针对与其连接的第一特征层输出的特征信息，和/或，上一级的第二特征层输出的特征信息进行上采样处理，得到所述第二特征层输出的特征信息；所述将所述第二特征层对应的特征信息传输到相应的第三特征层，以进行特征融合，使得更新所述第三特征层对应的特征信息，包括：每一第三特征层执行下述下采样步骤：针对与其连接的第二特征层输出的特征信息，和/或，上一级的第三特征层输出的特征信息进行下采样处理，得到所述第三特征层输出的特征信息。 5.根据权利要求3所述的模型的训练方法，其特征在于，所述模块还包括基于SSH框架布设的检测网络；所述检测网络与所述金字塔注意力网络连接，将至少一个所述金字塔注权　利　要　求　书 1/2 页 2 CN 114626503 A 2意力网络的输出结果作为所述检测网络的输入；所述检测网络包括激活函数层及至少一个处理通道，所述处理通道均与所述激活函数层连接；每个所述处理通道包括至少一个卷积单元，所述卷积单元包括并联连接的第三卷积结构、第四卷积结构及直连结构。 6.根据权利要求5所述的模型的训练方法，其特征在于，所述方法还包括：将排序在末端的第一特征层的输出作为所述检测网络的输入；和/或将排序在首端的第一特征层的输入作为所述检测网络的输入。 7.一种目标检测方法，其特征在于，包括：获取待处理图像；利用由如权利要求1至6任一项所述的模型的训练方法生成的目标检测模型对所述待处理图像进行目标检测，得到目标信息。 8.根据权利要求7所述的目标检测方法，其特征在于，所述目标检测模型包括依次连接的主干网络、金字塔注意力网络以及检测网络，所述利用由所述模型的训练方法生成的目标检测模型对所述待处理图像进行目标检测，包括：基于所述主干网络对所述待处理图像进行特征提取，获得特征图；基于所述金字塔注意力网络对所述特征图进行融合，得到融合特征图；基于所述检测网络对所述融合特征图进行检测，得到所述待处理图像中不同尺寸的目标对应的目标信息，所述目标信息包括目标图像、目标位置信息及关键点信息。 9.一种模型的训练装置，其特征在于，包括：网络筛选模块，用于从预设的神经网络中筛选出符合预设的性能效率条件的神经卷积网络；残差网络构建模块，用于对筛选出的神经卷积网络进行参数重构，得到包含跳跃连接结构的残差网络；训练模块，用于对所述残差网络进行训练；主干网络构建模块，用于将训练后的残差网络重构成等效的视觉几何组VGG网络，以便基于所述视觉几何组VGG网络构建所述主干网络。 10.一种目标检测装置，其特征在于，包括：图像获取模块，用于获取待处理图像；目标检测模块，用于利用由如权利要求1至6任一项所述的模型的训练方法生成的目标检测模型对所述待处理图像进行目标检测，得到目标信息。 11.一种电子设备，包括存储器、处理器及存储在存储器上的计算机程序，其特征在于，所述处理器执行所述计算机程序以实现权利要求1 ‑8任一项所述方法的步骤。 12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1 ‑8任一项所述方法的步骤。 13.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1 ‑8任一项所述方法的步骤。权　利　要　求　书 2/2 页 3 CN 114626503 A 3

专利 模型的训练方法、目标检测方法、装置、电子设备及介质

专利模型的训练方法、目标检测方法、装置、电子设备及介质