说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111642695.X (22)申请日 2021.12.2 9 (71)申请人 亚信科技 (中国) 有限公司 地址 100193 北京市海淀区西北旺东路10 号院东区19号楼1层101 (72)发明人 何振军 蒋乐 李国明 刘洋  刘敏 宋勇 欧阳晔  (74)专利代理 机构 北京市立方律师事务所 11330 专利代理师 张筱宁 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) G06V 10/44(2022.01)G06V 10/774(2022.01) G06V 10/82(2022.01) (54)发明名称 模型的训练方法、 目标检测方法、 装置、 电子 设备及介质 (57)摘要 本申请实施例提供了一种模 型的训练方法、 目标检测方法、 装置、 电子设备及介质, 涉及计算 机领域。 该模型的训练方法包括: 从预设的神经 网络中筛选出符合预设的性能效率条件的神经 卷积网络, 对筛选出的神经卷积网络进行参数重 构, 得到包含跳跃连接结构的残差网络, 对残差 网络进行训练, 将训练后的残差网络重构成等效 的视觉几何组VGG网络, 以便基于视觉几何组VGG 网络构建所述主干网络。 该目标检测方法包括: 获取待处理图像, 利用由如上所述的模型的训练 方法生成的目标检测模型对所述待处理图像进 行目标检测, 得到目标信息。 本申请实施例用于 解决现有边缘设备在运行目标检测算法的过程 中存在运行速度慢和资源消耗大的问题。 权利要求书2页 说明书14页 附图7页 CN 114626503 A 2022.06.14 CN 114626503 A 1.一种模型的训练方法, 其特征在于, 模型包括主干网络; 所述主干网络的训练步骤, 包括: 从预设的神经网络中筛 选出符合预设的性能效率条件的神经 卷积网络; 对筛选出的神经 卷积网络进行参数重构, 得到包 含跳跃连接结构的残差网络; 对所述残差网络进行训练; 将训练后的残差网络重构成等效的视觉几何组VGG网络, 以便基于所述视觉几何组VGG 网络构建所述主干网络 。 2.根据权利要求1所述的模型的训练方法, 其特征在于, 所述将训练后的残差网络重构 成等效的视 觉几何组VGG网络, 包括: 对训练后的残差网络中的卷积层和BN层进行合并; 基于合并后的残差网络 中的第一卷积结构, 对合并后的残差网络 中的第二卷积结构和 直连结构进行填充; 将所述第一卷积结构、 填充后的第二卷积结构及填充后的直连结构进行组合, 获得等 效的视觉几何组VGG网络。 3.根据权利要求1所述的模型的训练方法, 其特征在于, 模块还包括与 所述主干网络连 接的金字塔注意力网络; 其中, 所述主干网络包括级联排序的多个第一特征层; 所述金字塔注意力网络包括上 采样单元和下采样单元; 所述上采样单元包括级联排序布设的多个第二特征层; 所述下采 样单元包括级联排序 布设的多个第三特征层; 所述第一特征层与所述第二特征层之 间至少 一层具有横向连接结构; 所述第二特征层与所述第三特征层之 间至少一层具有横向连接结 构; 所述金字塔注意力网络的训练步骤, 包括: 将所述第一特征层所提取到的特征信息传输到相应的第二特征层, 以进行特征融合, 使得更新所述第二特 征层对应的特 征信息; 将所述第二特征层对应的特征信息传输到相应的第三特征层, 以进行特征融合, 使得 更新所述第三特 征层对应的特 征信息, 并将其作为所述金字塔注意力网络的输出 结果。 4.根据权利要求3所述的模型的训练方法, 其特征在于, 所述将所述第 一特征层所提取 到的特征信息传输到相 应的第二特征层, 以进行特征融合, 使得更新所述第二特征层对应 的特征信息, 包括: 每一第二特征层执行下述上采样步骤: 针对与其连接的第一特征层输出的特征信息, 和/或, 上一级的第二特征层输出的特征信息进 行上采样处理, 得到所述第二特征层输出的 特征信息; 所述将所述第二特征层对应的特征信息传输到相应的第三特征层, 以进行特征融合, 使得更新所述第三特 征层对应的特 征信息, 包括: 每一第三特征层执行下述下采样步骤: 针对与其连接的第二特征层输出的特征信息, 和/或, 上一级的第三特征层输出的特征信息进 行下采样处理, 得到所述第三特征层输出的 特征信息。 5.根据权利要求3所述的模型的训练方法, 其特征在于, 所述模块还包括基于SSH框架 布设的检测网络; 所述检测网络与所述金字塔注意力网络连接, 将至少一个所述金字塔注权 利 要 求 书 1/2 页 2 CN 114626503 A 2意力网络的输出 结果作为所述检测网络的输入; 所述检测网络包括激活函数层及至少一个处理通道, 所述处理通道均与所述激活函数 层连接; 每个所述处理通道包括至少一个卷积单元, 所述卷积单元包括并联连接的第三卷 积结构、 第四卷积结构及直连 结构。 6.根据权利要求5所述的模型的训练方法, 其特 征在于, 所述方法还 包括: 将排序在末端的第一特 征层的输出作为所述检测网络的输入; 和/或 将排序在首端的第一特 征层的输入作为所述检测网络的输入。 7.一种目标检测方法, 其特 征在于, 包括: 获取待处 理图像; 利用由如权利要求1至6任一项所述的模型的训练方法生成的目标检测模型对所述待 处理图像进行目标检测, 得到目标信息 。 8.根据权利要求7所述的目标检测方法, 其特征在于, 所述目标检测模型包括依次连接 的主干网络、 金字塔注意力网络以及检测网络, 所述利用由所述模型 的训练方法生成的目 标检测模型对所述待处 理图像进行目标检测, 包括: 基于所述主干网络对所述待处 理图像进行 特征提取, 获得 特征图; 基于所述金字塔注意力网络对所述特 征图进行融合, 得到融合特 征图; 基于所述检测网络对所述融合特征图进行检测, 得到所述待处理图像中不同尺寸的目 标对应的目标信息, 所述目标信息包括目标图像、 目标位置信息及关键点信息 。 9.一种模型的训练装置, 其特 征在于, 包括: 网络筛选模块, 用于从预设的神经网络 中筛选出符合预设的性 能效率条件的神经卷积 网络; 残差网络构建模块, 用于对筛选出的神经卷积网络进行参数重构, 得到包含跳跃连接 结构的残差网络; 训练模块, 用于对所述残差网络进行训练; 主干网络构建模块, 用于将训练后的残差网络重构成等效的视觉几何组VGG网络, 以便 基于所述视 觉几何组VGG网络构建所述主干网络 。 10.一种目标检测装置, 其特 征在于, 包括: 图像获取模块, 用于获取待处 理图像; 目标检测模块, 用于利用由如权利要求1至6任一项所述的模型的训练方法生成的目标 检测模型对所述待处 理图像进行目标检测, 得到目标信息 。 11.一种电子设备, 包括存储器、 处理器及存储在存储器上的计算机程序, 其特征在于, 所述处理器执行所述计算机程序以实现权利要求1 ‑8任一项所述方法的步骤。 12.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1 ‑8任一项所述方法的步骤。 13.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现权利要求1 ‑8任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114626503 A 3

.PDF文档 专利 模型的训练方法、目标检测方法、装置、电子设备及介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型的训练方法、目标检测方法、装置、电子设备及介质 第 1 页 专利 模型的训练方法、目标检测方法、装置、电子设备及介质 第 2 页 专利 模型的训练方法、目标检测方法、装置、电子设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:44:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。