说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210437745.9 (22)申请日 2022.04.25 (71)申请人 山东浪潮科 学研究院有限公司 地址 250100 山东省济南市高新浪潮路 1036号S02号楼 (72)发明人 李雪 滕以金 李锐 林俊豪  张晖  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 孙园园 (51)Int.Cl. G06V 40/10(2022.01) G06V 40/16(2022.01) G06V 40/18(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 5/04(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于动态分组卷积的行 人检测方法及系统 (57)摘要 本发明公开了基于动态分组卷积的行人检 测方法及系统, 属于神经网络技术领域, 本发明 要解决的技术问题为如何利用分组卷积实现行 人检测, 有效提高行人检测的效率, 采用的技术 方案为: 该方法具体如下: 获取行为人数据集, 利 用分组卷积构建目标检测网络架构, 在保留原始 神经网络 结构完成初始训练; 利用显著性分数生 成器对输入通道和输出通道计算 分值, 并按照从 高到低的顺序进行排序; 设置阈值, 筛选输出通 道对应的输入通道; 利用通道选择器替代每个 反 转残差块中的最后1x1个逐点卷积层; 利用行人 数据再次训练目标检测网络架构, 得到推理模 型; 将推理模型部署于边端, 对实时采集到的目 标进行识别和判断。 权利要求书2页 说明书6页 附图1页 CN 114882527 A 2022.08.09 CN 114882527 A 1.一种基于动态分组卷积的行 人检测方法, 其特 征在于, 该 方法具体如下: 获取行为人数据集, 利用分组卷积构建目标检测网络架构, 在保留原始神经网络结构 完成初始训练; 其中, 行为人数据集是根据使用场景进 行采集, 再利用人工标注或智能标注 获取标签, 完成数据集建立; 或使用公开的数据集进 行筛选后获取使用; 行为人数据集中包 括的行人特征包括面部明显特征、 穿衣特征及根据实际场景需要提取 的相应特征; 面部明 显特征包括眼镜; 穿衣特 征包括颜色及款式; 利用显著性分数生成器对输入通道和输出通道计算分值, 并按照从高到低的顺序进行 排序; 设置阈值, 筛 选输出通道对应的输入通道; 利用通道选择器替代每 个反转残差块中的最后1x1个逐点卷积层; 利用行人数据再次训练目标检测网络架构, 得到推理模型; 将推理模型部署于边端, 对实时采集到的目标进行识别和判断。 2.根据权利要求1所述的基于动态分组卷积的行人检测方法, 其特征在于, 利用分组卷 积构建目标检测网络架构具体如下: 在保持原 始神经网络结构完整的同时, 将神经网络内的卷积随机分为多组; 为每个组自适应地选择最相关的输入通道, 即为每个组引入一个辅助特征选择器, 辅 助特征选择器根据当前输入通道的激活情况动态地决定哪一部分输入通道要被连接; 多个组捕捉到输入图像的不同互补的视觉和/或语义特征, 使分组后的卷积有能力学 习大量的特 征表示; 在训练过程中, 不断修改分组情况。 3.根据权利要求1或2所述的基于动态分组卷积的行人检测方法, 其特征在于, 分组卷 积由两个头组成, 每个头中包括一个用来为每个通道分配重要性分数的显著性分数生成 器。 4.根据权利要求3所述的基于动态分组卷积的行人检测方法, 其特征在于, 显著性分数 生成器的作用如下: ①、 给每个输入通道分配一个代表其重要性的分数, 该分数鼓励不同的头使用不同的 输入通道的子部分, 实现多样化的特征表示; 同时利用该分数对重要性分数较低的通道进 行修剪; 其中, 重要性分数较低的通道指的是重要性分数低于设定阈值的通道; ②、 根据输入通道选定子集引导正常函数, 在每个头中生成输出通道; 且在当前头中, 使用头部阈值决定DGC层中每 个头部的人一个通道门的数量; ③、 将来自不同头的输出通道被连接在一 起, 并进行融合。 5.根据权利要求4所述的基于动态分组卷积的行人检测方法, 其特征在于, 根据设定的 输入通道和输出通道的数量以及头的数据来分配每个头负责的输出量, 并分别使用一个突 出性引导的通道选择器筛 选出输入通道的哪一部分不 参与该组内的卷积计算。 6.根据权利要求5所述的基于动态分组卷积的行人检测方法, 其特征在于, 输出通道分 成多组, 每组由一个辅助头产生, 辅助头配备一个输入通道选择器, 输入通道选择器用于决 定选择哪一部分输入通道用于卷积计算, 具体如下: 每个头的输入通道选择器采用门控策略, 根据显著性分数生成器产生的重要度分值动 态确定最重要的输入通道子集;权 利 要 求 书 1/2 页 2 CN 114882527 A 2根据选定的输入通道子集进行正常的卷积, 生成各头的输出通道; 将来自不同头 部的输出通道被串联并变化, 连接 到BN层和非线性激活层。 7.一种基于动态分组卷积的行 人检测系统, 其特 征在于, 该系统包括, 构建模块, 用于获取行为人数据集, 利用分组卷积构建目标检测网络架构, 在 保留原始 神经网络结构 完成初始训练; 其中, 行为人数据集是根据使用场景进 行采集, 再利用人工标 注或智能标注获取标签, 完成数据集建立; 或使用公开的数据集进 行筛选后获取使用; 行为 人数据集中包括的行人特征包括面部明显特征、 穿衣特征及根据实际场景需要提取的相应 特征; 面部明显特 征包括眼镜; 穿衣特 征包括颜色及款式; 排序模块, 用于利用显著性分数生成器对输入通道和输出通道计算分值, 并按照从高 到低的顺序进行排序; 筛选模块, 用于设置阈值, 筛 选输出通道对应的输入通道; 替代模块, 用于利用通道选择器替代每 个反转残差块中的最后1x1个逐点卷积层; 训练模块, 用于利用行 人数据再次训练目标检测网络架构, 得到推理模型; 部署模块, 用于将推理模型部署于边端, 对实时采集到的目标进行识别和判断。 8.根据权利要求7所述的基于动态分组卷积的行人检测系统, 其特征在于, 所述构建模 块包括, 分组子模块, 用于在保持原始神经网络结构完整的同时, 将神经网络内的卷积随机分 为多组; 选择子模块, 用于为每个组自适应地选择最相关的输入通道, 即为每个组引入一个辅 助特征选择器, 辅助特征选择器根据当前输入通道的激活情况动态地决定 哪一部分输入通 道要被连接; 捕捉子模块, 用于利用多个组捕捉到输入图像的不同互补的视觉和/或语义特征, 使分 组后的卷积有能力学习大量的特 征表示; 修改子模块, 用于在训练过程中, 不断修改分组情况。 9.一种电子设备, 其特 征在于, 包括: 存 储器和至少一个处 理器; 其中, 所述存 储器上存 储有计算机程序; 所述至少一个处理器执行所述存储器存储的计算机程序, 使得所述至少一个处理器执 行如权利要求1至 6任一项所述的基于动态分组卷积的行 人检测方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 所述计算机程序可被处理器执行以实现如权利要求 1至6中任一项 所述的基于动态分 组卷积的行 人检测方法。权 利 要 求 书 2/2 页 3 CN 114882527 A 3

.PDF文档 专利 基于动态分组卷积的行人检测方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于动态分组卷积的行人检测方法及系统 第 1 页 专利 基于动态分组卷积的行人检测方法及系统 第 2 页 专利 基于动态分组卷积的行人检测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:37:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。