专利基于动态分组卷积的行人检测方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210437745.9 (22)申请日 2022.04.25 (71)申请人山东浪潮科学研究院有限公司地址 250100 山东省济南市高新浪潮路 1036号S02号楼 (72)发明人李雪　滕以金　李锐　林俊豪　张晖　 (74)专利代理机构济南信达专利事务所有限公司 37100 专利代理师孙园园 (51)Int.Cl. G06V 40/10(2022.01) G06V 40/16(2022.01) G06V 40/18(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 5/04(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于动态分组卷积的行人检测方法及系统 (57)摘要本发明公开了基于动态分组卷积的行人检测方法及系统，属于神经网络技术领域，本发明要解决的技术问题为如何利用分组卷积实现行人检测，有效提高行人检测的效率，采用的技术方案为：该方法具体如下：获取行为人数据集，利用分组卷积构建目标检测网络架构，在保留原始神经网络结构完成初始训练；利用显著性分数生成器对输入通道和输出通道计算分值，并按照从高到低的顺序进行排序；设置阈值，筛选输出通道对应的输入通道；利用通道选择器替代每个反转残差块中的最后1x1个逐点卷积层；利用行人数据再次训练目标检测网络架构，得到推理模型；将推理模型部署于边端，对实时采集到的目标进行识别和判断。权利要求书2页说明书6页附图1页 CN 114882527 A 2022.08.09 CN 114882527 A 1.一种基于动态分组卷积的行人检测方法，其特征在于，该方法具体如下：获取行为人数据集，利用分组卷积构建目标检测网络架构，在保留原始神经网络结构完成初始训练；其中，行为人数据集是根据使用场景进行采集，再利用人工标注或智能标注获取标签，完成数据集建立；或使用公开的数据集进行筛选后获取使用；行为人数据集中包括的行人特征包括面部明显特征、穿衣特征及根据实际场景需要提取的相应特征；面部明显特征包括眼镜；穿衣特征包括颜色及款式；利用显著性分数生成器对输入通道和输出通道计算分值，并按照从高到低的顺序进行排序；设置阈值，筛选输出通道对应的输入通道；利用通道选择器替代每个反转残差块中的最后1x1个逐点卷积层；利用行人数据再次训练目标检测网络架构，得到推理模型；将推理模型部署于边端，对实时采集到的目标进行识别和判断。 2.根据权利要求1所述的基于动态分组卷积的行人检测方法，其特征在于，利用分组卷积构建目标检测网络架构具体如下：在保持原始神经网络结构完整的同时，将神经网络内的卷积随机分为多组；为每个组自适应地选择最相关的输入通道，即为每个组引入一个辅助特征选择器，辅助特征选择器根据当前输入通道的激活情况动态地决定哪一部分输入通道要被连接；多个组捕捉到输入图像的不同互补的视觉和/或语义特征，使分组后的卷积有能力学习大量的特征表示；在训练过程中，不断修改分组情况。 3.根据权利要求1或2所述的基于动态分组卷积的行人检测方法，其特征在于，分组卷积由两个头组成，每个头中包括一个用来为每个通道分配重要性分数的显著性分数生成器。 4.根据权利要求3所述的基于动态分组卷积的行人检测方法，其特征在于，显著性分数生成器的作用如下： ①、给每个输入通道分配一个代表其重要性的分数，该分数鼓励不同的头使用不同的输入通道的子部分，实现多样化的特征表示；同时利用该分数对重要性分数较低的通道进行修剪；其中，重要性分数较低的通道指的是重要性分数低于设定阈值的通道； ②、根据输入通道选定子集引导正常函数，在每个头中生成输出通道；且在当前头中，使用头部阈值决定DGC层中每个头部的人一个通道门的数量； ③、将来自不同头的输出通道被连接在一起，并进行融合。 5.根据权利要求4所述的基于动态分组卷积的行人检测方法，其特征在于，根据设定的输入通道和输出通道的数量以及头的数据来分配每个头负责的输出量，并分别使用一个突出性引导的通道选择器筛选出输入通道的哪一部分不参与该组内的卷积计算。 6.根据权利要求5所述的基于动态分组卷积的行人检测方法，其特征在于，输出通道分成多组，每组由一个辅助头产生，辅助头配备一个输入通道选择器，输入通道选择器用于决定选择哪一部分输入通道用于卷积计算，具体如下：每个头的输入通道选择器采用门控策略，根据显著性分数生成器产生的重要度分值动态确定最重要的输入通道子集；权　利　要　求　书 1/2 页 2 CN 114882527 A 2根据选定的输入通道子集进行正常的卷积，生成各头的输出通道；将来自不同头部的输出通道被串联并变化，连接到BN层和非线性激活层。 7.一种基于动态分组卷积的行人检测系统，其特征在于，该系统包括，构建模块，用于获取行为人数据集，利用分组卷积构建目标检测网络架构，在保留原始神经网络结构完成初始训练；其中，行为人数据集是根据使用场景进行采集，再利用人工标注或智能标注获取标签，完成数据集建立；或使用公开的数据集进行筛选后获取使用；行为人数据集中包括的行人特征包括面部明显特征、穿衣特征及根据实际场景需要提取的相应特征；面部明显特征包括眼镜；穿衣特征包括颜色及款式；排序模块，用于利用显著性分数生成器对输入通道和输出通道计算分值，并按照从高到低的顺序进行排序；筛选模块，用于设置阈值，筛选输出通道对应的输入通道；替代模块，用于利用通道选择器替代每个反转残差块中的最后1x1个逐点卷积层；训练模块，用于利用行人数据再次训练目标检测网络架构，得到推理模型；部署模块，用于将推理模型部署于边端，对实时采集到的目标进行识别和判断。 8.根据权利要求7所述的基于动态分组卷积的行人检测系统，其特征在于，所述构建模块包括，分组子模块，用于在保持原始神经网络结构完整的同时，将神经网络内的卷积随机分为多组；选择子模块，用于为每个组自适应地选择最相关的输入通道，即为每个组引入一个辅助特征选择器，辅助特征选择器根据当前输入通道的激活情况动态地决定哪一部分输入通道要被连接；捕捉子模块，用于利用多个组捕捉到输入图像的不同互补的视觉和/或语义特征，使分组后的卷积有能力学习大量的特征表示；修改子模块，用于在训练过程中，不断修改分组情况。 9.一种电子设备，其特征在于，包括：存储器和至少一个处理器；其中，所述存储器上存储有计算机程序；所述至少一个处理器执行所述存储器存储的计算机程序，使得所述至少一个处理器执行如权利要求1至 6任一项所述的基于动态分组卷积的行人检测方法。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序可被处理器执行以实现如权利要求 1至6中任一项所述的基于动态分组卷积的行人检测方法。权　利　要　求　书 2/2 页 3 CN 114882527 A 3

专利 基于动态分组卷积的行人检测方法及系统

专利基于动态分组卷积的行人检测方法及系统