专利行人多目标跟踪识别方法及跟踪识别装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210581127.1 (22)申请日 2022.05.25 (71)申请人青岛科技大学地址 266061 山东省青岛市松岭路69号青岛科技大学崂山校区 (72)发明人梁宏涛　董文轩　吴沭运　刘国柱　杜军威　朱习军　胡强　 (74)专利代理机构青岛联智专利商标事务所有限公司 37101 专利代理师李升娟 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/762(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) (54)发明名称行人多目标跟踪识别方法及跟踪识别装置 (57)摘要本发明公开了一种行人多目标跟踪识别方法和跟踪识别装置，解决现有技术存在的精确度低和稳定性差的问题。所述方法包括采用训练数据集训练网络并获取行人多目标跟踪识别模型的过程：获取包含行人多目标的训练数据集；将所述训练数据集输入基于FairMOT架构、由 GAConv和CLFPN构建的Encoder ‑Decoder网络，获得多尺度融合特征图；将所述多尺度融合特征图输入目标检测网络和重识别网络，获得目标和检测结果；将所述目标和检测结果输入跟踪网络进行跟踪，获得训练后的行人多目标跟踪识别模型；在采用所述训练数据集训练网络时，采用自适应loss衰减的学习率更改策略和AdamW相结合的方法执行网络参数优化。权利要求书3页说明书9页附图4页 CN 114937239 A 2022.08.23 CN 114937239 A 1.一种行人多目标跟踪识别方法，其特征在于，所述方法包括采用训练数据集训练网络并获取行人多目标跟踪识别模型的过程；所述训练网络的过程包括：获取包含行人多目标的训练数据集；将所述训练数据集输入基于FairMOT架构的Encoder ‑Decoder网络进行特征提取，获得多尺度融合特征图；所述Encoder ‑Decoder网络中，采用全局注意卷积模块GAConv作为主干网络，引入跨层特征金字塔结构CLFPN对所述主干网络进行改进；将所述多尺度融合特征图输入所述FairMOT架构的目标检测网络和重识别网络，获得目标和检测结果；将所述目标和检测结果输入所述FairMOT架构的跟踪网络进行跟踪，获得训练后的行人多目标跟踪识别模型；在采用所述训练数据集训练网络时，采用自适应loss衰减的学习率更改策略和AdamW 相结合的方法执行网络参数优化，网络参数收敛后的模型确定为所述训练后的行人多目标跟踪识别模型。 2.根据权利要求1所述的行人多目标跟踪识别方法，其特征在于，所述方法还包括：获取所述训练后的行人多目标跟踪识别模型各层的初始权重；采用层次聚类算法对所述初始权重进行聚类，获取聚类后的有效权重；采用kmeans+ +对所述有效权重进行聚类压缩，获得量化压缩的轻量化跟踪识别模型。 3.根据权利要求2所述的行人多目标跟踪识别方法，其特征在于，所述方法还包括采用测试数据集对模型进行评估的过程；所述评估的过程包括：获取包含行人多目标的原始测试数据集；对所述原始测试数据集进行图像增强，获得增强后测试数据集；采用所述增强后测试数据集评估所述训练后的行人多目标跟踪识别模型和/或所述轻量化跟踪识别模型，获得最终跟踪结果。 4.根据权利要求3所述的行人多目标跟踪识别方法，其特征在于，对所述原始测试数据集进行图像增强，获得增强后测试数据集，包括：对所述原始测试数据集采用自适应直方图均衡化方式进行图像增强，获得所述增强后测试数据集。 5.根据权利要求3所述的行人多目标跟踪识别方法，其特征在于，所述训练数据集和所述原始测试数据集采用下述方法获取：获取包含行人多目标的多帧图片，在每帧图片上标注行人id、图片左上角坐标和图片下角点坐标，获得标注后行人数据集；将所述标注后行人数据集进行格式转换，获得包含行人id、目标中心点坐标、目标长宽的数据文档；将所述数据文档和所述标注后行人数据集确定为组合数据集；将所述组合数据集按照设定比例划分为所述训练数据集和所述原始测试数据集。 6.根据权利要求1所述的行人多目标跟踪识别方法，其特征在于，将所述训练数据集输入基于FairMOT架构的Encoder ‑Decoder网络进行特征提取，获得多尺度融合特征图，包括：权　利　要　求　书 1/3 页 2 CN 114937239 A 2将所述全局注意卷积模块GAConv与标准卷积模块结合，提取输入的数据集的原始特征图；利用所述全局注意卷积模块GAConv对所述原始特征图进行两方向的序列编码，通过注意力机制对两编码序列进行扩充还原，将扩充还原后的两序列拼接，获得拼接后序列；将所述拼接后序列与所述原始特征图进行叠加，获取全局注意力权重；在所述主干网络后连接所述跨层特征金字塔结构CLFPN，通过可学习的所述全局注意力权重学习不同输入特征的重要性，并通过跨层连接，反复应用自顶向下和自底向上的多尺度特征融合，获得所述多尺度融合特征图。 7.根据权利要求1所述的行人多目标跟踪识别方法，其特征在于，所述自适应loss衰减的学习率更改策略包括：采用下述更新函数更新学习率：其中， lr为学习率；和分别为学习率的最大值和最小值，为设定值； Ti为当前训练轮次，为变化值； Tcur为到达最大学习率的轮次，为设定值，为以e为底的指数，表示loss变化率， Closs为相邻两训练轮次的l oss差值，为计算值； T为训练总轮次，为设定值。 8.一种行人多目标跟踪识别装置，其特征在于，所述装置包括：训练数据集获取模块，用于获取包含行人多目标的训练数据集；特征提取模块，用于将所述训练数据集输入基于FairMOT架构的Encoder ‑Decoder网络进行特征提取，获得多尺度融合特征图；所述Encoder ‑Decoder网络中，采用全局注意卷积模块GACo nv作为主干网络，引入跨层特征金字塔结构CLFPN对所述主干网络进行改进；目标和检测结果获取模块，用于将所述多尺度融合特征图输入所述FairMOT架构的目标检测网络和重识别网络，获得目标和检测结果；训练后行人多目标跟踪识别模型获取模块，用于将所述目标和检测结果输入所述 FairMOT架构的跟踪网络进行跟踪，获得训练后的行人多目标跟踪识别模型；网络参数优化模块，用于在采用所述训练数据集训练网络时，采用自适应loss衰减的学习率更改策略和AdamW相结合的方法执行网络参数优化，网络参数收敛后的模型确定为所述训练后的行人多目标跟踪识别模型。 9.根据权利要求8所述的行人多目标跟踪识别装置，其特征在于，所述装置还包括：模型量化压缩模块，用于获取所述训练后的行人多目标跟踪识别模型各层的初始权重；采用层次聚类算法对所述初始权重进行聚类，获取聚类后的有效权重；采用kmeans++对所述有效权重进行聚类压缩，获得量化压缩的轻量化跟踪识别模型。 10.根据权利要求9所述的行人多目标跟踪识别装置，其特征在于，所述装置还包括：原始测试数据集模块，用于获取包含行人多目标的原始测试数据集；图像增强处理模块，用于对所述原始测试数据集进行图像增强，获得增强后测试数据权　利　要　求　书 2/3 页 3 CN 114937239 A 3

专利 行人多目标跟踪识别方法及跟踪识别装置

专利行人多目标跟踪识别方法及跟踪识别装置