专利 一种实例感知主干网络训练方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111670920.0 (22)申请日 2021.12.31 (71)申请人西安工业大学地址 710021 陕西省西安市未央区学府中路2号 (72)发明人黄姗姗　马龙　吴海波　杨静　彭扬帆　徐玉　赵佳尧　杜江斌　魏邹建　 (74)专利代理机构深圳倚智知识产权代理事务所(普通合伙) 44632 代理人霍如肖 (51)Int.Cl. G06V 10/764(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06V 10/82(2022.01) (54)发明名称一种实例感知主干网络训练方法 (57)摘要本发明涉及一种实例感知主干网络训练方法，应用于多目标视觉跟踪，包括网络模型预训练和模型微调再训练，其中网络模型预训练具体为：将多目标跟踪数据集输入目标分类主干网络执行正向传播生成网络模型中间参数；使用中间参数执行反向传播更新中间参数；执行反向传播时通过增加实例感知分散约束并结合目标分类主干网络原有的类间方差约束引导目标分类主干网络同时增加类间间距和类内间距；迭代执行正向传播和反向传播得到最优目标分类主干网络。通过本发明提供的技术方案，能实现实例类间间距和类内间距同时增加，提高了多目标视觉跟踪的成功率和精度，同时不改变原始主干网络的网络结构、训练数据和超参数，使用极为便利。权利要求书1页说明书4页附图2页 CN 114399661 A 2022.04.26 CN 114399661 A 1.一种实例感知主干网络训练方法，应用于多目标视频跟踪，其特征在于，包括网络模型预训练，具体为：将多目标跟踪数据集输入目标分类主干网络执行正向传播生成网络模型中间参数；使用中间参数执行反向传播更新中间参数；执行反向传播时通过增加实例感知分散约束并结合目标分类主干网络原有的类间方差约束引导目标分类主干网络同时增加类间间距和类内间距；迭代执行正向传播和反向传播得到最优目标分类主干网络。 2.如权利要求1所述实例感知主干网络训练方法，其特征在于，所述实例感知分散约束为类内方差约束，所述类内方差约束用于引导目标分类主干网络对于同类目标输出具有较大方差的分类向量，以增加同类目标的类内间距。 3.如权利要求2所述实例感知主干网络训练方法，其特征在于，所述类内方差约束与类内距离和正则化项共同构建类内损失函数。 4.如权利要求1所述实例感知主干网络训练方法，其特征在于，所述多目标跟踪数据集为OTB‑2015、 LaSOT或UA V123。 5.如权利要求1所述实例感知主干网络训练方法，其特征在于，所述目标分类主干网络为AlexNet、 VG G19或ResNet5 0。 6.如权利要求1所述实例感知主干网络训练方法，其特征在于，所述实例感知主干网络训练方法采用t ‑SNE算法降维。 7.如权利要求1所述实例感知主干网络训练方法，其特征在于，所述实例感知主干网络训练方法还包括模型微调再训练，具体为：对实际场景的目标跟踪视频进行目标标定后再对经过网络模型预训练的目标分类主干网络再次训练，从而对模型参数进行调优以使目标分类主干网络适应实际场景的目标跟踪。权　利　要　求　书 1/1 页 2 CN 114399661 A 2一种实例感知主干网络训练方法技术领域 [0001]本发明属于多目标跟踪技术领域，特别涉及一种实例感知主干网络训练方法。背景技术 [0002]视觉跟踪是计算机视觉(CV)中的一项基本任务，具有视频监控、机器人技术和人机交互等应用，其目的是根据第一帧图像中指定的目标信息预测后续视频帧中目标的位置和形状。在过去十几年中，基于卷积神经网络(CNN)的视觉跟踪取得了显著的进展。然而，由于诸多因素，设计高精度视觉跟踪器仍然是一项具有挑战性的任务，其中最重要的因素之一是来自相似目标的干扰(IST)。在具有大量同类相似实例的场景中， IST经常导致跟踪器漂移，给视觉跟踪带来很大困难。 [0003]现代视觉跟踪器的主流结构可分为特征提取主干网络、特征融合模块和边界框预测模块。传统主干网络通常在图像分类框架下进行预训练，这种训练方法鼓励主干网络只提取不同类别实例的类间特征。然而，视觉跟踪不仅需要区分目标和属于其他类别的背景杂波，还需要区分属于同一类别目标的实例。这需要特征网络提取具有类间和类内实例区分性的特征。发明内容 [0004]本发明的目的在于提供一种实例感知主干网络训练方法，采用主流的目标分类主干网络，在不改变原始主干网络的网络结构、训练数据、超参数的基础上，通过训练网络时增加实例感知分散约束，以解决现有主干网络不能提取同一类别实例的类内特征进行视觉跟踪的缺陷。 [0005]本发明解决其技术问题提供的技术方案如下： [0006]本发明提供一种实例感知主干网络训练方法，应用于多目标跟踪，包括网络模型预训练，具体为：将多目标跟踪数据集输入目标分类主干网络执行正向传播生成网络模型中间参数；使用中间参数执行反向传播更新中间参数；执行反向传播时通过增加实例感知分散约束并结合目标分类主干网络原有的类间方差约束引导目标分类主干网络同时增加类间间距和类内间距，提高了视觉跟踪的成功率和精度；迭代执行正向传播和反向传播得到最优目标分类主干网络。 [0007]本发明的有益效果为：本发明通过在原始主干网络具有类间区分约束的基础上增加实例感知分散约束，引导目标分类主干网络同时增加类间间距和类内间距，从而提高了视觉跟踪的成功率和精度；同时，所使用的主干网络不改变原始的网络结构、初始化方法、训练数据和超参数，未增加使用视觉跟踪的工作负载，使用方法极为便利。附图说明 [0008]下面结合附图对本发明作进一步说明。 [0009]图1是网络模型预训练的方法流程图。说　明　书 1/4 页 3 CN 114399661 A 3

专利 一种实例感知主干网络训练方法

专利一种实例感知主干网络训练方法