说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111670920.0 (22)申请日 2021.12.31 (71)申请人 西安工业大 学 地址 710021 陕西省西安市未央区学府中 路2号 (72)发明人 黄姗姗 马龙 吴海波 杨静 彭扬帆 徐玉 赵佳尧 杜江斌 魏邹建 (74)专利代理 机构 深圳倚智知识产权代理事务 所(普通合伙) 44632 代理人 霍如肖 (51)Int.Cl. G06V 10/764(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06V 10/82(2022.01) (54)发明名称 一种实例感知主干网络训练方法 (57)摘要 本发明涉及一种实例感知主干网络训练方 法, 应用于多目标视觉跟踪, 包括网络模型预训 练和模型微调再训练, 其中网络模 型预训练具体 为: 将多目标跟踪数据集输入目标分类主干网络 执行正向传播生成 网络模型中间参数; 使用中间 参数执行反向传播更新中间参数; 执行反向传播 时通过增加实例感知分散约束并结合目标分类 主干网络原有的类间方差约束引导目标分类主 干网络同时增加类间间距和类内间距; 迭代执行 正向传播和反向传播得到最优目标分类主干网 络。 通过本发明提供的技术方案, 能实现实例类 间间距和类内间距同时增加, 提高了多目标视觉 跟踪的成功率和精度, 同时不改变原始主干网络 的网络结构、 训练数据和超参数, 使用极为便利。 权利要求书1页 说明书4页 附图2页 CN 114399661 A 2022.04.26 CN 114399661 A 1.一种实例感知主干网络训练方法, 应用于多目标视频跟踪, 其特征在于, 包括网络模 型预训练, 具体为: 将多目标跟踪数据集输入目标分类主干网络执 行正向传播 生成网络模型中间参数; 使用中间参数执行反向传播更新中间参数; 执行反 向传播时通过增加实例感知 分散约 束并结合目标分类主干网络原有的类间方差约束引导目标分类主干网络同时增加类间间 距和类内间距; 迭代执行正向传播和反向传播得到最优目标分类主干网络 。 2.如权利要求1所述实例感知主干网络训练方法, 其特征在于, 所述实例感知 分散约束 为类内方差约束, 所述类内方差约束用于引导目标分类主干网络对于同类目标输出具有较 大方差的分类向量, 以增 加同类目标的类内间距。 3.如权利要求2所述实例感知主干网络训练方法, 其特征在于, 所述类 内方差约束与类 内距离和正则化项共同构建类内损失函数。 4.如权利要求1所述实例感知主干网络训练方法, 其特征在于, 所述多目标跟踪数据集 为OTB‑2015、 LaSOT或UA V123。 5.如权利要求1所述实例感知主干网络训练方法, 其特征在于, 所述目标分类主干网络 为AlexNet、 VG G19或ResNet5 0。 6.如权利要求1所述实例感知主干网络训练方法, 其特征在于, 所述实例感知主干网络 训练方法采用t ‑SNE算法降维。 7.如权利要求1所述实例感知主干网络训练方法, 其特征在于, 所述实例感知主干网络 训练方法还包括模型微调再训练, 具体为: 对实际场景 的目标跟踪视频进行目标标定后再 对经过网络模型预训练的目标分类主干网络再次训练, 从而对模型参数进 行调优以使目标 分类主干网络适应实际场景的目标跟踪。权 利 要 求 书 1/1 页 2 CN 114399661 A 2一种实例感知主 干网络训练方 法 技术领域 [0001]本发明属于多目标跟踪技 术领域, 特别涉及一种实例感知主干网络训练方法。 背景技术 [0002]视觉跟踪是计算机视觉(CV)中的一项基本任务, 具有视频监控、 机器人技术和 人 机交互等应用, 其目的是根据第一帧图像中指 定的目标信息预测 后续视频帧中目标的位置 和形状。 在过去十几年中, 基于卷积神经网络(CNN)的视觉跟踪 取得了显著的进展。 然而, 由 于诸多因素, 设计高精度视觉跟踪器仍然是一项具有挑战性的任务, 其中最重要的因素之 一是来自相似目标的干扰(IST)。 在具有大量同类相似实例的场景中, IST经常导致跟踪器 漂移, 给视 觉跟踪带来很大困难。 [0003]现代视觉跟踪器的主流结构可分为特征提取主干网络、 特征融合模块和边界框预 测模块。 传统主干网络通常在图像分类框架下进行预训练, 这种训练方法鼓励主干网络只 提取不同类别实例的类间特征。 然而, 视觉跟踪不仅需要区分目标和属于其他类别的背景 杂波, 还需要区分属于同一类别目标的实例 。 这需要特征网络提取具有类间和类内实例区 分性的特 征。 发明内容 [0004]本发明的目的在于提供一种实例感知主干网络训练方法, 采用主流的目标分类主 干网络, 在不改变原始主干网络的网络结构、 训练数据、 超参数的基础上, 通过训练网络时 增加实例感知分散约束, 以解决现有主干网络不能提取同一类别实例的类内特征进行视觉 跟踪的缺陷。 [0005]本发明解决其 技术问题提供的技 术方案如下: [0006]本发明提供一种 实例感知主干网络训练方法, 应用于多 目标跟踪, 包括网络模型 预训练, 具体为: 将多目标跟踪数据集输入目标分类主干网络执行正向传播生成网络模型 中间参数; 使用中间参数执行反向传播更新中间参数; 执行反向传播时通过增加实例感知 分散约束并结合目标分类主干网络原有的类间方差约束引导目标分类主干网络同时增加 类间间距和类内间距, 提高了视觉跟踪的成功率和精度; 迭代执行正向传播和反向传播得 到最优目标分类主干网络 。 [0007]本发明的有益效果为: 本发明通过在原始主干网络具有类间区分约 束的基础上增 加实例感知分散约束, 引导 目标分类主干网络同时增加类间间距和类内间距, 从而提高了 视觉跟踪的成功率和精度; 同时, 所使用的主干网络不改变原始的网络结构、 初始化方法、 训练数据和超参数, 未增 加使用视 觉跟踪的工作负载, 使用方法极为便利。 附图说明 [0008]下面结合附图对本发明作进一 步说明。 [0009]图1是网络模型 预训练的方法流 程图。说 明 书 1/4 页 3 CN 114399661 A 3
专利 一种实例感知主干网络训练方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 00:18:39
上传分享
举报
下载
原文档
(792.3 KB)
分享
友情链接
GB-T 41885-2022 浮空器分类和分级.pdf
GB-T 20234.4-2023 电动汽车传导充电用连接装置 第4部分:大功率直流充电接口.pdf
如何结合使用TOGAF® 和IT4IT™ 标准.pdf
GB-T 3977-2008 颜色的表示方法.pdf
GB-T 23872.1-2009 岩土工程仪器 土压力计 第1部分:振弦式土压力计.pdf
JFrog 中国解决方案架构师 企业级DevSecOps 开源治理方案演讲之路.pdf
DB3309-T 93-2022 地理标志产品 嵊泗贻贝 舟山市.pdf
GB-T 13448-2019 彩色涂层钢板及钢带试验方法.pdf
GB-T 41919-2022 人造石建筑板材.pdf
T-CERS 0002—2022 民用改性甲醇燃料.pdf
GW0204-2014 国家电子政务外网 安全管理系统技术要求与接口规范.pdf
DL-T 1989-2019 电化学储能电站监控系统与电池管理系统通信协议.pdf
T-CISA 045—2020 铬—锰—镍—氮系奥氏体不锈钢热轧钢板和钢带.pdf
GB-T 34926-2017 额定电压0.6-1kV及以下云母带矿物绝缘波纹铜护套电缆及终端.pdf
SN-T 4062-2014 出口植物性中药材中稀土元素的测定方法.pdf
GB-T 19596-2017 电动汽车术语.pdf
T-QGCML 106—2021 生物基热拌用高性能沥青再生剂.pdf
GB-T 37072-2018 美丽乡村建设评价.pdf
DL-T 920-2019 六氟化硫气体中空气、四氟化碳、六氟乙烷和八氟丙烷的测定 气相色谱法.pdf
GB-T 26071-2018 太阳能电池用硅单晶片.pdf
1
/
3
8
评价文档
赞助1.5元 点击下载(792.3 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。