说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210057161.9 (22)申请日 2022.01.19 (71)申请人 中国民航大 学 地址 300300 天津市东 丽区津北公路2898 号 (72)发明人 张红颖 贺鹏艺  (74)专利代理 机构 天津才智专利商标代理有限 公司 12108 代理人 庞学欣 (51)Int.Cl. G06T 7/00(2017.01) G06T 7/246(2017.01) G06T 7/70(2017.01) G06N 3/08(2006.01) G06N 3/04(2006.01)G06K 9/62(2022.01) G06V 10/44(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种基于添加注 意力模块的无锚框检测、 跟 踪统一方法 (57)摘要 一种基于添加注 意力模块的无锚框检测、 跟 踪统一方法。 其包括获得预处理图像; 获得初始 特征提取网络模 型; 获得训练好的特征提取网络 模型; 利用上述训练后的特征提取网络模型对行 人目标进行持续检测和跟踪等步骤。 本发明效 果: 采用多任务学习策略, 极大降低了网络的训 练时间; 训练后的网络模型具有较高的精确度与 鲁棒性; 充分利用多尺度信息交互, 深度提取、 融 合更具表达力的行人目标特征, 更好地在行人互 相遮挡场景下准确跟踪行人目标; 利用了二代残 差块构成 网络模型中的主干网络, 同时结合更高 效的注意力模块进行信息交互, 使得预测方法的 检测精度更高, 重识别性能更强, 能够适用于诸 如航站楼等旅客互相遮挡严重场景下的行人目 标检测和跟踪。 权利要求书3页 说明书7页 附图3页 CN 114387265 A 2022.04.22 CN 114387265 A 1.一种基于添加 注意力模块的无锚框检测、 跟踪统一方法, 其特征在于: 所述基于添加 注意力模块的无锚框检测、 跟踪统一方法包括按顺序进行的下列步骤: 1)获取航站楼内客流密集区域的图像并进行预处理, 获得预处理图像, 并且每帧预处 理图像带有一个标签, 该 标签内包 含当前帧图像内所有行 人目标的位置信息; 2)构建原始特征提取网络模型, 然后将上述预处理图像输入原始特征提取网络模型进 行特征提取, 获得初始特 征提取网络模型; 3)针对检测任务的目标中心点定位、 边界尺寸、 偏移误差以及重识别任务分别设置相 应的损失函数; 然后使用大量现有数据训练上述初始特征提取网络模型 的参数, 获得训练 好的特征提取网络模型; 4)利用上述训练后的特 征提取网络模型对行 人目标进行持续检测 和跟踪。 2.根据权利要求1所述的基于添加 注意力模块的无锚框检测、 跟踪统一方法, 其特征在 于: 在步骤1)中, 所述 获取航站楼内客流密集区域的图像并进 行预处理, 获得预 处理图像的 方法是: 利用位于航站楼内客流密集区域的监控摄像头, 在客流量较大时间段内 以固定时 间间隔拍摄旅客行走、 遮挡过程中的图像, 并对图像进 行去模糊、 降噪和提升分辨率在内的 预处理, 获得预处理图像。 3.根据权利要求1所述的基于添加 注意力模块的无锚框检测、 跟踪统一方法, 其特征在 于: 在步骤2)中, 所述构建原始特征提取网络模 型, 然后将上述预 处理图像输入原始特征提 取网络模型进行 特征提取, 获得初始特 征提取网络模型的方法是: 原始特征提取网络模型共分为五个阶段: stem、 stage1、 stage2、 stage3、 stage4; 其中 stem为主干网络; sta ge1至sta ge4为阶段1至阶段4; 首先主干网络stem通过两个步长为2的3 ×3的卷积层将预处理图像的高宽变为原来的 四分之一, 然后使用4个二代残差块bottle2neck进行特征提取, 并将输出的特征图输入阶 段1中; 阶段1 ‑阶段3进行特征提取和融合操作, 都是在上一阶段的基础上产生一个低分辨 率分支, 然后每个低分辨率分支使用4个添加两层注意力模块的基准残差块2eca ‑ basicblock进行特征提取, 最后将得到的特征图进行重复多尺度融合并输入阶段4; 阶段4 为头网络, 首先将三个并行的低分辨率分支输出的特征图通过双线性插值方法上采样为高 分辨率分支的尺寸大小, 然后通过拼接操作和全连接层得到最终的输出特征图, 用于检测 和重识别, 并获得初始特 征提取网络模型。 4.根据权利要求1所述的基于添加 注意力模块的无锚框检测、 跟踪统一方法, 其特征在 于: 在步骤3)中, 所述针对检测任务的目标中心点定位、 边界尺寸、 偏移误差以及重识别任 务分别设置相应的损失函数; 然后使用大量现有 数据训练上述初始特征提取网络模型的参 数, 获得训练好的特 征提取网络模型的方法是: 目标中心点定位的损失函数使用变形的focal  loss, 用于计算预测的热图和实际真实 的热图之间的损失, 该损失函数能够有效处理目标中心点和周围各点样本不平衡的问题, 公式如式(1)所示:权 利 要 求 书 1/3 页 2 CN 114387265 A 2式(1)中, 是预测的热图响应值, Mxy是热图的真实响应值; 设行人目标区域 的两个 角点坐标分别为(x1,y1)和(x2,y2), 则经过尺寸缩减后行人目标的中心点坐标为 而行人目标某角点坐标(x,y)关于中心点坐标的热图的真 实响应值如式(2)所示: 其中N表示图像中行 人目标的数量, i表示第几个行 人目标, σc表示标准方差; 边界尺寸和偏移误差选 择两个l1 loss作为损失函数, 根据每个行人目标给出的角点坐 标, 损失函数如式(3)所示: 其中, si表示行人目标的真实尺寸, oi表示行人目标尺寸的真实偏移量, 和 分别表 示尺寸和偏移量的预测值, Lbox表示由两个分支的损失相加得到的定位损失; 重识别任务实质上是一个分类任务, 因此选择softmax  loss作为损失函数, 在获取的 热图上行人目标的中心点处提取一个身份特征向量进行学习并将其映射为一个类分布向 量p(k), 将每个行人目标的独热编码表示为Li(k), 将类别数记为K, 重识别任务的损失函数 如式(4)所示: 设置好上述所有损失函数后, 选择CUHK ‑SYSU、 PRW、 MOT16数据集中的训练集图像作为 训练集, 2D MOT15数据集中的训练集图像作为验证集, 对 上述初始特征提取网络模 型的参数 进行训练; 训练迭代次数设置为36轮次, 其中前31轮学习 率设置为1e ‑4, 随后4轮学习 率设 为1e‑5, 最后一轮使用1e ‑6的学习率训练达到拟合; 训练过程中输入的图像尺寸为(1088, 608), 批尺 寸设为6, 利用Adam优化器进行模型优化, 使用relu作为激活函数, 设置正则化系 数为0.001, 训练完成后最终 获得训练好的特 征提取网络模型。 5.根据权利要求1所述的基于添加 注意力模块的无锚框检测、 跟踪统一方法, 其特征在权 利 要 求 书 2/3 页 3 CN 114387265 A 3

.PDF文档 专利 一种基于添加注意力模块的无锚框检测、跟踪统一方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于添加注意力模块的无锚框检测、跟踪统一方法 第 1 页 专利 一种基于添加注意力模块的无锚框检测、跟踪统一方法 第 2 页 专利 一种基于添加注意力模块的无锚框检测、跟踪统一方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:12:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。