说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111652840.2 (22)申请日 2021.12.3 0 (71)申请人 上海科技大 学 地址 201210 上海市浦东 新区华夏中路393 号 (72)发明人 马月昕  (74)专利代理 机构 上海申汇 专利代理有限公司 31001 代理人 翁若莹 柏子雵 (51)Int.Cl. G06V 20/52(2022.01) G06V 40/10(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01) G06V 10/774(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 基于激光雷达点云的密集人群三维感知算 法 (57)摘要 本发明提出了一种基于激光雷达点云的密 集人群三维感知算法。 本发明提供了一个大规模 的以行人为主的密集场景数据集, 该数据集可以 用于不同的任务, 比如只基于图像或只基于点云 场景的行人检测、 追踪以及图像和点云模式融合 下的多种任务。 本发明对于以上所有任务给出了 基准模型, 并根据行人特点提出了一种新的算 法。 本发明提供了一种基于Voxel ‑CenterPoint 的主干网络, 并额外提出了密度感知层次热图聚 合模块, 利用注意力机制使网络模 型学习个体分 布, 并根据行人密度分布特点生成多尺度的预测 热图, 实现了局部上聚集个体的区分以及全局上 不同密度分布的感知和处 理。 权利要求书2页 说明书5页 附图3页 CN 114359829 A 2022.04.15 CN 114359829 A 1.一种基于 激光雷达点云的密集人群三维感知算法, 其特 征在于, 包括以下步骤: 步骤1: 获取激光雷达点云数据作为输入, 并进行体素分区, 将三维空间划分为等空间 的三维体素网格; 设激光雷达点云数据包含范围分别为沿着 X轴、 Y轴、 Z轴的Wrange、 Hrange、 Drange, 且定义每 个三维体素网格的大小为Vw、 Vh、 Vd, 即可得到三维体素网格沿着X轴、 Y轴、 Z轴的数量为 步骤2: 将激光雷达点云数据中的点根据步骤1中划分的三维体素网格进行分组, 将三 维体素网格中数量超过T的点降采样为T个点; 步骤3: 体素 特征编码, 包括以下步骤: 步骤301: 取三维体素网格中所有点的平均值表达当前三维体素网格, 作为体素特征, 则任意一个三维体素网格的体素 特征表示为: 其中, 三维体素网格中任意第i个点表示为Pi(xi, yi, zi, ri), 其中, (xi, yi, zi)表示第i个 点的三维空间坐标, ri表示点的反射 率大小; 步骤302: 对于三维体素网格中的每个点, 采用其对中心的偏移量增加该点的维度, 则Pi (xi, yi, zi, ri)增加维度后表示 为Pi(xi, yi, zi, ri, xi‑vx, yi‑vy, zi‑vz); 步骤4: 输入W ×H×D个体素特征和对应索引, 其中, 索引为经过步骤1体素分区后三维 体素网格的位置, 使用稀疏卷积方式对非空三维体素网格进 行特征的高维映射得到特征图 M∈RH×W×D×L, 其中, L表示特征通道个数; 特征图M经过N次稀疏卷积和N次下采样操作, 并合 并 最 后 两 个 维 度 作 为 新 的 特 征 通 道 数 得 到 地 图 视 角 下 的 特 征 图 M ′∈ RH /(2×N)×W/(2×N)×(D/(2xN) ×L′)作为下一步的输入, 其中, C=D/(2 ×N)×L′为将后两个 维度合并的 通道数, L ′为经过稀疏卷积后新的通道数; 步骤5: 特征图M ′输入特征提取模型后, 经过十次步长为1的卷积层, 其中第1、 6次通道 数分别减半和加倍, 最终通道数不变, 获得存储在第5、 10次的卷积层的特征结果F1和F2; 特 征提取模 型再将特征结果F1和特征结果F2分别进 行一次步长为2的反卷积操作, 其中, 特征 结果F1的通道数进行加倍, 得到特征结果F1 ′和F2′; 将特征结果F1 ′和特征结果F2 ′根据通 道维度结合在一 起, 得到特 征图; 步骤6: 步骤5得到的特征图经过两次卷积, 调整通道数C ′=C/8后, 引入空间注意力机 制模型, 计算查询值Q和关键值K的点积, 并应用softmax函数来获得注意力权重 计算得到 数值V的加权和作为空间注意力机制模型的输 出 output=V ·attention(Q, K); 由步骤5得到的特征图先经过两次卷积再经过一次通道数为C ′的卷积操作得到, Q∈RH ×W×C′, K∈RC′ ×H×W; 数值V是由步骤5得到的特征图先经过两次卷积再经过一次通道数为C的卷积得到, 并 将后两个维度进行合并, 即V∈RC×(H×W); 步骤7: 对 空间注意力机制模型生成的特征图output分别 进行上、 下采样, 其 中: 经过上权 利 要 求 书 1/2 页 2 CN 114359829 A 2采样的图像大小为原始特征图的2 倍, 对高密度人群中相距很近的人进 行一一区分; 经过下 采样的图像为原 始特征图大小的1/2; 步骤8: 最终人物目标检测分为热力图分类部分和回归部分, 其中: 对于热力图的预测, 目的是在任何检测目标的中心位置生成一个热力图峰值; 在训练 的过程中, 热力图的峰值由标注的实际检测框的三维中心投影到地图视角中生成的二维 高 斯曲线作为目标, 高斯半径σ 设置为: σ =max(f(w ×h), τ ) 其中, τ =1是最小的高斯半径; w、 h为实际检测框的宽和高; f()是椭圆半径方程; 回归的参数包括: 目标物体的尺寸s∈R3; 二维中位置和真实值的误差o∈R2; 离地高度 hg∈R; 物体的朝向以及速度: (si n( α ), cos( α ) )∈R2, α 表示预测的朝向角度。 2.如权利要求1所述的一种基于激光雷达点云的密集人群三维感知算法, 其特征在于, 步骤5中, 使用SE COND算法作为所述特 征提取模型。 3.如权利要求1所述的一种基于激光雷达点云的密集人群三维感知算法, 其特征在于, 步骤8之后还 包括: 步骤9: 根据预测的热力图、 回归图与真实值进行比较和误差计算: 其中热图的计算采用 其中, 为预测的热力图 中分数, It为真实分数; 回归位置的误差采用真实与预测的绝对值平均误差 。权 利 要 求 书 2/2 页 3 CN 114359829 A 3

.PDF文档 专利 基于激光雷达点云的密集人群三维感知算法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于激光雷达点云的密集人群三维感知算法 第 1 页 专利 基于激光雷达点云的密集人群三维感知算法 第 2 页 专利 基于激光雷达点云的密集人群三维感知算法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:56:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。