说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210993517.X (22)申请日 2022.08.18 (71)申请人 北京迈格威科技有限公司 地址 100090 北京市海淀区科 学院南路2号 3层317 (72)发明人 贾凡 汪天才  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 董艳芳 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/40(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 20/56(2022.01) (54)发明名称 图像处理方法、 计算机程序产品、 存储介质 及电子设备 (57)摘要 本申请涉及图像处理技术领域, 提供一种图 像处理方法、 计算机程序产品、 存储介质及电子 设备。 其中, 图像处理方法包括: 获取待处理图 像, 并利用主干网络提取待处理图像的图像特 征; 获取多个初始查询特征, 每个初始查询特征 对应BEV空间中的一个子区域; 将多个初始查询 特征输入解码网络, 与同样输入解码网络的图像 特征进行交互计算, 得到对应的多个最终查询特 征; 基于多个最终查询特征, 利用分割网络得到 对应的多个子区域内的目标分割结果; 根据多个 子区域内的目标分割结果, 得到BEV空间中的总 体目标分割结果。 该方法显著提高了在BEV空间 下进行目标分割的精度。 权利要求书2页 说明书15页 附图5页 CN 115482377 A 2022.12.16 CN 115482377 A 1.一种图像处 理方法, 其特 征在于, 包括: 获取待处 理图像, 并利用主干网络提取 所述待处 理图像的图像特 征; 获取多个初始查询特征; 其中, 每个初始查询特征对应鸟瞰视角BEV空间中的一个子区 域, 所述BEV空间为所述待处 理图像的拍摄范围在鸟瞰视角下对应的平面区域; 将所述多个初始查询特征输入解码网络, 与同样输入所述解码网络的所述图像特征进 行交互计算, 得到对应的多个最终查询特 征; 基于所述多个最终查询特征, 利用分割网络得到对应的多个子区域内的目标分割结 果; 根据所述多个子区域内的目标分割结果, 得到所述BEV空间中的总体目标分割结果。 2.根据权利要求1所述的图像处理方法, 其特征在于, 所述获取多个初始查询特征, 包 括: 获取所述多个初始查询特征对应的多组坐标; 其中, 每组坐标至少包括x坐标和y坐标, 且每个初始 查询特征对应的x坐标和y坐标位于所述BEV空间中与该初始 查询特征对应的子 区域内; 利用查询特征编网络对所述多组坐标进行编码, 得到对应的所述多个初始查询特征; 其中, 一个初始查询特 征的维度大于一组坐标的维度。 3.根据权利要求2所述的图像处理方法, 其特征在于, 每组坐标还包括通过学习得到的 z坐标。 4.根据权利要求2或3所述的图像处理方法, 其特征在于, 所述查询特征编码网络包括 位置编码器和特征编码器, 所述利用查询特征编网络对所述多组坐标进行编码, 得到对应 的所述多个初始查询特 征, 包括: 利用所述位置编码器对所述多组坐标进行编码, 得到对应的多个位置编码特征; 其中, 一个位置编码特 征的维度大于一组坐标的维度; 利用所述特征编码器对所述多个位置编码特征进行编码, 得到对应的所述多个初始查 询特征; 其中, 所述特 征编码器为多层感知机 。 5.根据权利要求1 ‑4中任一项所述的图像处理方法, 其特征在于, 所述基于所述多个最 终查询特 征, 利用分割网络得到对应的多个子区域内的目标分割结果, 包括: 将所述多个最终查询特 征输入所述分割网络, 得到对应的多组离 散余弦变换DCT系数; 对所述多组DCT系数进行逆向离线余弦变换IDCT, 得到对应的多个子区域内的目标分 割结果。 6.根据权利要求1 ‑5中任一项所述的图像处理方法, 其特征在于, 所述解码网络包括依 次连接的至少一个解码器, 每个解码器用于对输入该解码器的多个查询特征进行解码, 并 输出多个解码后的查询特征, 输入第一个解码器的多个查询特征为所述多个初始查询特 征, 最后一个解码器输出的多个解码后的查询特 征为所述多个最终查询特 征; 其中, 每个解码器均包括自注意力层和交叉注意力层, 每个解码器在进行解码时, 所述 自注意力 层用于对输入该解码器的多个查询特征进行 交互计算, 所述交叉注意力 层用于将 所述自注意力层输出的多个查询特 征与所述图像特 征进行交 互计算。 7.根据权利要求1 ‑6中任一项所述的图像处理方法, 其特征在于, 所述待处理图像为多 帧图像, 其中的每帧图像对应一个视角, 并由安装在移动载体上的一个摄像头采集, 且所述权 利 要 求 书 1/2 页 2 CN 115482377 A 2多帧图像的总体拍摄范围覆盖所述移动载体的四周。 8.一种计算机程序产品, 其特征在于, 包括计算机程序指令, 所述计算机程序指令被处 理器读取并运行时, 执 行如权利要求1 ‑7中任一项所述的方法。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序指令, 所述计算机程序指 令被处理器读取并运行时, 执行如权利要求 1‑7中任一项 所述 的方法。 10.一种电子设备, 其特征在于, 包括: 存储器以及处理器, 所述存储器中存储有计算机 程序指令, 所述计算机程序指 令被所述处理器读取并运行时, 执行权利要求 1‑7中任一项 所 述的方法。权 利 要 求 书 2/2 页 3 CN 115482377 A 3

.PDF文档 专利 图像处理方法、计算机程序产品、存储介质及电子设备

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像处理方法、计算机程序产品、存储介质及电子设备 第 1 页 专利 图像处理方法、计算机程序产品、存储介质及电子设备 第 2 页 专利 图像处理方法、计算机程序产品、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:13:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。