说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210893712.5 (22)申请日 2022.07.27 (65)同一申请的已公布的文献号 申请公布号 CN 114972958 A (43)申请公布日 2022.08.30 (73)专利权人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 杨黔生 (74)专利代理 机构 北京市汉坤律师事务所 11602 专利代理师 姜浩然 吴丽丽 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/25(2022.01)G06V 10/40(2022.01) G06V 10/80(2022.01) G06V 20/64(2022.01) 审查员 黄剑芳 (54)发明名称 关键点检测方法、 神经网络的训练方法、 装 置和设备 (57)摘要 本公开提供了一种关键点检测方法、 神经网 络的训练方法、 装置和设备, 涉及人工智能领域, 具体涉及图像处理、 计算机视觉和深度学习等技 术领域, 可应用于3D视觉、 增强现实、 虚拟现实等 场景。 关键点检测方法包括: 获取关于目标图像 的多个图像, 针对每一个图像, 在该图像中确定 与目标对象对应的多个关键点; 获取多个关键点 各自的表征在图像中的二维位置的二维信息; 基 于多个关键点各自的二维信息, 确定与该图像对 应的第一特征; 以及针对多个图像中的每一个图 像, 利用神经网络基于与多个图像对应的多个第 一特征强化与该图像对应的第一特征, 以得到与 该图像对应的第二特征; 以及基于第二特征, 确 定该图像中的多个关键点各自的表征三维坐标 的三维信息 。 权利要求书5页 说明书15页 附图7页 CN 114972958 B 2022.10.04 CN 114972958 B 1.一种关键点检测方法, 其特 征在于, 所述方法包括: 获取多个图像, 所述多个图像是对目标对象进行 连续拍摄而得到的; 针对所述多个图像中的每一个图像, 在该图像中确定与所述目标对象对应的多个关键点; 获取所述多个关键点各自的二维信 息, 所述二维信 息表征对应的关键点在该图像 中的 二维位置; 基于所述多个关键点各自的二维信息, 确定与该图像对应的第一特 征; 利用神经网络基于所确定的与所述多个图像对应的多个第一特征强化与该图像对应 的第一特 征, 以得到与该图像对应的第二特 征; 以及 基于所述第二特征, 确定该图像中的多个关键点各自的三维信息, 所述三维信息表征 对应的关键点在所述目标对象所在的场景中的三维位置 。 2.根据权利要求1所述的方法, 其特征在于, 所述神经网络包括空间强化子网络, 其中, 基于所述多个关键点各自的二维信息, 确定与该图像对应的第一特 征, 包括: 针对所述多个关键点中的每一个关键点, 基于该关键点的二维信 息确定该关键点的关 键点特征; 针对所述多个关键点中的每一个关键点, 利用所述空间强化子网络基于所确定的与 所 述多个关键点对应的多个关键点特征强化该关键点的关键点特征, 以得到该关键点的强化 后的关键点特 征; 以及 基于所述多个关键点各自的强化后的关键点特 征, 确定与该图像对应的第一特 征。 3.根据权利要求2所述的方法, 其特征在于, 其中, 针对所述多个关键点中的每一个关 键点, 利用所述空间强化子网络基于所确定的与所述多个关键点对应的多个关键点特征强 化该关键点的关键点特 征, 以得到该关键点的强化后的关键点特 征, 包括: 利用所述空间强化子网络基于自注意力机制对与所述多个关键点对应的多个关键点 特征进行强化, 以得到所述多个关键点各自的强化后的关键点特 征。 4.根据权利要求2或3所述的方法, 其特征在于, 基于所述多个关键点各自的强化后的 关键点特 征, 确定与该图像对应的第一特 征, 包括: 将所述多个关键点各自的强化后的关键点特征进行拼接, 以得到与 该图像对应的第 一 特征。 5.根据权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述二维信 息包括以下中的至 少一个: 对应的关键点的二维坐标; 或 对应的关键点的二维坐标相对于对应的图像中的其 他关键点的二维坐标的偏差 。 6.根据权利要求5所述的方法, 其特征在于, 针对多个图像中的每一个图像, 获取所述 多个关键点各自的二维信息, 包括: 针对所述多个图像中的每一个图像, 获取该图像中的多个关键点中各自的图像坐标; 以及 基于该图像中的多个关键点在该图像中的位置或尺寸中的至少一个, 对该图像中的多 个关键点各自的图像坐标进行归一 化, 以得到该图像中的多个关键点各自的二维坐标。 7.根据权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述神经网络包括 时序强化子权 利 要 求 书 1/5 页 2 CN 114972958 B 2网络, 其中, 利用神经网络基于所确定的与所述多个图像对应的多个第一特征强化与该图 像对应的第一特 征, 以得到与该图像对应的第二特 征, 包括: 利用所述时序强化子网络基于自注意力机制对与所述多个图像对应的多个第一特征 进行强化, 以得到所述多个图像各自对应的第二特 征。 8.根据权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述多个图像的拍摄视角相 同。 9.根据权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述目标对象为人体, 所述多 个图像中的每一个图像的多个关键点对应预 先确定的多个人体部位。 10.一种神经网络的训练方法, 其特 征在于, 所述方法包括: 针对连续的多个第 一时刻中的每一个第 一时刻, 获取在该第 一时刻与目标对象对应的 多个关键点各自的真实三 维信息和 第一样本二维信息, 所述真实三 维信息表征对应的关键 点在所述目标对象所在的场景中的三 维位置, 所述第一样本二维信息表征对应的关键点在 第一平面上的投影的二维位置; 以及 将所述第一样本二维信 息作为对应的关键点的目标二维信 息, 将所述多个第 一时刻作 为多个目标时刻, 并将所述神经网络作为目标神经网络, 以执 行以下训练操作: 针对所述多个目标时刻中的每一个目标时刻, 基于在该目标时刻与 所述目标对象对应 的多个关键点各自的目标二维信息, 确定与该目标时刻对应的第一特 征; 利用所述神经网络基于所确定的与所述多个目标时刻对应的多个第一特征强化与该 目标时刻对应的第一特 征, 以得到与该目标时刻对应的第二特 征; 基于与该目标时刻对应的第 二特征, 确定在该目标时刻与所述目标对象对应的多个关 键点各自的预测三维信息; 以及 基于在所述多个目标时刻中的每一个目标时刻与所述目标对象对应的多个关键点各 自的真实三维信息和预测三维信息, 调整所述 目标神经网络的参数, 以得到训练后的神经 网络。 11.根据权利要求10所述的方法, 其特 征在于, 所述方法还 包括: 针对所述多个第 一时刻中的每一个第 一时刻, 获取在该第 一时刻与目标对象对应的多 个关键点各自的第二样本二 维信息, 所述第二样本二 维信息表征对应的关键点在不同于所 述第一平面的第二平面上的投影的二维位置; 以及 将所述第二样本二维信 息作为对应的关键点的目标二维信 息, 将所述多个第 一时刻作 为多个目标时刻, 并将所述神经网络作为目标神经网络, 以执 行所述训练操作。 12. 根据权利要求10所述的方法, 其特 征在于, 所述方法还 包括: 在所述多个第一时刻中确定多个第二时刻; 以及 将所述第一样本二维信 息作为对应的关键点的目标二维信 息, 将所述多个第 二时刻作 为多个目标时刻, 并将所述神经网络作为目标神经网络, 以执 行所述训练操作。 13.根据权利要求10 ‑12中任一项所述的方法, 其特征在于, 所述神经网络包括空间强 化子网络, 其中, 针对所述多个目标时刻中的每一个目标时刻, 基于在该目标时刻与所述目 标对象对应的多个关键点各自的目标二维信息, 确定与该目标时刻对应的第一特 征, 包括: 针对所述多个目标时刻中的每一个目标时刻, 针对多个目标关键点中的每一个目标关键点, 基于该目标关键点的目标二维信 息确定权 利 要 求 书 2/5 页 3 CN 114972958 B 3
专利 关键点检测方法、神经网络的训练方法、装置和设备
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 10:13:31
上传分享
举报
下载
原文档
(876.7 KB)
分享
友情链接
ISO 9136-2 1999 Abrasive grains — Determination of bulk density — Part 2 Microgrits.pdf
ISO 7485 2000 Animal feeding stuffs Determination of potassium and sodium contents Methods using flame-emission spectrometry.pdf
ISO 4333 2022 Textiles Determination of reduction activity of specific proteins derived from pollen mite and other sources on textile products.pdf
GBT 17671-2021 水泥胶砂强度检验方法(ISO法).pdf
ISO 11346 2023 Rubber, vulcanized or thermoplastic — Estimation of life-time and maximu.pdf
ISO 21474-1 2020 In vitro diagnostic medical devices Multiplex molecular testing for nucleic acids Part 1 Terminology and general requirements for nucleic acid quality evaluation.pdf
ISO IEC 30113-5 2019 Information technology — User interface — Gesture-based interfaces across devices and methods — Part 5 Gesture Interface Markup Language (GIML).pdf
ISO 780 2015 Packaging — Distribution packaging — Graphical symbols for handling and storage of packages.pdf
ISO 11199-2 2021 Assistive products for walking manipulated by both arms — Requirements and test methods — Part 2 Rollators.pdf
ISO TS 5594 2022 Soil and water quality — Guidance and requirements for designing an interlaboratory trial for validation of biotests.pdf
GB-T 30597-2014 燃气燃烧器和燃烧器具用安全和控制装置通用要求.pdf
GB-T 21765-2008 化学品 亚慢性吸入毒性试验方法.pdf
GB-T 23331-2020 能源管理体系 要求及使用指南.pdf
GB-T 12604.3-2013 无损检测 术语 渗透检测.pdf
GB-T 7531-2008 有机化工产品灼烧残渣的测定.pdf
GB-T 6476-2021 立轴矩台平面磨床 精度检验.pdf
GB-T 3903.16-2008 鞋类 帮面、衬里和内垫试验方法 耐磨性能.pdf
GB-T 22064-2008 显微镜 35mm 单反照相机镜头的接口.pdf
GB-T 3163-2024 真空技术 术语.pdf
GB-Z 18039.5-2003 电磁兼容 环境 公用供电系统低频传导骚扰及信号传输的电磁环境.pdf
1
/
3
28
评价文档
赞助1.5元 点击下载(876.7 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。