说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111677068.X (22)申请日 2021.12.31 (71)申请人 特斯联科技 集团有限公司 地址 101100 北京市通州区滨惠北一 街3号 院1号楼1- 6室 (72)发明人 冯琰一 徐博诚 聂虎 周涛 (74)专利代理 机构 北京辰权知识产权代理有限 公司 11619 专利代理师 李小朋 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种行为识别方法、 装置、 存 储介质及终端 (57)摘要 本发明公开了一种行为识别方法、 装置、 存 储介质及终端, 方法包括: 获取待识别的目标图 像; 根据目标图像生成人体图像以及人体各个部 位图像; 将目标图像、 人体图像以及人体各个部 位图像输入预先训练的行为识别模型中; 其中, 预先训练的行为识别模型是基于标注身体部位 编码的行为图像训练生成的; 输出人体图像的人 体部位以及人体部位对应的行为。 由于本申请采 用标注身体部位编码的行为图像训练行为识别 模型, 使得模 型能充分捕获身体部位级别的相关 细粒度知识, 同时导致模型容易泛化, 从而提升 了模型的识别性能。 权利要求书2页 说明书12页 附图2页 CN 114511877 A 2022.05.17 CN 114511877 A 1.一种行为识别方法, 其特 征在于, 所述方法包括: 获取待识别的目标图像; 根据所述目标图像生成人体图像以及人体各个部位图像; 将所述目标图像、 人体图像以及人体各个部位图像输入预先训练的行为识别模型中; 其中, 所述预 先训练的行为识别模型 是基于标注身体部位编码的行为图像训练生成的; 输出所述人体图像的人体部位以及所述人体部位对应的行为。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述目标图像生成人体图像以及 人体各个部位图像, 包括: 将所述目标图像输入物体 检测器中, 输出 所述目标图像中的人体框坐标; 根据所述人体框坐标截取人体图像, 并将所述人体图像输入预先训练 的姿态估计网络 中, 输出人体各个部位框; 基于所述人体各个部位框截取 人体各个部位图像。 3.根据权利要求1所述的方法, 其特征在于, 按照以下步骤生成预先训练 的行为识别模 型, 包括: 收集以人为中心 的行为图像, 并对以人为中心 的行为图像标注身体部位编码, 得到原 始行为识别数据集; 从所述原始行为识别数据集中划分出训练集, 并调整所述训练集中图像的亮度, 得到 模型训练样本; 将所述模型训练样本进行 数据增强, 得到增强后的数据样本; 采用复合主干网络创建行为识别模型, 并根据增强后的数据样本以及所述行为识别模 型进行身体部位状态 识别和特 征提取, 得到身体部位状态 识别结果和身体部位特 征; 根据所述身体部位状态 识别结果和身体部位特 征计算目标损失值; 当所述目标损失值到 达预设阈值时, 生成预 先训练的行为识别模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述身体部位状态识别结果和身 体部位特 征计算目标损失值, 包括: 根据所述身体部位特 征计算所述身体部位动作评分; 根据所述身体部位状态 识别结果与所述身体部位动作评分计算出 预测概率分布; 获取增强后的数据样本的真实概 率分布和预 先标记的真实框坐标; 根据所述预测概 率分布与所述真实概 率分布计算第一交叉熵损失值; 根据所述预 先标记的真实框坐标计算第二交叉熵损失值; 基于所述第一交叉熵损失值和所述第二交叉熵损失值计算出目标损失值。 5.根据权利要求3所述的方法, 其特征在于, 所述当所述目标损 失值到达预设阈值时, 生成预先训练的行为识别模型, 包括: 当所述目标损失值未到达预设阈值 时, 将所述目标损失值进行反 向传播以更新模型的 参数, 并继续执 行所述将所述模型训练样本进行 数据增强, 得到增强后的数据样本的步骤。 6.根据权利要求2所述的方法, 其特征在于, 所述对以人为中心的行为图像标注身体部 位编码, 得到原 始行为识别数据集, 包括: 根据预设行为 参数从收集的行为图像中选择 预设数量的预处 理图像; 计算所述预处 理图像中身体部位的坐标值;权 利 要 求 书 1/2 页 2 CN 114511877 A 2根据所述身体部位的坐标值对以人为中心的行为图像标注身体部位编码, 得到原始行 为识别数据集。 7.根据权利要求2所述的方法, 其特征在于, 所述将所述模型训练样本进行数据增强, 得到增强后的数据样本, 包括: 对所述模型训练样本进行归一 化处理, 得到归一 化后的训练样本; 采用仿射变换 方法将归一 化后的训练样本缩放 为多种尺度, 得到缩放后的数据样本; 采用仿射变换 方法将缩放后的数据样本进行旋转增强, 得到增强后的数据样本 。 8.一种行为识别装置, 其特 征在于, 所述装置包括: 图像获取模块, 用于获取待识别的目标图像; 图像生成模块, 用于根据所述目标图像生成人体图像以及人体各个部位图像; 图像输入模块, 用于将所述目标图像、 人体图像以及人体各个部位图像输入预先训练 的行为识别模型中; 其中, 所述预先训练的行为识别模型是基于标注身体部位编码的行为 图像训练生成的; 行为输出模块, 用于 输出所述人体图像的人体部位以及所述人体部位对应的行为。 9.一种计算机存储介质, 其特征在于, 所述计算机存储介质存储有多条指令, 所述指令 适于由处 理器加载并执 行如权利要求1 ‑7任意一项的方法步骤。 10.一种终端, 其特征在于, 包括: 处理器和存储器; 其中, 所述存储器存储有计算机程 序, 所述计算机程序适于由所述处 理器加载并执 行如权利要求1 ‑7任意一项的方法步骤。权 利 要 求 书 2/2 页 3 CN 114511877 A 3
专利 一种行为识别方法、装置、存储介质及终端
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 00:19:06
上传分享
举报
下载
原文档
(692.7 KB)
分享
友情链接
GB 7260.1-2008 不间断电源第1-1部分 一般规定和安全要求.pdf
GB-T 1425-2021 贵金属及其合金熔化温度范围的测定 热分析试验方法.pdf
T-CSTM 00790.4—2022 汽车用薄钢板 第4部分:双向拉伸试验十字形拉伸试样.pdf
DB52-T 1239.1-2017 政府数据 核心元数据 第1部分:人口基础数据 贵州省.pdf
GB-T 30976.1-2014 信息安全技术 工业控制系统信息安全 第1部分:评估规范.pdf
法律法规 中华人民共和国电信条例2016-02-06.pdf
GB-T 8013.1-2018 铝及铝合金阳极氧化膜与有机聚合物膜 第1部分:阳极氧化膜.pdf
GB-T 16508.7-2022 锅壳锅炉 第7部分:安装.pdf
GB-T 30582-2014 基于风险的埋地钢质管道外损伤检验与评价.pdf
GB-T 16746-2018 锌合金铸件.pdf
T-ZGCMITT 004—2021 DSA引导微创手术室配置要求.pdf
GB-T 28458-2020 信息安全技术 网络安全漏洞标识与描述规范.pdf
GB-T 25977-2022 除雪车.pdf
资产管理 数据资产确权登记导则.pdf
GB-T 13989-2012 国家基本比例尺地形图分幅和编号.pdf
DB11-T 1536-2018 水泵节能监测 北京市.pdf
T-CPUMT 001—2022 工业信息安全应急处置工具箱.pdf
DB32-T 3702-2019 江苏省日照分析技术规程 江苏省.pdf
GB-T 3795-2014 锰铁.pdf
GB-Z 31103-2014 系统工程 GB-T 22032 系统生存周期过程 应用指南.pdf
1
/
3
17
评价文档
赞助1.5元 点击下载(692.7 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。