说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210381360.5 (22)申请日 2022.04.12 (71)申请人 杭州电子科技大 学 地址 310018 浙江省杭州市下沙高教园区2 号大街 申请人 杭州电子科技大 学信息工程学院 (72)发明人 张海平 刘旭 马琮皓 胡泽鹏  管力明 施月玲  (74)专利代理 机构 杭州君度专利代理事务所 (特殊普通 合伙) 33240 专利代理师 杨天娇 (51)Int.Cl. G06V 40/10(2022.01) G06V 20/40(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于多流多尺度膨胀时空图卷积网络的骨 架动作识别方法 (57)摘要 本发明公开了基于多流多尺度膨胀时空图 卷积网络的骨架动作识别方法, 包括: 获取人体 行为视频并预处理; 从预处理后的视频中提取每 帧图像的人体骨架数据形成骨架序列; 填充骨架 序列形成新的骨架序列; 基于新的骨架序列获取 每帧图像的二阶信息数据; 基于二阶信息数据的 类别和新的骨架序列分别对应建立训练集和标 签; 建立膨胀时空图卷积网络模型; 将各类训练 集和标签输入膨胀时空图卷积网络模型进行训 练; 将待识别的视频建立训练集后输入预训练好 的模型, 获取的融合结果即为最终预测结果。 该 方法可更好地获取网络不同层的语义信息, 并在 不增加计算量的情况下结合数量更多、 特征更明 显的关节数据实现人体行为预测, 大大提高人体 行为的预测精确度。 权利要求书3页 说明书9页 附图3页 CN 114821640 A 2022.07.29 CN 114821640 A 1.一种基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法, 其特征在于: 所述 基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法包括如下步骤: S1、 获取人体行为视频并进行 预处理; S2、 从预处理后的人体行为视频中提取每帧图像的人体骨架数据, 所述人体骨架数据 包括各关节对应的元组(X, Y, Z), 所有图像的人体骨架数据按照时间排序形成骨架序列 其中, X为对应关节的X坐标值, Y为对应关节的Y坐标值, Z为对应关节 的置信度或Z坐标值, v为关节向量, C为 坐标维度, T为时间, N 为关节点数; S3、 将在先获得的人体骨架数据填充至骨架序列V形成新的骨架序列V ’, 所述新的骨架 序列V’具有连续的预设帧数的人体骨架数据; S4、 基于新的骨架序列V ’获取每帧图像的二阶信息数据, 所述二阶信息数据包括eti、 ati、 mjoint, tj、 mbone, ti、 mjoint2, tj和mbone2, ti, 计算公式如下: eti=vti′ ‑vti mjoint, tj=v(t+1)j‑vtj mbone, ti=e(t+1)i‑eti mjoint2, tj=v(t+2)j‑vtj mbone2, ti=e(t+2)i‑eti 其中, eti为第t帧第i个骨骼的骨骼向量, vti为第t帧第i个骨骼上靠近骨架重心的源关 节坐标, vti′为第t帧第i个骨骼上远离骨架重心的目标关节坐标, atic为第t帧第i个骨骼的 骨骼向量在c方向分量上的角度, c∈{x, y, z}, ati=(atix, atiy, atiz), etic为第t帧第i个骨骼 的骨骼向量在c方 向分量的值, etix为第t帧第i个骨骼的骨骼向量在x方向分量的值, etiy为 第t帧第i个骨骼的骨骼向量在y方向分量的值, etiz为第t帧第i个骨骼的骨骼向量在z方向 分量的值, mjoint, tj为第j个关节在第t+1帧和第t帧的向量差, mbone, ti为第i个骨骼在第t+1帧 和第t帧的向量差, mjoint2, tj为第j个关节在第t+2帧和第t帧的向量差, mbone2, ti为第i个骨骼 在第t+2帧和第t帧的向量差, vtj为第t帧第j个关节的坐 标, v(t+1)j为第t+1帧第j个关节的坐 标, v(t+2)j为第t+2帧第j个关节的坐标, e(t+1)i为第t+1帧第i个骨骼的骨骼向量, e(t+2)i为第t +2帧第i个骨骼的骨骼向量; S5、 基于获取的 和新的骨架序列V ’七类数据分别对应建立 七类训练集和标签, 其中, e为每个骨骼的骨骼向量, a为每个骨骼的骨骼向量在x, y, z方向 分量上的角度, mjoint为每个关节在相邻帧图像的向量差, mjoint2为每个关节在间隔一帧图像 的向量差, mbone为每个骨骼在相邻帧图像的向量差, mbone2为每个骨骼在间隔一帧图像的向 量差;权 利 要 求 书 1/3 页 2 CN 114821640 A 2S6、 建立膨胀时空图卷积网络模型, 所述膨胀时空图卷积网络模型包括七个第一图卷 积网络和一个多分支特征融合单元, 所述第一图卷积网络包括依 次连接的第一BN层、 多尺 度图卷积模块、 全局平均池化层、 Dr opout层和softmax分类器, 所述多尺度图卷积模块包括 输出通道依次为64、 64、 64、 64、 128、 128、 128、 256、 256、 256的十层特征提取模块, 各层所述 特征提取模块包括依次连接的自适应空间域图卷积单元、 注意力单元和 时间域图卷积单 元, 所述膨胀时空图卷积网络模型还执 行如下操作; S61、 利用各 所述第一图卷积网络获取对应的初始预测结果和softmax分数; S62、 利用所述多分支特征融合单元计算各所述第一图卷积网络输出的初始预测结果 的权重系数αs, 公式如下: 其中, 表示每流初始预测结果组成的数组, 每流初始 预测结果的取值范围为0~1, Acu[n]表 示第n流识别准确度, Acu[s]表示第s流识别准确度, γ为0.001; S63、 将各softmax分数进行加权融合获取融合结果Result, 计算公式如下: 其中, rs为第s流的softmax分数; S7、 将各类所述训练集和标签一一对应输入所述膨胀时空图卷积网络模型的第 一图卷 积网络进行训练, 获取 预训练好的膨胀时空图卷积网络模型; S8、 将待识别的人体行为视频建立七类训练集后输入预训练好的膨胀时空图卷积网络 模型, 获取的融合结果Result即为 最终预测结果。 2.如权利要求1所述的基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法, 其 特征在于: 步骤S1 中, 所述预处理为将人体行为视频的分辨率调整为340 ×256, 帧率转换为 30FPS。 3.如权利要求1所述的基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法, 其 特征在于: 步骤S2中, 所述人体骨架数据基于Openpose姿态估计工具箱提取。 4.如权利要求1所述的基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法, 其 特征在于: 步骤S3中, 所述预设帧数为3 00帧。 5.如权利要求1所述的基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法, 其 特征在于: 所述时间域图卷积单元包括第一残差模块和依次连接的第一特征提取单元、 Concat函数和第二特征提取单元, 所述第一残差模块和第一特征提取单元的输入端与注 意 力单元连接, 所述第一残差模块的输出端与第二特征提取单元连接, 所述第二特征提取单 元用于执行相加操作, 所述第一特征提取单元包括并行 的六个第一分支单元、 一个第二分 支单元和 一个第三分支单元, 所述第一分支单元包括依 次连接的第一瓶颈层、 第一膨胀卷权 利 要 求 书 2/3 页 3 CN 114821640 A 3

.PDF文档 专利 基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法 第 1 页 专利 基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法 第 2 页 专利 基于多流多尺度膨胀时空图卷积网络的骨架动作识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:37:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。