说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111652041.5 (22)申请日 2021.12.3 0 (71)申请人 北京奕斯伟计算 技术有限公司 地址 100176 北京市大兴区北京经济技 术 开发区科创十街18号院3号楼1层101 室 (72)发明人 薛米生 周宇虹 黄远东 吕金刚  赵玉瑶 荆楠  (74)专利代理 机构 北京成创同维知识产权代理 有限公司 1 1449 专利代理师 蔡纯 张靖琳 (51)Int.Cl. G06V 40/20(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 动作识别方法及计算设备 (57)摘要 本申请公开了一种动作识别方法及计算设 备。 动作识别方法包括: 将图像数据发送至动作 识别模型, 以获得动作识别结果, 其中, 动作识别 模型是基于EfficientNet的基础网络结构构建 的新的EfficientNet识别网络模型, 新的 E f f i c i e n t N e t 识 别 网 络 模 型 修 改 了 EfficientNet的基础网络 结构中的模块、 层和运 算方向中的至少一个。 该训练方法选择了多个新 的EfficientNet识别网络模型中的一个作为动 作识别模型, 因此在动作识别过程中, 可 以提高 运算速度, 并保证运 算精度。 权利要求书2页 说明书7页 附图4页 CN 114511923 A 2022.05.17 CN 114511923 A 1.一种动作识别方法, 其特 征在于, 包括: 将图像数据发送至动作识别模型, 以获得动作识别结果, 其中, 所述动作识别模型是基于EfficientNet的基础网络结构构建的新的 EfficientNet识别网络模型, 所述新的EfficientNet识别网络模型修改了所述 EfficientNet的基础网络结构中的模块、 层和运 算方向中的至少一个。 2.根据权利要求1所述的动作识别方法, 其特征在于, 所述动作识别模块的训练方法包 括: 接收随机采样的表征多种动作类别的数据, 以获得训练集; 基于所述EfficientNet的基础网络结构分别构建多个新 的EfficientNet识别网络模 型; 基于所述训练集分别测试所述多个新的EfficientNet识别网络模型, 以得到多个测试 结果; 基于所述多个测试结果从所述多个新的EfficientNet识别网络模型选择其中之一作 为所述动作识别模型。 3.根据权利 要求2所述的动作识别方法, 其特征在于, 每个所述EfficientNet识别网络 模型包括多个移动翻转 瓶颈卷积模块、 2个卷积层、 1个全局平均池化层和1个分类层, 其中, 各个所述EfficientNet识别网络模型的输出分别与所述训练集所包含的类别数 匹配。 4.根据权利 要求3所述的动作识别方法, 其特征在于, 在多个所述EfficientNet识别网 络模型中, 所述移动翻转瓶颈卷积模块具有不完全相同的激活函数, 所述激活函数选自 sigmoid, tanh, ReLU, Leaky  ReLU, swish中的任意 一个或多个。 5.根据权利 要求3所述的动作识别方法, 其特征在于, 在多个所述EfficientNet识别网 络模型中, 所述移动翻转瓶颈卷积模块包括第一卷积、 第一批归一化层、 第一激活函数、 第 二卷积、 第二批归一化层、 第二激活函数、 全局平均池化层、 第三卷积、 第三激活函数、 第四 卷积、 第四激活函数、 数据融合、 第五卷积、 第二批归一 化层, 其中, 所述移动翻转 瓶颈卷积模块中的各个步骤可调。 6.根据权利 要求5所述的动作识别方法, 其特征在于, 在多个所述EfficientNet识别网 络模型中, 所述移动翻转瓶颈卷积模块进行数据融合的方法包括相乘、 相加或直接拼接成 数组。 7.根据权利 要求3所述的动作识别方法, 其特征在于, 在多个所述EfficientNet识别网 络模型中, 调整所述移动翻转 瓶颈卷积模块的卷积核大小、 卷积步长和输出通道。 8.根据权利 要求3所述的动作识别方法, 其特征在于, 在多个所述EfficientNet识别网 络模型中, 使用所述移动翻转 瓶颈卷积模块的次数不完全相同。 9.根据权利 要求1所述的动作识别方法, 其特征在于, 选择多个所述EfficientNet识别 网络模型中运 算速度最快的一个作为动作识别模型。 10.根据权利要求1所述的动作识别方法, 其特征在于, 还包括对所述动作识别结果进 行平滑处理, 所述平 滑处理包括: 若当前帧的链表长度不大于预定值, 则将当前帧的动作识别结果加入队列, 并输出空 值;权 利 要 求 书 1/2 页 2 CN 114511923 A 2若当前帧的链表长度大于预定值, 则从链表头部取出最先存入的动作识别结果, 将当 前帧的动作识别结果加入队列, 并统计队列中每种动作类别连续出现的最大次数, 当动作类别连续出现的最大次数不大于阈值时, 输出上一帧的动作识别结果, 当动作 类别连续出现的最大次数 大于阈值时, 更新并输出动作类别连续出现的最大次数。 11.一种计算设备, 包括: 一个或多个处 理器; 存储器; 以及 一个或多个程序, 其中所述一个或多个程序存储在所述存储器中并被配置为由所述一 个或多个处理器执行, 所述一个或多个程序包括用于执行如权利要求1 ‑8所述的动作识别 方法中的任一方法的指令 。权 利 要 求 书 2/2 页 3 CN 114511923 A 3

.PDF文档 专利 动作识别方法及计算设备

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 动作识别方法及计算设备 第 1 页 专利 动作识别方法及计算设备 第 2 页 专利 动作识别方法及计算设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:55:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。