说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111636204.0 (22)申请日 2021.12.2 9 (71)申请人 苏州臻迪智能科技有限公司 地址 215500 江苏省苏州市 常熟高新 技术 产业开发区珠泾路15号3幢 (72)发明人 毛宁  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 代理人 李迪 (51)Int.Cl. G06V 40/10(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01)G06V 10/774(2022.01) G06V 10/82(2022.01) (54)发明名称 一种模型训练、 手势识别方法、 装置、 设备及 介质 (57)摘要 本发明公开了一种模型训练、 手势识别方 法、 装置、 设备及介质, 由于在本发明实施例中, 在训练手势识别模型时, 基于手势识别模型中的 至少两个损失网络, 分别确定各个损失 网络各自 对应的损失函数值, 根据至少两个损失 网络各自 对应的损失函数值, 确定联合损失函数值, 基于 联合损失函数值对手势识别模型进行训练。 在不 增加网络层数的前提下, 联合至少两个损失网络 监督训练网络, 可以显著提高手势识别模型的精 度, 进而在有限算力下提高手势 识别的精度。 权利要求书2页 说明书10页 附图3页 CN 114332933 A 2022.04.12 CN 114332933 A 1.一种手势 识别模型训练方法, 其特 征在于, 所述方法包括: 获取样本集中的手势样本图像, 将所述手势样本图像输入手势识别模型中的至少两个 损失网络; 针对所述至少两个损失网络, 基于该损失网络确定所述手势样本图像对应的训练手势 标签, 并根据所述训练手势标签和该损失网络下所述手势样本图像对应的真实手势标签, 确定该损失网络对应的损失函数值; 根据所述至少两个损 失网络各自对应的损 失函数值, 确定联合损 失函数值, 基于所述 联合损失函数值对所述手势 识别模型进行训练。 2.如权利要求1所述的方法, 其特征在于, 所述至少两个损失网络包括至少两个相同类 型的损失网络, 其中, 所述至少两个相同类型的损失网络的分类细粒度不同; 或 所述至少两个损失网络包括至少一个分类损失网络和至少一个回归损失网络 。 3.如权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 基于所述手势识别模型中的特征提取网络, 对所述手势样本 图像进行特征提取, 得到 手势样本特征图; 分别将所述手势样本特征图输入所述手势识别模型中的至少两个损失网 络。 4.如权利要求1所述的方法, 其特征在于, 所述根据 所述至少两个损失网络各自对应的 损失函数值, 确定联合损失函数值包括: 根据所述至少两个损失网络各自对应的损失函数值, 确定每个类型的损失网络对应的 目标损失函数值; 根据所述每个类型的损失网络对应的目标损失函数值和损失融合权重, 对所述每个类 型的损失网络对应的目标损失函数值进行加权求和, 得到所述联合损失函数值。 5.如权利要求4所述的方法, 其特征在于, 所述根据 所述至少两个损失网络各自对应的 损失函数值, 确定每 个类型的损失网络对应的目标损失函数值包括: 将所述至少两个损失网络按照类型进行划分; 针对每个类型的各个损失网络, 基于该类型的各个损失网络各自对应的损失函数值的 和值, 确定该类型的损失网络对应的目标损失函数值。 6.一种基于权利要求1至5任一项训练得到的手势识别模型的手势识别方法, 其特征在 于, 所述方法包括: 获取待识别图像, 其中, 所述待识别图像中包 含待识别的手势; 将所述待识别图像输入预先训练完成的手势识别模型, 基于所述手势识别模型, 识别 所述待识别图像中的手势。 7.一种手势 识别模型训练装置, 其特 征在于, 所述装置包括: 输入模块, 用于获取样本集中的手势样本 图像, 将所述手势样本 图像输入手势识别模 型中的至少两个损失网络; 确定模块, 用于针对所述至少两个损 失网络, 基于该损 失网络确定所述手势样本 图像 对应的训练手势标签, 并根据所述训练手势标签和该损失网络下所述手势样本图像对应的 真实手势标签, 确定该损失网络对应的损失函数值; 训练模块, 用于根据所述至少两个损 失网络各自对应的损 失函数值, 确定联合损 失函 数值, 基于所述联合损失函数值对所述手势 识别模型进行训练。权 利 要 求 书 1/2 页 2 CN 114332933 A 28.一种基于权利要求7所述的手势识别模型训练装置的手势识别装置, 其特征在于, 所 述装置包括: 获取模块, 用于获取待识别图像, 其中, 所述待识别图像中包 含待识别的手势; 识别模块, 用于将所述待识别图像输入预先训练完成的手势识别模型, 基于所述手势 识别模型, 识别所述待识别图像中的手势。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1 ‑5任一项所述的手势识别 模型训练方法步骤, 或实现权利要求6所述的手势 识别方法步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质内存储有计算机 程序, 所述计算机程序被处理器执行时, 实现权利要求 1‑5任一项所述的手势识别模型训练 方法步骤, 或实现权利要求6所述的手势 识别方法步骤。权 利 要 求 书 2/2 页 3 CN 114332933 A 3

.PDF文档 专利 一种模型训练、手势识别方法、装置、设备及介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种模型训练、手势识别方法、装置、设备及介质 第 1 页 专利 一种模型训练、手势识别方法、装置、设备及介质 第 2 页 专利 一种模型训练、手势识别方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:42:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。