专利一种模型训练、手势识别方法、装置、设备及介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111636204.0 (22)申请日 2021.12.2 9 (71)申请人苏州臻迪智能科技有限公司地址 215500 江苏省苏州市常熟高新技术产业开发区珠泾路15号3幢 (72)发明人毛宁　 (74)专利代理机构北京同达信恒知识产权代理有限公司 1 1291 代理人李迪 (51)Int.Cl. G06V 40/10(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01)G06V 10/774(2022.01) G06V 10/82(2022.01) (54)发明名称一种模型训练、手势识别方法、装置、设备及介质 (57)摘要本发明公开了一种模型训练、手势识别方法、装置、设备及介质，由于在本发明实施例中，在训练手势识别模型时，基于手势识别模型中的至少两个损失网络，分别确定各个损失网络各自对应的损失函数值，根据至少两个损失网络各自对应的损失函数值，确定联合损失函数值，基于联合损失函数值对手势识别模型进行训练。在不增加网络层数的前提下，联合至少两个损失网络监督训练网络，可以显著提高手势识别模型的精度，进而在有限算力下提高手势识别的精度。权利要求书2页说明书10页附图3页 CN 114332933 A 2022.04.12 CN 114332933 A 1.一种手势识别模型训练方法，其特征在于，所述方法包括：获取样本集中的手势样本图像，将所述手势样本图像输入手势识别模型中的至少两个损失网络；针对所述至少两个损失网络，基于该损失网络确定所述手势样本图像对应的训练手势标签，并根据所述训练手势标签和该损失网络下所述手势样本图像对应的真实手势标签，确定该损失网络对应的损失函数值；根据所述至少两个损失网络各自对应的损失函数值，确定联合损失函数值，基于所述联合损失函数值对所述手势识别模型进行训练。 2.如权利要求1所述的方法，其特征在于，所述至少两个损失网络包括至少两个相同类型的损失网络，其中，所述至少两个相同类型的损失网络的分类细粒度不同；或所述至少两个损失网络包括至少一个分类损失网络和至少一个回归损失网络。 3.如权利要求1所述的方法，其特征在于，所述方法还包括：基于所述手势识别模型中的特征提取网络，对所述手势样本图像进行特征提取，得到手势样本特征图；分别将所述手势样本特征图输入所述手势识别模型中的至少两个损失网络。 4.如权利要求1所述的方法，其特征在于，所述根据所述至少两个损失网络各自对应的损失函数值，确定联合损失函数值包括：根据所述至少两个损失网络各自对应的损失函数值，确定每个类型的损失网络对应的目标损失函数值；根据所述每个类型的损失网络对应的目标损失函数值和损失融合权重，对所述每个类型的损失网络对应的目标损失函数值进行加权求和，得到所述联合损失函数值。 5.如权利要求4所述的方法，其特征在于，所述根据所述至少两个损失网络各自对应的损失函数值，确定每个类型的损失网络对应的目标损失函数值包括：将所述至少两个损失网络按照类型进行划分；针对每个类型的各个损失网络，基于该类型的各个损失网络各自对应的损失函数值的和值，确定该类型的损失网络对应的目标损失函数值。 6.一种基于权利要求1至5任一项训练得到的手势识别模型的手势识别方法，其特征在于，所述方法包括：获取待识别图像，其中，所述待识别图像中包含待识别的手势；将所述待识别图像输入预先训练完成的手势识别模型，基于所述手势识别模型，识别所述待识别图像中的手势。 7.一种手势识别模型训练装置，其特征在于，所述装置包括：输入模块，用于获取样本集中的手势样本图像，将所述手势样本图像输入手势识别模型中的至少两个损失网络；确定模块，用于针对所述至少两个损失网络，基于该损失网络确定所述手势样本图像对应的训练手势标签，并根据所述训练手势标签和该损失网络下所述手势样本图像对应的真实手势标签，确定该损失网络对应的损失函数值；训练模块，用于根据所述至少两个损失网络各自对应的损失函数值，确定联合损失函数值，基于所述联合损失函数值对所述手势识别模型进行训练。权　利　要　求　书 1/2 页 2 CN 114332933 A 28.一种基于权利要求7所述的手势识别模型训练装置的手势识别装置，其特征在于，所述装置包括：获取模块，用于获取待识别图像，其中，所述待识别图像中包含待识别的手势；识别模块，用于将所述待识别图像输入预先训练完成的手势识别模型，基于所述手势识别模型，识别所述待识别图像中的手势。 9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现权利要求1 ‑5任一项所述的手势识别模型训练方法步骤，或实现权利要求6所述的手势识别方法步骤。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时，实现权利要求 1‑5任一项所述的手势识别模型训练方法步骤，或实现权利要求6所述的手势识别方法步骤。权　利　要　求　书 2/2 页 3 CN 114332933 A 3

专利 一种模型训练、手势识别方法、装置、设备及介质

专利一种模型训练、手势识别方法、装置、设备及介质