专利训练多尺度网络模型的方法及人脸关键点检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211228821.1 (22)申请日 2022.10.09 (71)申请人珠海大横琴科技发展有限公司地址 519000 广东省珠海市横琴新区海河街33号一单元1-7层 (72)发明人林旭新　梁延研　魏红强　郑皓文　 (74)专利代理机构深圳市六加知识产权代理有限公司 4 4372 专利代理师孟丽平 (51)Int.Cl. G06V 40/16(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/52(2022.01) G06V 10/82(2022.01) (54)发明名称训练多尺度网络模型的方法及人脸关键点检测方法 (57)摘要本申请实施例涉及神经网络技术领域，公开了一种训练多尺度网络模型的方法及人脸关键点检测方法。其中，所述训练多尺度网络模型的方法包括：将第一样本图像输入多尺度神经网络模型，获得第一人脸关键点预测图像，所述多尺度神经网络模型包括特征提取模块、组合模块和预测模块；利用损失函数计算所述第一人脸关键点预测图像和所述第一样本图像的真实关键点图像之间的损失，对所述多尺度神经网络模型进行迭代训练，直至收敛，得到多尺度网络模型。本申请能够实现多尺度特征图的动态组合，获得更具识别能力的特征表达，获得的多尺度网络模型保证较好的检测性能上限，可以减少网络内存占用和加速计算，且利于提高人脸关键点的精确定位。权利要求书3页说明书16页附图5页 CN 115376195 A 2022.11.22 CN 115376195 A 1.一种训练多尺度网络模型的方法，其特征在于，所述方法包括：将第一样本图像输入多尺度神经网络模型，获得第一人脸关键点预测图像，所述多尺度神经网络模型包括特征提取模块、组合模块和预测模块，所述特征提取模块用于提取多尺度特征图，所述多尺度包括多通道和/或多分辨率，所述组合模块用于基于权重参数加权组合所述多尺度特征图中的至少两个以获取新特征图，所述预测模块用于对所述新特征图进行人脸关键点预测，以获取所述第一人脸关键点预测图像；利用损失函数计算所述第一人脸关键点预测图像和所述第一样本图像的真实关键点图像之间的损失，对所述多尺度神经网络模型进行迭代训练，直至收敛，得到多尺度网络模型；其中，所述损失函数包括第一损失和第二损失，所述第一损失为所述第一人脸关键点预测图像和所述第一样本图像的真实关键点图像之间的误差，所述第二损失为与各所述权重参数绝对值之和的乘积，为正则化的权重。 2.根据权利要求1所述的方法，其特征在于，所述方法还包括：将所述多尺度网络模型的各所述权重参数中小于第一剪枝阈值的权重参数置为0，以获得第一轻量级网络模型。 3.根据权利要求2所述的方法，其特征在于，所述方法还包括：将所述多尺度网络模型作为第一教师模型，且将第二样本图像输入所述多尺度网络模型，获得第二人脸关键点预测图像作为软标签；将所述第二样本图像输入所述第一轻量级网络模型，获得第三人脸关键点预测图像；计算所述第二人脸关键点预测图像和所述第三人脸关键点预测图像之间的损失，对所述第一轻量级网络模型进行迭代训练，直至收敛，得到第二轻量级网络模型。 4.根据权利要求2所述的方法，其特征在于，所述方法还包括：获取所述第一轻量级网络模型的第一对偶网络模型；将第三样本图像输入所述第一轻量级网络模型，获得第四人脸关键点预测图像；将所述第三样本图像输入所述第一对偶网络模型，获得第五人脸关键点预测图像；计算所述第四人脸关键点预测图像和所述第五人脸关键点预测图像之间的第一对偶损失，以及计算所述第五人脸关键点预测图像和所述第四人脸关键点预测图像之间的第二对偶损失；利用所述第一对偶损失对所述第一轻量级网络模型进行迭代训练，直至收敛，得到第三轻量级网络模型；利用所述第二对偶损失对所述第一对偶网络模型进行迭代训练，直至收敛，得到第四轻量级网络模型。 5.根据权利要求2所述的方法，其特征在于，所述方法还包括：获取所述第一轻量级网络模型的第二对偶网络模型；将所述多尺度网络模型作为第二教师模型，且将第四样本图像输入所述多尺度网络模型，获得第六人脸关键点预测图像作为软标签；将所述第四样本图像输入所述第一轻量级网络模型，获得第七人脸关键点预测图像；将所述第四样本图像输入所述第二对偶网络模型，获得第八人脸关键点预测图像；计算所述第七人脸关键点预测图像和所述第八人脸关键点预测图像之间的第一蒸馏权　利　要　求　书 1/3 页 2 CN 115376195 A 2损失，以及计算所述第八人脸关键点预测图像和所述第七人脸关键点预测图像之间的第二蒸馏损失；计算所述第六人脸关键点预测图像和所述第七人脸关键点预测图像之间的第三蒸馏损失，以及计算所述第六人脸关键点预测图像和所述第八人脸关键点预测图像之间的第四蒸馏损失；计算所述第七人脸关键点预测图像和所述第四样本图像的真实关键点图像之间的第一误差损失，以及所述第八人脸关键点预测图像和所述第四样本图像的真实关键点图像之间的第二误差损失；利用所述第一蒸馏损失、所述第三蒸馏损失和所述第一误差损失之和对所述第一轻量级网络模型进行迭代训练，直至收敛，得到第五轻量级网络模型；利用所述第二蒸馏损失、所述第四蒸馏损失和所述第二误差损失之和对所述第一轻量级网络模型的第二对偶网络模型进行迭代训练，直至收敛，得到第六轻量级网络模型。 6.根据权利要求5所述的方法，其特征在于，所述将所述第四样本图像输入所述第一轻量级网络模型，获得第七人脸关键点预测图像，包括：对所述第一轻量级网络模型中的卷积层执行随机失活神经元操作，并输入所述第四样本图像，获得所述第七人脸关键点预测图像；所述将所述第四样本图像输入所述第一轻量级网络模型的第二对偶网络模型，获得第八人脸关键点预测图像，包括：对所述第一轻量级网络模型的第二对偶网络模型中的卷积层执行随机失活神经元操作，并输入所述第四样本图像，获得所述第八人脸关键点预测图像。 7.根据权利要求1至6任一项所述的方法，其特征在于，所述特征提取模块包括输入模块，至少一个第一常规模块、至少两个采样模块和至少两个第二常规模块；所述输入模块包括至少两个卷积层，所述卷积层包括第一卷积操作、第一批标准化操作及第一Relu激活操作，用于对所述第一样本图像进行特征编码以及降低分辨率；所述第一常规模块和所述第二常规模块均包括至少两个卷积层，每个卷积层包括第二卷积操作、第二批标准化操作及第二Relu激活操作，所述第一常规模块用于对所述输入模块输出的特征图进行连续编码；所述至少两个采样模块，用于对所述第一常规模块输出的特征图进行多种方式采样，获得多个通道和多个分辨率的特征图；所述第二常规模块用于将所述采样模块输出的特征图进行连续编码，所述至少两个所述第二常规模块输出所述多尺度特征图。 8.根据权利要求7所述的方法，其特征在于，所述组合模块还用于获取第i个所述常规模块输出的第j 个第二新特征图后，将第 j个第二新特征图乘以一个对应的权重参数并进行求和，获得中间新特征图；所述多尺度网络模型还包括输出模块，用于融合多个所述组合模块输出的中间新特征图；所述预测模块，还用于对所述中间新特征图进行人脸关键点预测，以获取第一人脸关键点预测图像。 9.一种人脸关键点检测方法，其特征在于，所述方法包括：权　利　要　求　书 2/3 页 3 CN 115376195 A 3

专利 训练多尺度网络模型的方法及人脸关键点检测方法

专利训练多尺度网络模型的方法及人脸关键点检测方法