专利神经网络模型的部署方法、装置、设备及存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111660692.9 (22)申请日 2021.12.3 0 (71)申请人科大讯飞股份有限公司地址 230088 安徽省合肥市高新区望江西路666号 (72)发明人张圆　殷保才　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 代理人鲁梅 (51)Int.Cl. G06N 3/063(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01) (54)发明名称神经网络模型的部署方法、装置、设备及存储介质 (57)摘要本申请实施例公开了一种神经网络模型的部署方法、装置、设备及存储介质，方法包括：获得电子设备的当前算力信息；至少根据包含多个神经网络模型的模型集合，获得与所述当前算力信息相匹配的目标模型；其中，所述模型集合中的神经网络模型的卷积核参数预先经过训练得到；将所述目标模型部署在所述电子设备上。可见，本申请中根据电子设备的当前算力信息为电子设备部署卷积核参数预先经过训练的神经网络模型，由此在将神经网络模型部署到电子设备之后，无需重新对部署的神经网络模型进行训练，由此通过缩短部署流程达到提高部署效率的目的。权利要求书3页说明书20页附图8页 CN 114330692 A 2022.04.12 CN 114330692 A 1.一种神经网络模型的部署方法，其特征在于，包括：获得电子设备的当前算力信息；至少根据包含多个神经网络模型的模型集合，获得与所述当前算力信息相匹配的目标模型；其中，所述模型集合中的神经网络模型的卷积核参数预先经过训练得到；将所述目标模型部署在所述电子设备上。 2.根据权利要求1所述的方法，其特征在于，至少根据包含多个神经网络模型的模型集合，获得与所述当前算力信息相匹配的目标模型，包括：在包含多个神经网络模型的模型集合中，筛选出初始集合，所述初始集合中包含有至少一个运算能力参数匹配所述当前算力信息的神经网络模型；对所述初始集合中的神经网络模型进行至少一次迭代处理，以得到与所述当前算力信息相匹配的目标模型。 3.根据权利要求1或2所述的方法，其特征在于，所述模型集合中的神经网络模型通过以下方式进行构建：获得基于神经网络构建的基础模型；根据所述基础模型在每个特征提取阶段对应的初始卷积层、初始卷积通道和初始卷积核，获得多个候选构建策略；根据所述候选构建策略，构建对应的神经网络模型，以得到包含多个神经网络模型的模型集合。 4.根据权利要求3所述的方法，其特征在于，根据所述基础模型在每个特征提取阶段对应的初始卷积层、初始卷积通道和初始卷积核，获得多个候选构建策略，包括：分别预设的第一倍率处理所述基础模型在每个所述特征提取阶段对应的初始卷积层的数量，以得到每个所述特征提取阶段上对应的候选卷积层的数量；分别以预设的第二倍率处理所述基础模型在每个所述初始卷积层上对应的初始卷积通道的数量，以得到每个所述初始卷积层对应的候选卷积层对应的候选卷积通道的数量；分别以预设的第三倍率处理所述基础模型在每个所述特征提取阶段对应的初始卷积核中的最大卷积核的尺寸，以得到每个所述特征提取阶段中每个所述候选卷积层对应的候选卷积核的尺寸；根据所述基础模型在每个所述特征提取阶段对应的最大卷积核的卷积核参数，分别为每个所述特征提取阶段中每个候选卷积层对应的候选卷积核设置卷积核参数，其中，所述候选卷积核的卷积核参数从核起始位置继承于其所在特征提取阶段对应的初始卷积核中的最大卷积核的卷积核参数；根据所述候选卷积层的数量、所述候选卷积通道的数量、所述候选卷积核的尺寸和所述候选卷积核的卷积核参数，获得多个候选构建策略。 5.根据权利要求1所述的方法，其特征在于，所述模型集合中的神经网络模型通过以下方式进行训练：在所述模型集合中选择第一模型、第二模型和第三模型，所述第一模型、所述第二模型和所述第三模型在每个特征提取阶段上的卷积层数量、每个所述卷积层对应的卷积通道数量和每个所述卷积层对应的卷积核尺寸均不同；；将带有样本标签的样本图像，分别作为所述第一模型、所述第二模型和所述第三模型权　利　要　求　书 1/3 页 2 CN 114330692 A 2的输入图像，以得到所述第一模型的第一输出结果、所述第二模型的第二输出结果和所述第三模型的第三输出结果；在所述样本标签、所述第一输出结果、所述第二输出结果和所述第三输出结果满足调整条件的情况下，根据所述样本标签、所述第一输出结果、所述第二输出结果和所述第三输出结果，对所述第一模型、所述第二模型和所述第三模型对应的卷积核参数进行调整，返回执行所述步骤：在所述模型集合中选择第一模型、第二模型和第三模型，直到所述样本标签、所述第一输出结果、所述第二输出结果和所述第三输出结果满足收敛条件。 6.根据权利要求5所述的方法，其特征在于，所述样本标签包含：手部区域框的标签和指尖点位置的标签；其中，根据所述样本标签、所述第一输出结果、所述第二输出结果和所述第三输出结果，对所述第一模型、所述第二模型和所述第三模型对应的卷积核参数进行调整，包括：使用蒸馏损失函数，获得所述第一输出结果相对于所述样本标签在所述手部区域框上的第一损失函数值和在所述指尖点位置上的第二损失函数值；使用所述蒸馏损失函数，获得所述第二输出结果相对于所述第一输出结果在所述手部区域框上的第三损失函数值和在所述指尖点位置上的第四损失函数值；使用所述蒸馏损失函数，获得所述第三输出结果相对于所述第一输出结果在所述手部区域框上的第五损失函数值和在所述指尖点位置上的第六损失函数值；根据所述第一损失函数值、所述第二损失函数值、所述第三损失函数值、所述第四损失函数值、所述第五损失函数值和所述第六损失函数值，对所述第一模型、所述第二模型和所述第三模型对应的卷积核参数进行调整，以使得所述第二输出结果和所述第三输出结果分别与所述第一输出结果至少近似一致且所述第一输出结果与所述样本标签至少近似一致。 7.根据权利要求3所述的方法，其特征在于，获得基于神经网络构建的基础模型，包括：基于神经网络，构建初始的基础模型；所述基础模型具有多个特征提取阶段，每个所述特征提取阶段对应于至少一个卷积层，每个所述卷积层对应有多个卷积通道，每个所述卷积层对应有卷积核；使用带有样本标签的样本图像，对所述基础模型在每个所述卷积层对应的卷积核参数进行优化，以得到训练完成的基础模型，所述基础模型能够对输入图像中的手部区域框和指尖点位置进行检测。 8.根据权利要求1所述的方法，所述方法还包括：将目标图像输入到所述目标模型中，以通过所述目标模型对所述目标图像中的手部区域框和指尖点位置进行检测。 9.一种神经网络模型的部署装置，其特征在于，包括：信息获得模块，用于获得电子设备的当前算力信息；模型获得模块，用于至少根据包含多个神经网络模型的模型集合，获得与所述当前算力信息相匹配的目标模型；其中，所述模型集合中的神经网络模型的卷积核参数预先经过训练得到；模型部署模块，用于将所述目标模型部署在所述电子设备上。 10.一种神经网络模型的部署设备，其特征在于，包括存储器和处理器；所述存储器，用于存储程序；权　利　要　求　书 2/3 页 3 CN 114330692 A 3

专利 神经网络模型的部署方法、装置、设备及存储介质

专利神经网络模型的部署方法、装置、设备及存储介质