说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111660692.9 (22)申请日 2021.12.3 0 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新区望江西 路666号 (72)发明人 张圆 殷保才  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 代理人 鲁梅 (51)Int.Cl. G06N 3/063(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01) (54)发明名称 神经网络模型的部署方法、 装置、 设备及存 储介质 (57)摘要 本申请实施例公开了一种神经网络模型的 部署方法、 装置、 设备及存储介质, 方法包括: 获 得电子设备的当前算力信息; 至少根据包含多个 神经网络模 型的模型集合, 获得与所述当前算力 信息相匹配的目标模型; 其中, 所述模型集合中 的神经网络模型的卷积核参数预先经过训练得 到; 将所述目标模型部署在所述电子设备上。 可 见, 本申请中根据电子设备的当前算力信息为电 子设备部署卷积核参数预先经过训练的神经网 络模型, 由此在将神经网络模型部署到电子设备 之后, 无需重新对部署的神经网络模型进行训 练, 由此通过缩短部署流程达到提高部署效率的 目的。 权利要求书3页 说明书20页 附图8页 CN 114330692 A 2022.04.12 CN 114330692 A 1.一种神经网络模型的部署方法, 其特 征在于, 包括: 获得电子设备的当前算力 信息; 至少根据包含多个神经网络模型的模型集合, 获得与 所述当前算力信 息相匹配的目标 模型; 其中, 所述模型集 合中的神经网络模型的卷积核参数 预先经过训练得到; 将所述目标模型部署在所述电子设备 上。 2.根据权利要求1所述的方法, 其特征在于, 至少根据包含多个神经网络模型的模型集 合, 获得与所述当前算力 信息相匹配的目标模型, 包括: 在包含多个神经网络模型的模型集合中, 筛选出初始集合, 所述初始集合中包含有至 少一个运 算能力参数匹配所述当前算力 信息的神经网络模型; 对所述初始集合中的神经网络模型进行至少一 次迭代处理, 以得到与 所述当前算力信 息相匹配的目标模型。 3.根据权利要求1或2所述的方法, 其特征在于, 所述模型集合中的神经网络模型通过 以下方式进行构建: 获得基于神经网络构建的基础模型; 根据所述基础模型在每个特征提取阶段对应的初始卷积层、 初始卷积通道和初始卷积 核, 获得多个候选构建策略; 根据所述候选构建策略, 构建对应的神经网络模型, 以得到包含多个神经网络模型的 模型集合。 4.根据权利要求3所述的方法, 其特征在于, 根据 所述基础模型在每个特征提取阶段对 应的初始卷积层、 初始卷积通道和初始卷积核, 获得多个候选构建策略, 包括: 分别预设的第一倍率处理所述基础模型在每个所述特征提取阶段对应的初始卷积层 的数量, 以得到每 个所述特 征提取阶段 上对应的候选卷积层的数量; 分别以预设的第二倍率处理所述基础模型在每个所述初始卷积层上对应的初始卷积 通道的数量, 以得到每 个所述初始卷积层对应的候选卷积层对应的候选卷积通道的数量; 分别以预设的第三倍率处理所述基础模型在每个所述特征提取阶段对应的初始卷积 核中的最大卷积核的尺寸, 以得到每个所述特征提取阶段中每个所述候选卷积层对应的候 选卷积核的尺寸; 根据所述基础模型在每个所述特征提取阶段对应的最大卷积核的卷积核参数, 分别为 每个所述特征提取阶段中每个候选卷积层对应的候选卷积核设置卷积核参数, 其中, 所述 候选卷积核的卷积核参数从核起始位置继承于其所在特征提取阶段对应的初始卷积核中 的最大卷积核的卷积核参数; 根据所述候选卷积层的数量、 所述候选卷积通道的数量、 所述候选卷积核的尺寸和所 述候选卷积核的卷积核参数, 获得多个候选构建策略。 5.根据权利要求1所述的方法, 其特征在于, 所述模型集合中的神经网络模型通过以下 方式进行训练: 在所述模型集合中选择第 一模型、 第 二模型和第 三模型, 所述第一模型、 所述第 二模型 和所述第三模型在每个特征提取阶段上的卷积层数量、 每个所述卷积层对应的卷积通道数 量和每个所述卷积层对应的卷积核尺寸均不同; ; 将带有样本标签的样本 图像, 分别作为所述第一模型、 所述第二模型和所述第三模型权 利 要 求 书 1/3 页 2 CN 114330692 A 2的输入图像, 以得到所述第一模型 的第一输出结果、 所述第二模型 的第二输出结果和所述 第三模型的第三输出 结果; 在所述样本标签、 所述第一输出结果、 所述第二输出结果和所述第三输出结果满足调 整条件的情况下, 根据所述样本标签、 所述第一输出结果、 所述第二输出结果和所述第三输 出结果, 对所述第一模型、 所述第二模 型和所述第三模型对应的卷积核参数进 行调整, 返回 执行所述步骤: 在所述模型集合中选择第一模型、 第二模型和第三模型, 直到所述样本标 签、 所述第一输出 结果、 所述第二输出 结果和所述第三输出 结果满足收敛 条件。 6.根据权利要求5所述的方法, 其特征在于, 所述样本标签包含: 手部区域框的标签和 指尖点位置的标签; 其中, 根据所述样本标签、 所述第一输出结果、 所述第二输出结果和所述第三输出结 果, 对所述第一模型、 所述第二模型和所述第三模型对应的卷积核参数进行调整, 包括: 使用蒸馏损失函数, 获得所述第 一输出结果相对于所述样本标签在所述手部区域框上 的第一损失函数值和在所述指尖点 位置上的第二损失函数值; 使用所述蒸馏损失函数, 获得所述第 二输出结果相对于所述第 一输出结果在所述手部 区域框上的第三损失函数值和在所述指尖点 位置上的第四损失函数值; 使用所述蒸馏损失函数, 获得所述第 三输出结果相对于所述第 一输出结果在所述手部 区域框上的第五损失函数值和在所述指尖点 位置上的第六损失函数值; 根据所述第一损失函数值、 所述第 二损失函数值、 所述第 三损失函数值、 所述第四损失 函数值、 所述第五损失函数值和所述第六损失函数值, 对所述第一模 型、 所述第二模型和所 述第三模型对应的卷积核参数进 行调整, 以使得所述第二输出结果和所述第三输出结果分 别与所述第一输出 结果至少近似一 致且所述第一输出 结果与所述样本标签至少近似一 致。 7.根据权利要求3所述的方法, 其特 征在于, 获得基于神经网络构建的基础模型, 包括: 基于神经网络, 构建初始的基础模型; 所述基础模型具有多个特征提取阶段, 每个所述 特征提取阶段对应于至少一个卷积层, 每个所述卷积层对应有多个卷积通道, 每个所述卷 积层对应有卷积核; 使用带有样本标签的样本图像, 对所述基础模型在每个所述卷积层对应的卷积核参数 进行优化, 以得到训练完成的基础模型, 所述基础模型能够对输入图像中的手部区域框和 指尖点位置进行检测。 8.根据权利要求1所述的方法, 所述方法还 包括: 将目标图像输入到所述目标模型中, 以通过所述目标模型对所述目标图像中的手部区 域框和指尖点 位置进行检测。 9.一种神经网络模型的部署装置, 其特 征在于, 包括: 信息获得模块, 用于获得电子设备的当前算力 信息; 模型获得模块, 用于至少根据包含多个神经网络模型的模型集合, 获得与所述当前算 力信息相匹配的目标模型; 其中, 所述模型集合中的神经网络模型 的卷积核参数预先经过 训练得到; 模型部署模块, 用于将所述目标模型部署在所述电子设备 上。 10.一种神经网络模型的部署设备, 其特 征在于, 包括存 储器和处 理器; 所述存储器, 用于存 储程序;权 利 要 求 书 2/3 页 3 CN 114330692 A 3

.PDF文档 专利 神经网络模型的部署方法、装置、设备及存储介质

文档预览
中文文档 32 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 神经网络模型的部署方法、装置、设备及存储介质 第 1 页 专利 神经网络模型的部署方法、装置、设备及存储介质 第 2 页 专利 神经网络模型的部署方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:44:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。