说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211025489.9 (22)申请日 2022.08.25 (71)申请人 上海人工智能创新中心 地址 200232 上海市徐汇区云锦路701号 37、 38层 (72)发明人 吕成器 周再达 叶浩晨 张文蔚  陈恺  (74)专利代理 机构 上海智晟知识产权代理事务 所(特殊普通 合伙) 31313 专利代理师 张瑞莹 李镝的 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称 一种深度学习模型的选择方法、 装置及设备 (57)摘要 本发明公开一种深度学习模 型的选择方法, 其对不同深度学习模型进行训练、 验证及测试, 对测试结果进行比较, 选取符合预设条件的深度 学习模型, 其中, 不同深度学习模型的训练、 验证 及测试均通过同一个执行器实现: 首先通过执行 器根据给定的深度学习算法构建所需的模块: 模 型、 数据集、 训练循环控制器、 验证循环控制器、 测试循环控制器以及钩子, 然后根据预设的逻 辑, 调用训练循环控制器、 验证循环控制器、 或测 试循环控制器以进行模型训练、 验证或测试。 由 于无需针对不同深度学习算法开发专门的流程, 而是通过调用相应的模块即可方便地实现多种 深度学习算法, 因此可以方便地比较不同算法的 优劣, 进而确定最 合适的模型。 权利要求书2页 说明书6页 附图3页 CN 115392482 A 2022.11.25 CN 115392482 A 1.一种深度 学习模型的选择方法, 其特征在于, 包括步骤: 对不同深度 学习模型进行训 练、 验证及测试, 对测试结果进 行比较, 选取符合预设条件的深度学习模 型, 其中, 所述不同 深度学习模型的训练、 验证及测试均通过同一个执行器实现, 且任一深度学习模 型的训练、 验证及测试包括 步骤: 通过所述执行器根据给定的深度学习算法构建所需的模块, 所述模块包括: 模型、 数据 集、 训练循环控制器、 验证 循环控制器、 测试循环控制器以及钩子; 以及 根据预设的逻辑, 调用所述训练循环控制器、 验证循环控制器、 或测试循环控制器以进 行模型训练、 验证或测试。 2.如权利要求1所述的选择 方法, 其特 征在于, 所述模型训练包括: 按预设的最大迭代轮次在数据集上反复迭代, 并进行模型的前向推理和反 向传播以及 优化。 3.如权利要求1所述的选择 方法, 其特 征在于, 所述验证包括: 在预设时刻, 对训练完成的模型进行验证, 并输出验证集上的评价指标, 所述执行器根 据所述评价指标, 在下一迭代轮次训练前对深度学习训练的超参数进行调整。 4.如权利要求1所述的选择 方法, 其特 征在于, 所述测试包括: 在预设时刻, 对训练完成的模型进行测试, 并输出测试集上的评价指标。 5.如权利要求1所述的选择方法, 其特征在于, 还包括, 通过所述钩子查询、 修改或调用 对应步骤的输入或输出参数, 其中所述钩子设置 于以下一个或多个步骤的前后: 模块构建、 训练、 验证、 测试、 任一训练轮次、 任一训练迭代、 任一验证轮次、 任一验证迭 代、 任一测试轮次、 以及任一测试迭代。 6.如权利要求1所述的选择方法, 其特征在于, 所述模块还包括: 优化器、 参数调度器以 及评测器。 7.如权利要求1所述的选择方法, 其特征在于, 所述数据集包括训练数据集、 验证数据 集以及测试 数据集, 其分别用于模型训练、 验证及测试。 8.如权利要求7所述的选择方法, 其特征在于, 所述训练循环控制器被配置为每一轮次 或每一次迭代调用一次所述训练数据集进行一个 轮次的训练或者 一次迭代; 和/或 所述验证循环控制器被配置为在预设时刻调用一次所述验证数据集及验证评测器进 行一次迭代, 以用于模型的验证; 和/或 所述训练循环控制器被配置为在预设时刻调用一次所述测试数据集及测试评测器进 行一次迭代, 以用于模型的测试。 9.一种深度学习模型的选择装置, 其特 征在于, 包括: 选择模块, 其被 配置为根据不同深度学习模型的测试 结果, 选择深度学习模型; 以及 学习模块, 其被 配置为对不同的深度学习模型进行训练、 验证及测试, 且 包括: 预处理模块, 其被配置为构建给定的深度学习算法所需的模块, 包括模型、 数据集、 循 环控制器、 以及钩子; 以及 调用模块, 其被 配置为根据预设逻辑调用指定的模块以进行模型训练、 验证及测试。 10.一种电子设备, 其特征在于, 包括存储器以及处理器, 其中所述存储器被配置为存 储计算机程序, 所述计算机程序在所述处理器运行时执行如权利要求1至8任一所述的深度 学习模型的选择 方法。权 利 要 求 书 1/2 页 2 CN 115392482 A 211.一种计算机可读存储介质, 其特征在于, 存储有计算机程序, 所述计算机程序在处 理器上运行时执 行如权利要求1至8任一所述的深度学习模型的选择 方法。权 利 要 求 书 2/2 页 3 CN 115392482 A 3

.PDF文档 专利 一种深度学习模型的选择方法、装置及设备

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种深度学习模型的选择方法、装置及设备 第 1 页 专利 一种深度学习模型的选择方法、装置及设备 第 2 页 专利 一种深度学习模型的选择方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:02:24上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。