专利一种深度学习模型的选择方法、装置及设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211025489.9 (22)申请日 2022.08.25 (71)申请人上海人工智能创新中心地址 200232 上海市徐汇区云锦路701号 37、 38层 (72)发明人吕成器　周再达　叶浩晨　张文蔚　陈恺　 (74)专利代理机构上海智晟知识产权代理事务所(特殊普通合伙) 31313 专利代理师张瑞莹　李镝的 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称一种深度学习模型的选择方法、装置及设备 (57)摘要本发明公开一种深度学习模型的选择方法，其对不同深度学习模型进行训练、验证及测试，对测试结果进行比较，选取符合预设条件的深度学习模型，其中，不同深度学习模型的训练、验证及测试均通过同一个执行器实现：首先通过执行器根据给定的深度学习算法构建所需的模块：模型、数据集、训练循环控制器、验证循环控制器、测试循环控制器以及钩子，然后根据预设的逻辑，调用训练循环控制器、验证循环控制器、或测试循环控制器以进行模型训练、验证或测试。由于无需针对不同深度学习算法开发专门的流程，而是通过调用相应的模块即可方便地实现多种深度学习算法，因此可以方便地比较不同算法的优劣，进而确定最合适的模型。权利要求书2页说明书6页附图3页 CN 115392482 A 2022.11.25 CN 115392482 A 1.一种深度学习模型的选择方法，其特征在于，包括步骤：对不同深度学习模型进行训练、验证及测试，对测试结果进行比较，选取符合预设条件的深度学习模型，其中，所述不同深度学习模型的训练、验证及测试均通过同一个执行器实现，且任一深度学习模型的训练、验证及测试包括步骤：通过所述执行器根据给定的深度学习算法构建所需的模块，所述模块包括：模型、数据集、训练循环控制器、验证循环控制器、测试循环控制器以及钩子；以及根据预设的逻辑，调用所述训练循环控制器、验证循环控制器、或测试循环控制器以进行模型训练、验证或测试。 2.如权利要求1所述的选择方法，其特征在于，所述模型训练包括：按预设的最大迭代轮次在数据集上反复迭代，并进行模型的前向推理和反向传播以及优化。 3.如权利要求1所述的选择方法，其特征在于，所述验证包括：在预设时刻，对训练完成的模型进行验证，并输出验证集上的评价指标，所述执行器根据所述评价指标，在下一迭代轮次训练前对深度学习训练的超参数进行调整。 4.如权利要求1所述的选择方法，其特征在于，所述测试包括：在预设时刻，对训练完成的模型进行测试，并输出测试集上的评价指标。 5.如权利要求1所述的选择方法，其特征在于，还包括，通过所述钩子查询、修改或调用对应步骤的输入或输出参数，其中所述钩子设置于以下一个或多个步骤的前后：模块构建、训练、验证、测试、任一训练轮次、任一训练迭代、任一验证轮次、任一验证迭代、任一测试轮次、以及任一测试迭代。 6.如权利要求1所述的选择方法，其特征在于，所述模块还包括：优化器、参数调度器以及评测器。 7.如权利要求1所述的选择方法，其特征在于，所述数据集包括训练数据集、验证数据集以及测试数据集，其分别用于模型训练、验证及测试。 8.如权利要求7所述的选择方法，其特征在于，所述训练循环控制器被配置为每一轮次或每一次迭代调用一次所述训练数据集进行一个轮次的训练或者一次迭代；和/或所述验证循环控制器被配置为在预设时刻调用一次所述验证数据集及验证评测器进行一次迭代，以用于模型的验证；和/或所述训练循环控制器被配置为在预设时刻调用一次所述测试数据集及测试评测器进行一次迭代，以用于模型的测试。 9.一种深度学习模型的选择装置，其特征在于，包括：选择模块，其被配置为根据不同深度学习模型的测试结果，选择深度学习模型；以及学习模块，其被配置为对不同的深度学习模型进行训练、验证及测试，且包括：预处理模块，其被配置为构建给定的深度学习算法所需的模块，包括模型、数据集、循环控制器、以及钩子；以及调用模块，其被配置为根据预设逻辑调用指定的模块以进行模型训练、验证及测试。 10.一种电子设备，其特征在于，包括存储器以及处理器，其中所述存储器被配置为存储计算机程序，所述计算机程序在所述处理器运行时执行如权利要求1至8任一所述的深度学习模型的选择方法。权　利　要　求　书 1/2 页 2 CN 115392482 A 211.一种计算机可读存储介质，其特征在于，存储有计算机程序，所述计算机程序在处理器上运行时执行如权利要求1至8任一所述的深度学习模型的选择方法。权　利　要　求　书 2/2 页 3 CN 115392482 A 3

专利 一种深度学习模型的选择方法、装置及设备

专利一种深度学习模型的选择方法、装置及设备