专利模型处理方法、装置、存储介质及电子设备

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111387855.0 (22)申请日 2021.11.22 (71)申请人度小满科技(北京)有限公司地址 100193 北京市海淀区西北旺东路10 号院西区4 号楼6层6 06室 (72)发明人曾文琦　杨青　 (74)专利代理机构北京博浩百睿知识产权代理有限责任公司 1 1134 代理人赵昀彬 (51)Int.Cl. G06K 9/62(2022.01) G06Q 10/04(2012.01) (54)发明名称模型处理方法、装置、存储介质及电子设备 (57)摘要本发明公开了一种模型处理方法、装置、存储介质及电子设备。其中，该方法包括：获取多个第一模型，其中，多个第一模型中每个第一模型的结构相同，每个第一模型对应的模型参数不同；基于多个第一模型构建多层预测模型，其中，多层预测模型依次连接，多层预测模型中每层预测模型对应的模型参数相同；利用第一训练数据对多层预测模型进行训练，得到目标模型。本发明解决了相关技术中由于构建待训练模型的基础较差导致训练得到的目标模型的预测准确度较差的技术问题。权利要求书2页说明书10页附图4页 CN 114065865 A 2022.02.18 CN 114065865 A 1.一种模型处理方法，其特征在于，包括：获取多个第一模型，其中，所述多个第一模型中每个第一模型的结构相同，所述每个第一模型对应的模型参数不同；基于所述多个第一模型构建多层预测模型，其中，所述多层预测模型依次连接，所述多层预测模型中每层预测模型对应的模型参数相同；利用第一训练数据对所述多层预测模型进行训练，得到目标模型。 2.根据权利要求1所述方法，其特征在于，利用第一训练数据对所述多层预测模型进行训练，得到目标模型，包括：随机划分所述第一训练数据，得到第一训练集合和第一测试集合；利用所述第一训练集合对当前层预测模型进行训练，得到训练后的当前层预测模型，其中，所述当前层预测模型为所述多层预测模型中的任意一层预测模型；利用所述第一测试集合对所述训练后的当前层预测模型进行测试，得到第一测试结果，其中，所述第一测试结果用于表示所述当前层预测模型的预测准确度；基于所述第一测试结果和第一预设准确度的比较结果，确定是否停止对所述多层预测模型进行训练；响应于停止对所述多层预测模型进行训练，确定所述训练后的当前层预测模型为所述目标模型。 3.根据权利要求2所述方法，其特征在于，利用所述第一训练集合对当前层预测模型进行训练，得到训练后的当前层预测模型和第一预测结果，包括：响应于所述当前层预测模型为所述多层预测模型中的第一层预测模型，利用所述第一训练集合对所述当前层预测模型进行训练，得到所述训练后的当前层预测模型；响应于所述当前层预测模型为所述多层预测模型中除所述第一层预测模型之外的其他层预测模型，利用所述第一训练集合和第一预测结果对所述当前层预测模型进行训练，得到所述训练后的当前层预测模型，其中，所述第一预测结果为所述其他层预测模型的上一层预测模型输出的预测结果。 4.根据权利要求2所述方法，其特征在于，基于所述第一测试结果和第一预设准确度的比较结果，确定是否停止对所述多层预测模型进行训练，包括：响应于所述第一测试结果中所述当前层预测模型的预测准确度大于或等于所述第一预设准确度，确定停止对所述多层预测模型进行训练；响应于所述第一测试结果中所述当前层预测模型的预测准确度小于所述第一预设准确度，确定继续对所述多层预测模型进行训练。 5.根据权利要求1所述方法，其特征在于，在获取多个第一模型之前，所述方法还包括：获取多个初始模型，其中，其中，所述多个初始模型的数量大于所述多个第一模型的数量，所述多个初始模型的模型结构与所述多个第一模型的模型结构相同；利用所述第一训练数据和第二训练数据对所述多个初始模型进行训练，得到所述多个第一模型，其中，所述第一训练数据的第一获取时间早于所述第二训练数据的第二获取时间。 6.根据权利要求5所述方法，其特征在于，利用第一训练数据和第二训练数据对所述多个初始模型进行训练，得到所述多个第一模型，包括：权　利　要　求　书 1/2 页 2 CN 114065865 A 2随机划分所述第一训练数据，得到第二训练集合和第二测试集合；利用所述第二训练集合分别对所述多个初始模型进行训练，得到多个训练后的初始模型；利用所述第二测试集合分别对所述多个训练后的初始模型进行测试，得到每个训练后的初始模型的第二测试结果，其中，所述第二测试结果用于表示相应的初始模型的预测准确度；基于所述每个训练后的初始模型的第二测试结果和第二预设准确度的比较结果，确定是否停止对相应的初始模型进行训练；响应于停止对所述相应的初始模型进行训练，基于所述第二训练数据从所述多个训练后的初始模型中确定所述多个第一模型。 7.根据权利要求6所述方法，其特征在于，基于所述第二训练数据从所述训练后的多个初始模型中确定所述多个第一模型，包括：利用所述第二训练数据分别对所述多个训练后的初始模型进行测试，得到每个训练后的初始模型的第三测试结果，其中，所述第三测试结果用于表示相应的初始模型的预测准确度；基于所述第三测试结果对所述多个训练后的初始模型按照预测准确度进行排序，基于排序结果从所述多个训练后的初始模型中确定出所述多个第一模型。 8.一种模型处理装置，其特征在于，包括：获取模块，用于获取多个第一模型，其中，所述多个第一模型中每个第一模型的结构相同，所述每个第一模型对应的模型参数不同；构建模块，用于基于所述多个第一模型构建多层预测模型，其中，所述多层预测模型依次连接，所述多层预测模型中每层预测模型对应的模型参数相同；训练模块，用于利用第一训练数据对所述多层预测模型进行训练，得到目标模型。 9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求 1至7中任意一项所述的模型处理方法。 10.一种电子设备，其特征在于，包括：处理器和存储器，所述处理器用于运行所述存储器中存储的程序，其中，所述程序运行时执行权利要求1至7中任意一项所述的模型处理方法。权　利　要　求　书 2/2 页 3 CN 114065865 A 3

专利 模型处理方法、装置、存储介质及电子设备

专利模型处理方法、装置、存储介质及电子设备