说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111387855.0 (22)申请日 2021.11.22 (71)申请人 度小满科技(北京)有限公司 地址 100193 北京市海淀区西北旺东路10 号院西区4 号楼6层6 06室 (72)发明人 曾文琦 杨青  (74)专利代理 机构 北京博浩百 睿知识产权代理 有限责任公司 1 1134 代理人 赵昀彬 (51)Int.Cl. G06K 9/62(2022.01) G06Q 10/04(2012.01) (54)发明名称 模型处理方法、 装置、 存 储介质及电子设备 (57)摘要 本发明公开了一种模型处理方法、 装置、 存 储介质及电子设备。 其中, 该方法包括: 获取多个 第一模型, 其中, 多个第一模型中每个第一模型 的结构相同, 每个第一模型对应的模型参数不 同; 基于多个第一模型构建多层预测模型, 其中, 多层预测模 型依次连接, 多层预测模 型中每层预 测模型对应的模 型参数相同; 利用第一训练数据 对多层预测模型进行训练, 得到目标模型。 本发 明解决了相关技术中由于构建待训练模型的基 础较差导致训练得到的目标模型的预测准确度 较差的技术问题。 权利要求书2页 说明书10页 附图4页 CN 114065865 A 2022.02.18 CN 114065865 A 1.一种模型处 理方法, 其特 征在于, 包括: 获取多个第 一模型, 其中, 所述多个第一模型中每个第 一模型的结构相同, 所述每个第 一模型对应的模型参数不同; 基于所述多个第 一模型构建多层预测模型, 其中, 所述多层预测模型依次连接, 所述多 层预测模型中每层预测模型对应的模型参数相同; 利用第一训练数据对所述多层预测模型进行训练, 得到目标模型。 2.根据权利要求1所述方法, 其特征在于, 利用第 一训练数据对所述多层预测模型进行 训练, 得到目标模型, 包括: 随机划分所述第一训练数据, 得到第一训练集 合和第一测试集 合; 利用所述第一训练集合对当前层预测模型进行训练, 得到训练后的当前层预测模型, 其中, 所述当前层预测模型为所述多层预测模型中的任意 一层预测模型; 利用所述第一测试集合对所述训练后的当前层预测模型进行测试, 得到第一测试结 果, 其中, 所述第一测试 结果用于表示所述当前层预测模型的预测准确度; 基于所述第 一测试结果和第 一预设准确度的比较结果, 确定是否停止对所述多层预测 模型进行训练; 响应于停止对所述多层预测模型进行训练, 确定所述训练后的当前层预测模型为所述 目标模型。 3.根据权利要求2所述方法, 其特征在于, 利用所述第 一训练集合对当前层预测模型进 行训练, 得到训练后的当前层预测模型和第一预测结果, 包括: 响应于所述当前层预测模型为所述多层预测模型中的第 一层预测模型, 利用所述第 一 训练集合对所述当前层预测模型进行训练, 得到所述训练后的当前层预测模型; 响应于所述当前层预测模型为所述多层预测模型中除所述第一层预测模型之外的其 他层预测模型, 利用所述第一训练集合和第一预测结果对所述当前层预测模型进行训练, 得到所述训练后的当前层预测模型, 其中, 所述第一预测结果为所述其他层预测模型 的上 一层预测模型输出的预测结果。 4.根据权利要求2所述方法, 其特征在于, 基于所述第 一测试结果和第 一预设准确度的 比较结果, 确定是否停止对所述多层预测模型进行训练, 包括: 响应于所述第一测试结果中所述当前层预测模型的预测准确度大于或等于所述第一 预设准确度, 确定停止对所述多层预测模型进行训练; 响应于所述第一测试结果中所述当前层预测模型的预测准确度小于所述第一预设准 确度, 确定继续对所述多层预测模型进行训练。 5.根据权利要求1所述方法, 其特 征在于, 在获取多个第一模型之前, 所述方法还 包括: 获取多个初始模型, 其中, 其中, 所述多个初始模型的数量大于所述多个第 一模型的数 量, 所述多个初始模型的模型 结构与所述多个第一模型的模型 结构相同; 利用所述第 一训练数据和第 二训练数据对所述多个初始模型进行训练, 得到所述多个 第一模型, 其中, 所述第一训练数据的第一获取时间早于所述第二训练数据的第二获取时 间。 6.根据权利要求5所述方法, 其特征在于, 利用第 一训练数据和第 二训练数据对所述多 个初始模型进行训练, 得到所述多个第一模型, 包括:权 利 要 求 书 1/2 页 2 CN 114065865 A 2随机划分所述第一训练数据, 得到第二训练集 合和第二测试集 合; 利用所述第 二训练集合分别对所述多个初始模型进行训练, 得到多个训练后的初始模 型; 利用所述第 二测试集合分别对所述多个训练后的初始模型进行测试, 得到每个训练后 的初始模型 的第二测试结果, 其中, 所述第二测试结果用于表示相 应的初始模型 的预测准 确度; 基于所述每个训练后的初始模型的第 二测试结果和第 二预设准确度的比较结果, 确定 是否停止对相应的初始模型进行训练; 响应于停止对所述相应的初始模型进行训练, 基于所述第 二训练数据从所述多个训练 后的初始模型中确定所述多个第一模型。 7.根据权利要求6所述方法, 其特征在于, 基于所述第 二训练数据从所述训练后的多个 初始模型中确定所述多个第一模型, 包括: 利用所述第 二训练数据分别对所述多个训练后的初始模型进行测试, 得到每个训练后 的初始模型 的第三测试结果, 其中, 所述第三测试结果用于表示相 应的初始模型 的预测准 确度; 基于所述第 三测试结果对所述多个训练后的初始模型按照预测准确度进行排序, 基于 排序结果从所述多个训练后的初始模型中确定出 所述多个第一模型。 8.一种模型处 理装置, 其特 征在于, 包括: 获取模块, 用于获取多个第 一模型, 其中, 所述多个第 一模型中每个第 一模型的结构相 同, 所述每 个第一模型对应的模型参数不同; 构建模块, 用于基于所述多个第 一模型构建多层预测模型, 其中, 所述多层预测模型依 次连接, 所述多层预测模型中每层预测模型对应的模型参数相同; 训练模块, 用于利用第一训练数据对所述多层预测模型进行训练, 得到目标模型。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的程序, 其中, 在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求 1至7中任意 一项所述的模型处 理方法。 10.一种电子设备, 其特征在于, 包括: 处理器和存储器, 所述处理器用于运行所述存储 器中存储的程序, 其中, 所述程序运行时执行权利要求1至7中任意一项所述的模型处理方 法。权 利 要 求 书 2/2 页 3 CN 114065865 A 3

.PDF文档 专利 模型处理方法、装置、存储介质及电子设备

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型处理方法、装置、存储介质及电子设备 第 1 页 专利 模型处理方法、装置、存储介质及电子设备 第 2 页 专利 模型处理方法、装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:18:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。