说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210689996.6 (22)申请日 2022.06.17 (71)申请人 北京飞象星球科技有限公司 地址 100102 北京市朝阳区广顺 南大街8号 院1号楼1层101内4层F01单 元内02号 (72)发明人 刘洋 柳景明 赵薇 翁秋洁  张天宇  (74)专利代理 机构 北京智信禾专利代理有限公 司 11637 专利代理师 张瑞 (51)Int.Cl. G06K 9/62(2022.01) G06F 40/186(2020.01) G06F 40/151(2020.01) G06F 40/111(2020.01)G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 解题模型的训练方法及装置 (57)摘要 本说明书提供解题模 型的训练方法及 装置, 其中所述解题模 型的训练方法包括: 获取题干样 本, 以及所述题干样本对应的数字算式; 提取所 述题干样 本中的数字单元, 确定所述数字单元对 应的字符标记单元; 根据所述字符标记单元更新 所述数字算式, 获得样本字符表达式; 利用所述 样本字符表达式和所述题干样本对初始解题模 型进行训练, 直至获得满足训练停止条件的目标 解题模型。 有效的保证了训练后的解题模型的预 测精准度, 并提高了解题模型的训练效率。 权利要求书3页 说明书16页 附图5页 CN 114970753 A 2022.08.30 CN 114970753 A 1.一种解题模型的训练方法, 其特 征在于, 包括: 获取题干样本, 以及所述题干样本对应的数字算式; 提取所述题干样本中的数字单 元, 确定所述数字单 元对应的字符标记单 元; 根据所述字符标记单 元更新所述数字算式, 获得样本 字符表达式; 利用所述样本字符表达 式和所述题干样本对初始解题模型进行训练, 直至获得满足训 练停止条件的目标解题模型。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述字符标记单元更新所述数字 算式, 获得样本 字符表达式步骤执 行之前, 还 包括: 确定所述数字单 元在所述题干样本中的顺序; 根据所述数字单 元在所述题干样本中的顺序, 对所述字符标记单 元进行排序; 相应的, 根据所述字符标记单 元更新所述数字算式, 获得样本 字符表达式, 包括: 根据排序后的字符标记单 元更新所述数字算式, 获得样本 字符表达式。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述字符标记单元更新所述数字 算式, 获得样本 字符表达式, 包括: 确定所述数字算式中的算式数字单元, 其中, 所述算式数字单元与所述数字单元相对 应; 确定所述数字单 元和所述字符标记单 元之间的映射关系; 基于所述映射关系, 将所述算式数字单元替换为所述字符标记单元, 获得样本字符表 达式。 4.根据权利要求1所述的方法, 其特征在于, 所述利用所述样本字符表达 式和所述题干 样本对初始解题模型进行训练, 直至获得满足训练停止条件的目标解题模型, 包括: 将所述题干样本 输入至所述初始解题模型进行处 理, 得到预测字符表达式; 基于所述样本字符表达 式和所述预测字符表达 式对所述初始解题模型进行优化, 直至 获得满足训练停止条件的目标解题模型。 5.根据权利要求4所述的方法, 其特征在于, 所述将所述题干样本输入至所述初始解题 模型进行处 理, 得到预测字符表达式, 包括: 将所述题干样本输入至所述初始解题模型, 通过所述初始解题模型中的编码器对所述 题干样本进行编码处 理, 得到编码向量; 通过所述初始解题模型中的解码器对所述编码向量进行解码处理, 得到预测字符表达 式并输出 所述初始解题模型; 其中, 所述预测字符表达式包括 运算符号和预测字符标记单 元。 6.根据权利要求5所述的方法, 其特征在于, 所述通过所述初始解题模型中的解码器对 所述编码向量进行解码处 理, 得到预测字符表达式并输出 所述初始解题模型, 包括: 通过所述初始解题模型中的解码器对所述编码向量进行递归解码处理, 依次输出多个 预测字符, 其中, 所述解码器输出 的当前预测字符关联所述当前预测字符的上相邻预测字 符; 根据所述多个预测字符生成所述预测字符表达式并输出 所述初始解题模型。 7.根据权利要求4所述的方法, 其特征在于, 所述基于所述样本字符表达 式和所述预测 字符表达式对所述初始解题模型进行优化, 直至获得满足训练停止条件的目标解题模型,权 利 要 求 书 1/3 页 2 CN 114970753 A 2包括: 基于所述目标字符表达式和所述预测字符表达式计算模型损失值; 在所述模型损 失值大于预设阈值的情况下, 根据所述模型损 失值, 调整所述初始解题 模型的模型参数, 继续训练模型参数调整后的初始解题模型, 直至获得满足训练停止条件 的目标解题模型。 8.根据权利要求1所述的方法, 其特征在于, 所述确定所述数字单元对应的字符标记单 元, 包括: 在预先设定的字符标记单元集合中, 选择与所述数字单元对应的字符标记单元, 其中, 所述字符标记单 元集合包含的字符标记单 元不重复。 9.根据权利要求1 ‑4任意一项所述的方法, 其特征在于, 所述利用所述样本字符表达 式 和所述题干样本对初始 解题模型进行训练, 直至获得满足训练停止条件的目标解题模型步 骤执行之后, 还 包括: 获取用户上传的问题文本, 并提取 所述问题文本中的数字单 元; 将所述问题文本输入至所述目标解题模型进行处理, 获得目标字符表达式, 其中, 所述 目标字符表达式中的目标字符标记单元的元素与所述数字单元在所述问题文本中的顺序 相关; 根据所述数字单 元对所述目标字符表达式进行 更新, 获得目标 数字算式; 根据所述目标 数字算式确定所述问题文本的目标答案, 并向所述用户进行反馈 。 10.一种解题模型的训练装置, 其特 征在于, 包括: 获取模块, 被 配置为获取题干样本, 以及所述题干样本对应的数字算式; 确定模块, 被配置为提取所述题干样本中的数字单元, 确定所述数字单元对应的字符 标记单元; 更新模块, 被 配置为根据所述字符标记单 元更新所述数字算式, 获得样本 字符表达式; 训练模块, 被配置为利用所述样本字符表达 式和所述题干样本对初始解题模型进行训 练, 直至获得满足训练停止条件的目标解题模型。 11.一种解题方法, 其特 征在于, 包括: 获取用户上传的问题文本, 并提取 所述问题文本中的数字单 元; 将所述问题文本输入至如权利要求1 ‑9任意一项所述方法中的目标解题模型进行处 理, 获得目标字符表达式, 其中, 所述目标字符表达式中的目标字 符标记单元的元素与所述 数字单元在所述问题文本中的顺序相关; 根据所述数字单 元对所述目标字符表达式进行 更新, 获得目标 数字算式; 根据所述目标 数字算式确定问题文本的目标答案, 并向用户进行反馈 。 12.一种解题装置, 其特 征在于, 包括: 获取模块, 被 配置为获取用户上传的问题文本, 并提取 所述问题文本中的数字单 元; 处理模块, 被配置为将所述问题文本输入至如权利要求1 ‑9任意一项所述方法中的目 标解题模 型进行处理, 获得目标字符表达式, 其中, 所述目标字符表达式中的目标字 符标记 单元的元素与所述数字单 元在所述问题文本中的顺序相关; 更新模块, 被配置为根据所述数字单元对所述目标字符表达式进行更新, 获得目标数 字算式;权 利 要 求 书 2/3 页 3 CN 114970753 A 3

.PDF文档 专利 解题模型的训练方法及装置

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 解题模型的训练方法及装置 第 1 页 专利 解题模型的训练方法及装置 第 2 页 专利 解题模型的训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。