说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210536486.5 (22)申请日 2022.05.17 (71)申请人 北京飞象星球科技有限公司 地址 100102 北京市朝阳区广顺 南大街8号 院1号楼1层101内4层F01单 元内02号 (72)发明人 阎覃 赵薇 张天宇 柳景明  (74)专利代理 机构 北京智信禾专利代理有限公 司 11637 专利代理师 何定润 (51)Int.Cl. G06F 40/117(2020.01) G06F 40/194(2020.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 填空题解题模型的训练方法及装置 (57)摘要 本说明书提供填空题解题模型的训练方法 及装置, 其中所述填空题解题模型训练方法包 括: 获取填空题样本数据集, 并对所述填空题样 本数据集中的填空题样本数据进行待填写位置 检测; 针对 所述填空题样本数据集中包含待填写 位置的填空题样本数据添加空缺标识, 获得当前 填空题样 本数据; 根据所述填空题样本数据集中 未包含待填写位置的填空题样本数据和所述当 前填空题样本数据, 生成目标填空题样本数据 集; 基于所述目标填空题样本数据集对包含编码 层和解码层的填空题解题模型进行训练, 直至获 得符合训练条件的目标填空题 解题模型。 通过目 标填空题样 本数据集对填空题模 型进行训练, 得 到解题正确率更高的目标填空题解题模型。 权利要求书3页 说明书16页 附图4页 CN 114861597 A 2022.08.05 CN 114861597 A 1.一种填空题解题模型的训练方法, 其特 征在于, 包括: 获取填空题样本数据集, 并对所述填空题样本数据集中的填空题样本数据进行待填写 位置检测; 针对所述填空题样本数据集中包含待填写位置的填空题样本数据 添加空缺标识, 获得 当前填空题样本数据; 根据所述填空题样本数据集中未包含待填写位置的填空题样本数据和所述当前填空 题样本数据, 生成目标填空题样本数据集; 基于所述目标填空题样本数据集对包含编码层和解码层的填空题解题模型进行训练, 直至获得符合训练条件的目标填空题解题模型。 2.如权利要求1所述的方法, 其特征在于, 根据所述填空题样本数据集中未包含待填写 位置的填空题样本数据和所述当前填空题样本数据, 生成目标填空题样本数据集, 包括: 根据所述当前填空题样本数据和所述填空题样本数据集中未包含待填写位置的填空 题样本数据生成初始填空题样本数据集; 确定所述初始填空题样本数据集中包 含的初始填空题样本数据分别对应的数据长度; 选择大于等于预设长度阈值的数据长度对应的初始填空题样本数据组成所述目标填 空题样本数据集。 3.如权利要求1所述的方法, 其特征在于, 针对所述填空题样本数据集中包含待填写位 置的填空题样本数据添加空缺标识, 获得当前填空题样本数据, 包括: 针对所述填空题样本数据集中包含待填写位置的填空题样本数据 添加空缺标识, 获得 第一填空题样本数据; 确定所述第一 填空题样本数据的空缺标识占比; 选择小于等于预设占比阈值的第一 填空题样本数据, 作为当前填空题样本数据。 4.如权利要求2所述的方法, 其特征在于, 选择大于等于预设长度阈值的数据长度对应 的初始填空题样本数据组成所述目标填空题样本数据集, 包括: 选择大于等于预设长度阈值的数据长度对应的初始填空题样本数据组成中间填空题 样本数据集; 根据预设分词规则对中间填空题样本数据集中包含的中间填空题样本数据进行分词 处理, 获得目标填空题样本数据集。 5.如权利要求4所述的方法, 其特征在于, 选择大于等于预设长度阈值的数据长度对应 的初始填空题样本数据组成中间填空题样本数据集, 包括: 选择大于等于预设长度阈值的数据长度对应的初始填空题样本数据, 组成待处理填空 题样本数据集; 确定所述待处理填空题样本数据集中大于等于预设长度上限阈值的目标待处理填空 题样本数据; 基于预设切分规则对所述目标待处理填空题样本数据进行切分, 获得第 一中间填空题 样本数据; 基于所述第一中间填空题样本数据和所述待处理填空题样本数据集中小于预设长度 上限阈值的目标待处 理填空题样本数据组成中间填空题样本数据集。 6.如权利要求4所述的方法, 其特征在于, 根据预设分词规则对中间填空题样本数据集权 利 要 求 书 1/3 页 2 CN 114861597 A 2中包含的中间填空题样本数据进行分词处 理, 获得目标填空题样本数据集, 包括: 根据预设分词规则对中间填空题样本数据集中包含的中间填空题样本数据进行分词 处理, 得到分词填空题样本数据集; 基于预设去重算法计算所述分词填空题样本数据集中的每个分词填空题样本数据之 间的相似度, 并根据每 个分词填空题样本数据对应的相似度确定数据去重信息; 根据预设语义清洗算法计算所述分词填空题样本数据集中的每个分词填空题样本数 据的困惑度, 并根据每 个分词填空题样本数据对应的困惑度确定语义清洗信息; 基于所述数据去重信息和语义清洗信息提取所述分词填空题样本数据集合中的当前 目标填空题样本数据, 并基于每 个当前目标填空题样本数据生成目标填空题样本数据集。 7.如权利要求5所述的方法, 其特征在于, 基于每个当前目标填空题样本数据生成 目标 填空题样本数据集, 包括: 将每个当前目标填空题样本数据基于预设排序规则进行排序, 获得目标填空题样本数 据集。 8.如权利要求1所述的方法, 其特 征在于, 获取填空题样本数据集, 包括: 在预设题库中筛 选填空题 题目, 并提取填空题 题目中的填空题 题目内容; 删除每个填空题题目内容中的非法字符和/或采用标准字符替换所述填空题题目内容 中的非标准字符, 获得填空题样本数据; 由每个填空题样本数据生成填空题样本数据集。 9.如权利要求1所述的方法, 其特征在于, 基于所述目标填空题样本数据集对包含编码 层和解码层的填空题解题模型进行训练, 直至获得符合训练条件的目标填空题解题模型, 包括: 确定包含编码层和解码层的待训练填空题解题模型, 并将所述目标填空题样本数据集 中的目标填空题样本数据输入至所述待训练填空题解题模型; 通过所述待训练填空题解题模型的掩码模块对目标填空题样本数据中的待掩码数据 进行掩码处 理, 获得空缺 填空题样本数据; 基于所述待训练填空题解题模型的预测模块对所述空缺填空题样本数据进行处理, 并 获取所述待训练填空题解题模型输出的预测填空结果; 根据所述预测填空结果和所述待掩码数据对所述待训练填空题解题模型的模型参数 进行调整, 获得目标填空题解题模型。 10.如权利要求9所述的方法, 其特征在于, 根据所述预测填空结果和所述待掩码数据 对所述待训练填空题解题模型的模型参数进行调整, 获得目标填空题解题模型, 包括: 根据所述预测填空结果和所述待掩码数据对所述待训练填空题解题模型的模型参数 进行调整, 获得训练后的待训练填空题解题模型; 获取填空题题目数据集, 其中, 所述填空题题目数据集包括: 填空题题目和所述填空题 题目的填空结果标识; 将所述填空题题目输入至所述训练后的待训练填空题解题模型中, 获得填空预测结 果, 并基于所述填空结果标识和所述填空预测结果对所述待训练填空题解题模型进行微 调; 在达到微调停止条件的情况 下, 获得目标填空题解题模型。权 利 要 求 书 2/3 页 3 CN 114861597 A 3

.PDF文档 专利 填空题解题模型的训练方法及装置

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 填空题解题模型的训练方法及装置 第 1 页 专利 填空题解题模型的训练方法及装置 第 2 页 专利 填空题解题模型的训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:12:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。