说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210720925.8 (22)申请日 2022.06.23 (71)申请人 北京云思智学 科技有限公司 地址 101106 北京市通州区经济开发区东 区靓丽三街9号-20 60 (72)发明人 胡科 崔寅生  (74)专利代理 机构 北京中联智道知识产权代理 事务所(普通 合伙) 11963 专利代理师 熊蒙 (51)Int.Cl. G06F 40/253(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 自然语言学科填空试题的自动解题方法、 装 置及电子设备 (57)摘要 本发明公开了自然语言学科填空试题的自 动解题方法、 装置及电子设备, 自然语言学科填 空试题的自动解题方法, 包括: 获取目标文本; 对 所述目标文本进行数据处理, 得到至少一道自然 语言学科填空试题; 针对每一道自然语 言学科填 空试题确定可填入的候选词集合/词组集合, 根 据确定的候选词集合/词组集合选择最佳的候选 词/词组作为自然语言学科填空试题的答案。 本 发明采用“召回候选词/词组+打分排序 ”的策略, 从自然语言学科填空试题本身语句考虑对空缺 部分“召回候选词/词组 ”, 然后对召回的候选词/ 词组进行打 分排序, 从而实现自动解题。 权利要求书3页 说明书12页 附图4页 CN 115169332 A 2022.10.11 CN 115169332 A 1.自然语言学 科填空试题的自动解题方法, 其特 征在于, 包括: 获取目标文本; 对所述目标文本进行 数据处理, 得到至少一道自然语言学 科填空试题; 针对每一道自然语言学科填空试题确定可填入的候选词集合/词组集合, 根据确定的 候选词集 合/词组集 合选择最佳的候选词/词组作为自然语言学 科填空试题的答案 。 2.根据权利要求1所述的自然语言学科填空试题的自动 解题方法, 其特征在于, 所述针 对每一道自然语言学科填空试题确定可填入的候选词集合/词组集合, 根据确定的候选词 集合/词组集 合选择最佳的候选词/词组作为自然语言学 科填空试题的答案, 包括: 针对每一道自然语言学科填空试题的填空部分采用召回策略, 召回候选词/词组构成 候选词集 合/词组集 合; 将候选词集合/词组集合中的候选词/词组逐个填入所述自然语言学科填空试题中, 然 后进行打 分排序, 得到候选词/词组的精排结果; 根据所述精排结果选择打 分最高的候选词/词组作为自然语言学 科填空试题的答案 。 3.根据权利要求2所述的自然语言学科填空试题的自动 解题方法, 其特征在于, 所述针 对每一道自然语言学科填空试题的填空部分采用召回策略, 召回候选词/词组构成候选词 集合/词组集 合, 包括: 将所述自然语言学科填空试题输入至基于Transformer的预训练语言模型中, 所述基 于Transformer的预训练语言模型输出一系列词/词组作为自然语言学科填空试题的候选 词/词组, 构成第一 候选词集 合/词组集 合; 可选地, 所述基于Transformer的预训练语言模型在进行模型预训练时加入了教育领 域的题目数据, 并且根据自然语言学科填空试题的题型特点基于所述预训练语言模型进 行 网络结构的优化设计。 4.根据权利要求3所述的自然语言学科填空试题的自动 解题方法, 其特征在于, 所述针 对每一道自然语言学科填空试题的填空部分采用召回策略, 召回候选词/词组构成候选词 集合/词组集 合, 包括: 基于资源库, 根据对应的匹配算法、 相似算法由所述资源库中召回候选词/词组构 成第 二候选词集 合/词组集 合; 可选地, 所述的资源库包含教育领域基础知识库、 自定义辞典库、 英语语料库以及英语 试题资源库。 5.根据权利要求4所述的自然语言学科填空试题的自动 解题方法, 其特征在于, 所述针 对每一道自然语言学科填空试题的填空部分采用召回策略, 召回候选词/词组构成候选词 集合/词组集 合, 包括: 判断所述自然语言学 科填空试题的题型; 根据自然语言学科填空试题的题型确定筛选条件, 在所述第一候选词集合/词组集合 和第二候选词集 合/词组集 合中结合筛 选条件确定最终的候选词/词组。 6.根据权利要求5所述的自然语言学科填空试题的自动 解题方法, 其特征在于, 当判断 所述自然语言学 科填空试题为含有提 示信息的题型时, 将所述提示信息作为筛选条件在所述第一候选词集合/词组集合和第二候选词集合/ 词组集合中结合筛 选条件确定最终的候选词/词组;权 利 要 求 书 1/3 页 2 CN 115169332 A 2可选地, 所述的提示信 息包括用给定词的正确形态填空, 或者用指定类型的词填空, 或 者以含有一个或者多个提 示字母的单词/词组填空。 7.根据权利要求2所述的自然语言学科填空试题的自动 解题方法, 其特征在于, 所述针 对每一道自然语言学科填空试题的填空部分采用召回策略, 召回候选词/词组构成候选词 集合/词组集 合, 包括: 判断所述自然语言学 科填空试题为由已知词/词组选项中进行选词填空的题型时, 所述的召回策略为识别出所述自然语言学科填空试题中的已知词/词组选项作为候选 词/词组进行召回, 构成候选词集 合/词组集 合。 8.根据权利要求2所述的自然语言学科填空试题的自动 解题方法, 其特征在于, 所述将 候选词集合/词组集合中的候选词/词组逐个填入 所述自然语言学科填空试题中, 然后进 行 打分排序, 得到候选词/词组的精排结果, 包括: 所述将候选词集合/词组集合中的候选词/词组逐个填入所述自然语言学科填空试题 中构成完整语句, 再输入深度学习精排模型; 分别输出每 个候选词/词组对应完整语句的打 分; 将候选词/词组按照打 分的高低进行排序, 得到候选词/词组的精排结果。 9.根据权利要求2所述的自然语言学科填空试题的自动 解题方法, 其特征在于, 所述将 候选词集合/词组集合中的候选词/词组逐个填入 所述自然语言学科填空试题中, 然后进 行 打分排序, 得到候选词/词组的精排结果, 包括: 所述将候选词集合/词组集合中的候选词/词组逐个填入所述自然语言学科填空试题 中构成完整语句; 基于资源库, 针对各个完整语句进行匹配相似度打 分; 将候选词/词组按照打 分的高低进行排序, 得到候选词/词组的精排结果。 10.根据权利要求1所述的自然语言学科填空试题的自动解题方法, 其特征在于, 所述 对所述目标文本进行 数据处理, 得到至少一道自然语言学 科填空试题包括: 将所述目标文本进行试题拆分, 将拆分出来的各道自然语言学科填空试题以标准的文 本结构化数据格式保存; 针对每道自然语言学科填空试题的文本进行数据 预处理, 得到归一化数据结构的至少 一道自然语言学 科填空试题; 可选地, 所述数据预处 理包括试题的标注化处 理和归一 化处理。 11.自然语言学 科填空试题的自动解题装置, 其特 征在于, 包括: 获取模块, 获取目标文本; 数据处理模块, 对所述目标文本进行 数据处理, 得到至少一道自然语言学 科填空试题; 解题模块, 针对每一道自然语言学科填空试题确定可填入的候选词集合/词组集合, 根 据确定的候选词集合/词组集合选择最佳的候选词/词组作为自然语言学科填空试题的答 案。 12.电子设备, 包括处理器和存储器, 所述存储器用于存储计算机可执行程序, 其特征 在于: 当所述计算机程序被所述处理器执行时, 所述处理器执行如权利要求1 ‑10中任一项所 述自然语言学 科填空试题的自动解题方法。权 利 要 求 书 2/3 页 3 CN 115169332 A 3

.PDF文档 专利 自然语言学科填空试题的自动解题方法、装置及电子设备

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 自然语言学科填空试题的自动解题方法、装置及电子设备 第 1 页 专利 自然语言学科填空试题的自动解题方法、装置及电子设备 第 2 页 专利 自然语言学科填空试题的自动解题方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。