说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210532554.0 (22)申请日 2022.05.12 (71)申请人 北京云思智学 科技有限公司 地址 101106 北京市通州区经济开发区东 区靓丽三街9号-20 60 (72)发明人 胡科 崔寅生  (74)专利代理 机构 北京中联智道知识产权代理 事务所(普通 合伙) 11963 专利代理师 熊蒙 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 16/583(2019.01) G06Q 50/20(2012.01) (54)发明名称 一种连线匹配试题的自动解题方法、 装置及 存储介质 (57)摘要 本发明公开了一种连线匹配试题的自动解 题方法、 装置及存储介质, 所述连线匹配试题的 自动解题方法, 包括: 获取连线匹配试题的文本 信息, 将所述文本信息结构化处理得到待匹配的 至少两部分文本信息集合texts_a、 texts_ b、……; 计算各部分文本信息集合texts_a、 texts_b、 ……中的文本 特征信息, 用于判断采用 何种算法进行匹配 打分; 根据所述匹配 打分的结 果采用最大权匹配算法针对各部分文本信息集 合texts_a、 texts_b、 ……中的文本进行匹配; 回 溯连线匹配试题的结构信息生 成自动解题答案。 本发明的连线匹配试题的自动解题方法实现了 不同题型的连线匹配试题的自动解答, 而且针对 不同的题型采用不同的算法, 确保连线匹配试题 自动解答的准确性。 权利要求书2页 说明书10页 附图2页 CN 114840643 A 2022.08.02 CN 114840643 A 1.一种连线匹配试题的自动解题方法, 其特 征在于, 包括: 获取连线 匹配试题的文本信 息, 将所述文本信 息结构化处理得到待匹配的至少两部分 文本信息集 合texts_a、 texts_b、 ……; 计算各部分文本信息集合texts_a、 texts_b、 ……中的文本特征信息, 用于判断采用何 种算法进行匹配打 分; 根据所述匹配打分的结果采用最大权匹配算法针对各部分文本信息集合texts_a、 texts_b、 ……中的文本进行匹配; 回溯连线匹配试题的结构信息生成自动解题答案 。 2.根据权利要求1所述的一种连线匹配试题的自动解题方法, 其特征在于, 所述获取连 线匹配试题的文本信息, 将所述文本信息结构化处理得到待匹配的至少两部分文本信息集 合texts_a、 texts_b、 ……包括: 获取连线匹配试题的原 始OCR文本; 将原始OCR文本 中的文本信息根据 连线匹配试题的结构信 息进行结构化处理得到待 匹 配的至少两 部分文本信息集 合texts_a、 texts_b、 ……; 可选地, 所述将原始OCR文本中的文本信息根据连线匹配试题 的结构信息进行结构化 处理得到待匹配的至少两 部分文本信息集 合texts_a、 texts_b、 ……包括: 所述连线匹配试题的结构信息为左右侧文本连线匹配结构, 则将原始OCR文本中的左 右侧的文本信息分别汇总成不同的文本信息集 合texts_a、 texts_b、 ……; 所述连线匹配试题的结构信息为上下侧文本连线匹配结构, 则将原始OCR文本中的上 下侧的文本信息分别汇总成不同的文本信息集 合texts_a、 texts_b、 ……; 以及所述连线 匹配试题的结构信 息为多于或者等于三侧的文本连线匹配结构, 则将原 始OCR文本中各侧的文本信息分别汇总至不同的文本信息集 合中。 3.根据权利要求1所述的一种连线匹配试题的自动解题方法, 其特征在于, 所述计算各 部分文本信息集合texts_a、 texts_b、 ……中的文本特征信息, 用于判断采用何种算法进行 匹配打分包括: 计算各部分文本信息集合texts_a、 texts_b、 ……中的文本长度信息、 英语或汉语占比 信息、 非停用词占比信息, 判断所述连线匹配试题的题型, 根据所述题型采用相对应的算法 进行匹配打 分: 所述匹配打 分的算法包括句意关联度打 分、 文本相识度打 分和语义相关性打 分。 4.根据权利要求3所述的一种连线匹配试题的自动解题方法, 其特 征在于, 包括: 计算各部分文本信息集合texts_a、 texts_b、 ……中汉语和英语的文本数量均大于第 一预设阈值, 判断所述连线匹配试题的题型为英汉互译匹配连线题型; 将各部分文本信息集合texts_a、 texts_b、 ……中的英文文本统一翻译成汉语文本之 后采用最长公共子串lcs算法和jaccard相似度算法计算其相似度, 进行英汉互译匹配度打 分。 5.根据权利要求3所述的一种连线匹配试题的自动解题方法, 其特 征在于, 包括: 计算各部分文本信息集合texts_a、 texts_b、 ……的文本长度和非停用词占比, 如果文 本长度均小于等于第二预设阈值, 并且非停用 词占比均大于第三预设阈值, 判断所述连线 匹配试题的题型为同/反义词匹配连线题型;权 利 要 求 书 1/2 页 2 CN 114840643 A 2基于wordnet的路径相似度算法计算各部分文本信息集合texts_a、 texts_b、 ……中的 文本句子相关性, 进行同/反义词匹配度打 分。 6.根据权利要求3所述的一种连线匹配试题的自动解题方法, 其特 征在于, 包括: 当判断所述判断连线匹配试题的题型既不是英汉互译匹配连线题型, 也不是同/反义 词匹配连线题型, 则采用句意关联度打 分算法; 所述句意关联度打分算法包括基于预训练语言模型的NSP任务针对各部分文本信 息集 合texts_a、 texts_b、 ……中的文本句子进行句意关联度打 分。 7.根据权利要求3所述的一种连线匹配试题的自动解题方法, 其特征在于, 所述根据 所 述匹配打分的结果采用最大权匹配算法针对各部分文本信息集合texts_a、 texts_b、 …… 中的文本进行匹配包括: 所述匹配打分步骤中将各部分文本信息集合texts_a、 texts_b、 ……两两分组, 并将每 组文本信息集 合texts_a、 texts_b中文本 两两打分均计算出一个归一 化0‑1的分数矩阵; 根据所述分数矩阵采用最大权匹配算法计算对texts_a和texts_b中的文本进行匹配。 8.根据权利要求1所述的一种连线匹配试题的自动解题方法, 其特征在于, 所述回溯连 线匹配试题的结构信息生成自动解题答案包括: 将最大权匹配算法计算出的各部分文本信息集合texts_a、 texts_b、 ……中两两之间 的文本对匹配结果索引转 化为原始题目的题号或题标对应关系, 生成自动解题答案 。 9.一种连线匹配试题的自动解题装置, 其特 征在于, 包括: 文本获取模块, 获取连线匹配试题的文本信息, 将所述文本信息结构化处理得到待匹 配的至少两 部分文本信息集 合texts_a、 texts_b、 ……; 打分模块, 计算各部分文本信息集合texts_a、 texts_b、 ……中的文本特征信息, 用于 判断采用何种算法进行匹配打 分; 文本匹配模块, 根据 所述匹配打分的结果采用最大权匹配算法针对各部分文本信 息集 合texts_a、 texts_b、 ……中的文本进行匹配; 及回溯解 答模块, 回溯连线匹配试题的结构信息生成自动解题答案 。 10.一种存储介质, 存储有计算机可执行程序, 其特征在于, 所述计算机可执行程序被 执行时, 实现如权利要求1 ‑8任意一项所述的一种连线匹配试题的自动解题方法。权 利 要 求 书 2/2 页 3 CN 114840643 A 3

.PDF文档 专利 一种连线匹配试题的自动解题方法、装置及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种连线匹配试题的自动解题方法、装置及存储介质 第 1 页 专利 一种连线匹配试题的自动解题方法、装置及存储介质 第 2 页 专利 一种连线匹配试题的自动解题方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。