说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210188960.X (22)申请日 2022.02.28 (71)申请人 中国石油大 学 (华东) 地址 266580 山东省青岛市黄岛区长江西 路66号 (72)发明人 韩文芳 李洋 谷潇 蒲志奇  杨尉科 渐令  (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) (54)发明名称 一种基于知识图谱的高校专业智能问答系 统及方法 (57)摘要 本发明涉及一种基于知识图谱的高校专业 问答系统, 包括知识图谱构建模块、 问题分类模 块、 数据库查询模块、 结果反馈模块。 一种基于知 识图谱的高校专业问答方法包括以下步骤: S1. 采集各高校专业信息, 构建高校专业知识图谱; S2.获取并解析用户查询文本, 识别出关键词并 判断问题类型; S3.选择问题类型对应的结构化 模板, 结合关键词生成结构化语句, 进行查询获 取相关结果; S4.整合检索结果, 生成答复语句, 将其反馈给用户。 本发明主要针对高考报考流程 中考生查询专业信息碎片化、 低效率等问题, 整 合了高校专业信息, 有效提高了检索高校专业知 识答案的准确率。 权利要求书2页 说明书5页 附图3页 CN 114547342 A 2022.05.27 CN 114547342 A 1.一种基于知识图谱的高校专业智能问答系统, 其特征在于, 所述系统包括知识图谱 构建模块、 问题分类模块、 数据库查询模块和结果反馈模块: 所述知识图谱构建模块, 用于根据中国教育在线这一垂直网站获取的数据构建高校专 业知识图谱; 所述问题分类模块, 用于解析用户查询语句, 通过HanLP工具对问句进行词语分割和词 性标注, 从而识别出语句的关键词, 使用预训练的朴素贝叶斯分类算法进行分类; 所述数据库查询模块, 根据标签所对应的结构化问题模板, 将提取的关键词与问题模 板匹配, 生成结构化语句, 再将其 转换为对应的数据库查询语句; 所述结果反馈模块, 用于显示前端聊天界面, 整合检索答案, 生成合理自然的答复语 句, 展示给用户。 2.根据权利要求1所述的一种基于知识图谱的高校专业智能问答系统, 其特征在于, 所 述知识图谱构建模块包括专业数据爬取 单元、 结构调整单 元和专业数据存 储单元; 所述专业数据爬取单元, 用于对中国教育在线这一垂直网站 的文本数据进行爬取, 并 传递至结构调整单 元; 所述结构调整单元, 用于对高校专业数据爬取单元所获得文本数据进行整理, 抽取可 用单元格, 形成jso n结构化数据, 并存 入数据库用于后续分析; 所述专业数据存储单元, 用于设置实体及专业属性, 确定各个实体间的关系, 将整理好 的数据通过Neo 4j图形数据库进行存 储, 生成高校专业知识图谱。 3.根据权利要求1或2所述的一种基于知识图谱的高校专业智能问答系统, 其特征在 于, 所述问题分类模块包括识别问句关键词单 元和判断 问题类别单 元; 所述识别问句关键词单元, 用于对用户语句进行解析时, 通过HanLP分词工具进行词语 切割和词性标注, 从而从句子中识别出实体作为关键词; 所述判断问题类别单元, 用于识别问题类别, 使用预训练的朴素贝叶斯算法对问题进 行分类, 获取问题标签, 为此, 本系统总共设置 了16类问题, 问题标签用0 ‑15表示。 4.根据权利要求1或2所述的一种基于知识图谱的高校专业智能问答系统, 其特征在 于, 所述系统还包括数据库查询模块, 用于将问题分类模块的数据转换为对应的数据库查 询语言。 5.根据权利要求1或2所述的一种基于知识图谱的高校专业智能问答系统, 其特征在 于, 所述系统还包括结果反馈模块用于高校专 业查询结果展示, 系统前端为聊天室 界面, 答 案以文本形式进行展示。 6.一种基于知识图谱的高校专业智能问答系统实现的方法, 其特征在于, 所述方法包 括以下步骤: S1.采集各高校专业信息, 构建高校专业知识图谱; S2.获取并解析用户查询文本, 识别出关键词并判断 问题类型; S3.选择问题类型对应的结构化模板, 结合关键词生成结构化语句, 进行查询获取相关 结果; S4.整合检索结果, 生成答复语句, 将其反馈给用户。 7.根据权利要求6所述的方法, 其特征在于, 所述S1中, 构建高校专业知识图谱的步骤 为: S1.1收集专业信息, 整理并抽取 可用知识单 元, 形成结构化数据;权 利 要 求 书 1/2 页 2 CN 114547342 A 2S1.2将高校专业信息映射 为专业实体及其属性; S1.3构建一个整合 “新工科、 新医科、 新农科、 新文科 ”专业相关数据信息的高校专业知 识图谱。 8.根据权力要求6所述的方法, 其特 征在于, 所述S2的过程 为: S2.1获取用户问题文本, 基于HanLP工具对用户问句进行分词和词语标注, 识别问题文 本中的关键词; S2.2使用预训练的朴素贝叶斯分类算法对问题分类。 9.根据权力要求6所述的方法, 其特 征在于, 所述S3的过程 为: S3.1调用对应结构化问题模版, 将提取出的关键词与问题模板匹配, 生成知识图谱库 中检索语句; S3.2在高校专业知识图谱中获取查询结果。权 利 要 求 书 2/2 页 3 CN 114547342 A 3

.PDF文档 专利 一种基于知识图谱的高校专业智能问答系统及方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于知识图谱的高校专业智能问答系统及方法 第 1 页 专利 一种基于知识图谱的高校专业智能问答系统及方法 第 2 页 专利 一种基于知识图谱的高校专业智能问答系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:53:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。