(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210673087.3
(22)申请日 2022.06.15
(71)申请人 湖南中医药大学
地址 410000 湖南省长 沙市岳麓区含浦科
教园学士 路300号
(72)发明人 晏峻峰 刘东波 韦昌法 文志华
(74)专利代理 机构 长沙国科天河知识产权代理
有限公司 432 25
专利代理师 唐品利
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/33(2019.01)
(54)发明名称
一种基于伤寒论的知识图谱构建方法和装
置
(57)摘要
本申请涉及一种基于伤寒论的知识图谱构
建方法和装置。 所述方法包括: 对伤寒论原文进
行分析和挖掘, 构建病、 证、 症、 法、 方的概念体
系, 并根据该体系确定的这五者之间的关系构建
伤寒论概念关系描述框架; 根据该框架对伤寒论
原文进行知识提取, 按照上下位 关系构建概念层
次结构树; 并根据概念层次结构树对伤寒论原文
进行实体、 实体属性以及实体关系的提取; 并将
知识融合后得到的知 识三元组集合采用Neo4j图
数据库进行存储, 完成伤寒论知识图谱构建。 该
方法可实现伤寒论知识体系的数字化, 可清晰、
高效的获取 “病‑证‑症‑法‑方”之间的联系, 有助
于伤寒论学习者更好、 更快的掌握伤寒论知 识体
系。
权利要求书3页 说明书17页 附图11页
CN 114996477 A
2022.09.02
CN 114996477 A
1.一种基于伤寒论的知识图谱构建方法, 其特 征在于, 所述方法包括:
对伤寒论原文进行分析和挖掘, 从理、 法、 方三个方面, 建立病、 证、 症、 法、 方的概念体
系, 并根据所述概念体系确 定病、 证、 症、 法、 方之间的关系, 并根据病、 证、 症、 法、 方之间的
关系构建伤寒论 概念关系描述框架;
根据所述伤寒论概念关系 描述框架, 参考预定技术规范, 对伤寒论原文进行知识提取,
按照上下位关系构建一棵概念层次结构树; 所述概念层次结构树包括概念节点、 语义关系
以及概念节点与语义关系之间的约束规则;
根据所述概念节点、 所述语义关系以及所述约束规则, 对伤寒论原文进行实体提取、 实
体属性提取以及实体关系提取, 得到知识三元组集 合;
对所述知识三元组集合进行知识融合, 得到知识融合后的知识三元组集合和伤寒论同
义词库;
将所述知识三元组集 合采用Neo 4j图数据库进行存 储, 完成伤寒论知识图谱构建。
2.根据权利要1所述的方法, 其特 征在于, 所述方法还 包括:
根据所述概念节点、 所述语义关系以及所述约束规则, 对伤寒名家医案进行实体提取、
实体属性 提取以及实体关系提取, 得到伤寒名家医案的知识三元组;
根据所述同义词库将伤寒名家医案的知识三元组中的实体名映射到规范实体, 并采用
统计的方法来计算实体相似度; 所述实体相似度是字符相似度和语义相似度的加权和;
将实体相似度最高且大于预设阈值的实体作为候选对齐实体提交给中医经方专家审
核; 如果审核通过, 则合并两个实体的属性和关系, 并将该实体与 伤寒论的病 ‑证‑症‑法‑方
知识图谱中的规范实体之间建立同义关系; 如果审核不通过, 将该实体作为新实体加入伤
寒论的病 ‑证‑症‑法‑方知识图谱。
3.根据权利要求2所述的方法, 其特征在于, 所述字符相似度是采用两个实体字符串之
间的Jaccard距离来计算的, 字符相似度的表达式为:
其中, J(A,B)为实体A与实体B的字符相似度, ||为求取字符数, |A∩B|为实体A与实体B
的字符交集, |A ∪B|为实体A与实体B的字符并集;
所述语义相似度是采用两个实体之间的余弦相似度来计算的, 语义相似度的表达式
为:
其中, sims(A,B)为实体A和实体B的语义相似度, (x1,x2,…,xn)为实体A的向量表示,
(y1,y2,…,yn)为实体B的向量表示。
4.根据权利要求1所述的方法, 其特征在于, 对伤寒论原文进行分析和挖掘, 从理、 法、
方三个方面, 建立病、 证、 症、 法、 方的概念体系, 并根据所述概念体系确 定病、 证、 症、 法、 方
之间的关系, 并根据病 、 证、 症、 法、 方之间的关系构建伤寒论 概念关系描述框架, 包括:权 利 要 求 书 1/3 页
2
CN 114996477 A
2对伤寒论原文进行分析和挖掘, 从理、 法、 方三个方面, 建立病、 证、 症、 法、 方的概念分
类体系, 并将病 、 证、 症、 法、 方五个方面收集的相关词汇作为标准 术语, 并添加进术语词典;
根据所述病、 证、 症、 法、 方的概念分类体系, 采用概念关系和属性关系定义病、 证、 症、
法、 方之间的关系, 所述病、 证、 症、 法、 方之间的关系包括: 病 ‑病关系、 病 ‑证关系、 病 ‑症关
系、 证‑症关系、 证 ‑法关系、 证 ‑方关系、 法 ‑方关系; 所述概念关系是采用三元组<概念A, 关
系R, 概念B>的形式进行表示的, 其中关系R的类型包括: 一对一、 一对多、 多对多; 所述属性
关系是采用三元组<概念A, 属性B, 属性值C>的形式进行表示的, 其中属性值的类型为数字
或字符串, 属性 值包括: 名称、 持续时间、 严重程度、 病位、 病性;
根据病‑病关系、 病 ‑证关系、 病 ‑症关系、 证 ‑症关系、 证 ‑法关系、 证 ‑方关系、 法 ‑方关
系, 构建伤寒论 概念关系描述框架。
5.根据权利要求4所述的方法, 其特征在于, 根据所述概念节点、 所述语义关系以及所
述约束规则, 对伤寒论原文进 行实体提取、 实体属性提取以及实体关系提取, 得到知识 三元
组集合, 包括:
在中医经方专家指导下, 根据 所述概念节点、 所述语义关系以及所述约束规则, 参考预
选的现有伤寒论编著, 对伤寒论原文及进 行知识形式的转换, 得到多个知识表格; 所述知识
表格中的每一个单元格内容均有明确范围, 并且对于同义词以及症状的类型也以特殊字符
予以标记;
在所述知识表格的每一单元格中, 借助所述特殊字符, 利用NLPIR ‑ICTCLAS汉语分词系
统实现中文分词, 完成病 、 证、 症、 法、 方五个方面的实体抽取;
根据所述语义关系和所述约束规则, 为所述知识表格每一单元格赋予特定的实体类
型, 以及单 元格之间特定的关系类型, 得到知识 表格规则;
基于所述术语词典和所述知识表格规则, 从所有所述知识表格中抽取知识三元组集
合, 完成病 、 证、 症、 法、 方五个方面的实体关系抽取。
6.根据权利要求5所述的方法, 其特征在于, 在中医经方专家指导下, 根据所述概念节
点、 所述语义关系以及所述约束规则, 参考预选的现有伤寒论编著, 对伤寒论原文及 进行知
识形式的转换, 得到多个知识 表格, 包括:
针对伤寒论中涉及辨病与辨证的所有经文, 当每条经文中只涉及1个诊断结论时, 从原
病证、 治疗史、 现病证、 病因病机、 辨证结果、 治疗方案以及方案编码方面进行知识抽取, 得
到伤寒论经文对应的知识表格; 所述知识表格中的现病证、 治疗方案中知识类型中的每一
术语, 均为 其指明所属概念节点;
当每条经文中涉及多个诊断结论时, 将该条经文拆分成多条经文, 使得拆分后的经文
中只包含一个诊断结论, 按照只涉及1个诊断结论是的知识 提取方法进 行提取, 得到伤寒论
条文对应的知识 表格;
对知识抽取过程中所涉及的疾病实体、 证候实体、 症状实体、 治法实体、 疗法实体以及
方剂实体分别按照对应的预设准则进行的命名规范。
7.根据权利要1所述的方法, 其特 征在于, 所述预定技 术规范为TC MLS‑SN技术规范;
根据所述伤寒论概念关系 描述框架, 参考预定技术规范, 对伤寒论原文进行知识提取,
按照上下位关系构建一棵概念层次结构树, 包括:
根据所述伤寒论概念关系描述框架, 参考TCMLS ‑SN技术规范, 采用人工标注+机器抽取权 利 要 求 书 2/3 页
3
CN 114996477 A
3
专利 一种基于伤寒论的知识图谱构建方法和装置
文档预览
中文文档
32 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共32页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:52:48上传分享