说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210785380.9 (22)申请日 2022.07.06 (65)同一申请的已公布的文献号 申请公布号 CN 114842982 A (43)申请公布日 2022.08.02 (73)专利权人 广东省科技基础条件平台 中心 地址 510033 广东省广州市越秀区连新路 171号自编3号楼 (72)发明人 李海威 马志平 罗宇恒 周凌云  冯轶华 黎丽娜 罗亮 卢琰  李军  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 吴松滨(51)Int.Cl. G16H 70/00(2018.01) G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 5/02(2006.01) (56)对比文件 CN 106874695 A,2017.0 6.20 WO 2022041728 A1,202 2.03.03 审查员 李晓霞 (54)发明名称 一种面向医疗信息系统的知识表达方法、 装 置及系统 (57)摘要 本发明公开了一种面向医疗信息系统的知 识表达方法、 装置及系统, 所述方法包括: 获取与 医疗数据相关的多路数据源; 对多路数据源进行 数据核心描述, 得到多路数据源的每一组标准数 据元; 对多路数据源进行关键词识别处理, 从多 路数据源中提取若干关键词; 基于标准数据元, 获取每一关键词对应的每一领域因子; 利用每一 关键词及每一领域因子进行知识抽取, 得到实体 知识和关系知识; 根据实体知识之间的关系, 对 实体知识和关系知识进行知识合并, 生成医疗数 据的知识图谱; 对知识图谱进行知识推理, 得到 知识推理结果。 采用本发明实施例规范了医疗信 息系统的数据标准, 能够保障医疗信息系统标准 的统一和系统的关联。 权利要求书3页 说明书9页 附图4页 CN 114842982 B 2022.09.23 CN 114842982 B 1.一种面向医疗信息系统的知识 表达方法, 其特 征在于, 包括: 获取与医疗数据相关的多路数据源; 对所述多路数据源进行数据核心描述, 得到所述多路数据源的每一组标准数据元; 其 中, 每一组所述标准数据元至少包括核心元 数据、 数据来源、 数据来源的类型; 对所述多路数据源进行关键词识别处 理, 从所述多路数据源中提取若干关键词; 基于所述标准数据 元, 获取每一所述关键词对应的每一领域因子; 其中, 所述领域因子 至少包括所述关键词的数据来源、 所述数据来源的类型、 所述关键词的实体抽取规则; 利用每一所述关键词及每一所述领域因子进行知识抽取, 得到实体知识和关系知识; 根据所述实体知识之间的关系, 对所述实体知识和所述关系知识进行知识合并, 生成 所述医疗数据的知识图谱; 对所述知识图谱进行知识推理, 得到知识推理结果; 其中, 所述利用每一所述关键词及每一所述领域因子进行知识抽取, 得到实体知识和 关系知识, 包括: 基于每一所述关键词和每一所述领域因子, 通过双向LSTM计算, 得到每一所述关键词 的每一特 征向量; 对每一所述关键词的每一特征向量进行实体识别, 得到实体知识; 其中, 所述实体知识 包括每一实体及对应的每一实体关系词; 将所述每一实体输入至改进后的LSTM ‑CNN模型中, 得到每一所述实体的每一特征向 量; 将每一所述实体的每一特征向量输入至预先训练好的基础知识关系模型进行分类学 习, 得到关系知识; 其中, 通过以下步骤获取 所述改进后的LSTM ‑CNN模型: 利用滑动窗口读取每一所述实体的每一实体字段, 将读取到的每一所述实体字段输入 至预先构建好的LSTM ‑CNN模型中, 生成每一所述 实体的每一特征向量; 其中, 所述滑动窗口 的窗口尺寸及滑动步长由所述领域因子决定 。 2.如权利要求1所述的面向医疗信 息系统的知识表达方法, 其特征在于, 所述利用滑动 窗口读取每一所述实体的每一实体字段, 将读取到的每一所述实体字段输入至预先构建好 的LSTM‑CNN模型中, 生成每一所述实体的每一特 征向量, 包括: 根据每一所述领域因子, 获取滑动 窗口的窗口尺寸及滑动步长, 并根据所述窗口尺寸 建立滑动窗口; 根据所述滑动步长在每一所述实体进行滑动, 每进行一 次滑动前读取所述窗口尺寸内 的每一实体字段, 将读取到的每一所述实体字段输入至预先构建好的LSTM ‑CNN模型中, 生 成每一所述实体的每一特 征向量。 3.如权利要求1所述的面向医疗信 息系统的知识表达方法, 其特征在于, 通过以下步骤 对预先构建的基础 知识关系模型进行训练, 得到训练好的基础 知识关系模型: 将读取到每一实体字段输入至预先构建的基础知识关系 模型中, 根据 预设的事件规则 模板对所述实体字段不断进行事 件规则的匹配, 得到训练好的基础 知识关系模型。 4.如权利要求1所述的面向医疗信 息系统的知识表达方法, 其特征在于, 所述基于所述 标准数据元, 获取每一所述关键词对应的每一领域因子, 包括:权 利 要 求 书 1/3 页 2 CN 114842982 B 2根据所述标准数据 元, 构建标准数据元数据库; 其中, 所述标准数据 元数据库包括所述 多路数据源, 及对应 每一所述多路数据源的每一组标准数据元; 根据所述标准数据 元数据库, 构建规则库; 其中, 所述规则库包括每一组所述标准数据 元, 及对应 每一组所述标准数据元的每一实体抽取规则; 根据所述关键词, 从所述标准数据 元数据库中查找到对应所述每一所述关键词的每一 数据来源、 对应每一所述数据来源的每一类型, 并从所述规则库中查找到对应每一所述关 键词的每一实体抽取规则。 5.如权利要求1所述的面向医疗信 息系统的知识表达方法, 其特征在于, 所述根据 所述 实体知识之间的关系, 对所述实体知识和所述关系知识进行知识合并, 生成所述医疗数据 的知识图谱, 包括: 根据所述实体知识之间的关系, 对每一所述实体知识进行权 重标注; 根据标注 的权重, 对所述实体知识和所述关系知识进行知识合并, 生成所述医疗数据 的知识图谱。 6.如权利要求1所述的面向医疗信 息系统的知识表达方法, 其特征在于, 所述多路数据 源至少包括医疗数据标准文件、 医疗信息系统数据库、 医疗检测报告、 专 家经验知识数据。 7.如权利要求1所述的面向医疗信 息系统的知识表达方法, 其特征在于, 所述知识推理 结果包括以下中的至少一种: 异常医疗 数据发现结果、 关联检测推荐 结果、 医疗检测报告校 验结果、 医疗评价与医疗决策 结果。 8.一种面向医疗信息系统的知识 表达装置, 其特 征在于, 包括: 多路数据源获取模块, 用于获取与医疗数据相关的多路数据源; 标准数据元获取模块, 用于对所述多路数据源进行数据核心描述, 得到所述多路数据 源的每一组标准数据元; 其中, 每一组所述标准数据元至少包括核心元数据、 数据来源、 数 据来源的类型; 关键词提取模块, 用于对所述多路数据源进行关键词识别处理, 从所述多路数据源中 提取若干关键词; 领域因子获取模块, 用于基于所述标准数据元, 获取每一所述关键词对应的每一领域 因子; 其中, 所述领域因子至少包括所述关键词的数据来源、 所述数据来源的类型、 所述关 键词的实体抽取规则; 知识抽取模块, 用于利用每一所述关键词及每一所述领域因子进行知识抽取, 得到实 体知识和关系知识; 知识图谱构建模块, 用于根据 所述实体知识和所述关系知识构建所述医疗数据的知识 图谱; 知识推理模块, 用于对所述知识图谱进行知识推理, 得到知识推理结果; 其中, 所述知识抽取模块包括: 关键词特征向量获取单元, 用于基于每一所述关键词和每一所述领域因子, 通过双 向 LSTM计算, 得到每一所述关键词的每一特 征向量; 实体知识获取单元, 用于对每一所述关键词的每一特征向量进行实体识别, 得到实体 知识; 其中, 所述实体知识包括每一实体及对应的每一实体关系词; 实体特征向量获取单元, 用于将所述每一实体输入至改进后的LSTM ‑CNN模型中, 得到权 利 要 求 书 2/3 页 3 CN 114842982 B 3

.PDF文档 专利 一种面向医疗信息系统的知识表达方法、装置及系统

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向医疗信息系统的知识表达方法、装置及系统 第 1 页 专利 一种面向医疗信息系统的知识表达方法、装置及系统 第 2 页 专利 一种面向医疗信息系统的知识表达方法、装置及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。