说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210553390.X (22)申请日 2022.05.20 (71)申请人 阿里巴巴 (北京) 软件服 务有限公司 地址 100102 北京市朝阳区望京东园四区9 号楼3层3 01号 (72)发明人 贺勇 张顺 曾震宇  (74)专利代理 机构 北京太合九思知识产权代理 有限公司 1 1610 专利代理师 张爱 刘戈 (51)Int.Cl. G06F 16/36(2019.01) G16H 50/20(2018.01) (54)发明名称 一种医疗知识图谱的构建方法、 设备及存储 介质 (57)摘要 本申请实施例提供一种医疗知识图谱的构 建方法、 设备及存储介质。 可从真实的就诊医疗 数据中抽取出诊断实体、 医疗项目实体以及诊断 实体与医疗项目实体之间的伴随关系; 基于伴随 关系分别计算各个诊断实体对各个医疗项目实 体的亲和度以及各个医疗项目实体对各个诊断 实体的亲和度; 根据亲和度在 诊断实体与医疗项 目实体之间进行互选操作, 以获得互选成功的实 体对, 从而构建出医疗知识图谱。 这样, 可基于大 数据自动化构建出动态的医疗知识图谱, 从而提 高医疗知识图谱的构建效率; 且通过诊断实体与 医疗项目实体 之间互选的方式, 可在完全不需要 人工干预的前提下, 为诊断实体精准地、 全面地 选出更具代表 性的医疗项目实体, 以保证医疗知 识图谱的质量。 权利要求书2页 说明书12页 附图4页 CN 115033708 A 2022.09.09 CN 115033708 A 1.一种医疗知识图谱的构建方法, 包括: 从指定范围的就诊医疗数据中, 抽取诊断实体、 医疗项目实体以及诊断实体与医疗项 目实体之间的伴随关系, 其中, 出现在同一就诊医疗数据中的诊断实体和医疗项目实体之 间具有伴随关系; 基于所述伴随关系, 分别计算各个诊断实体对各个医疗项目实体的亲和度以及各个医 疗项目实体对各个诊断实体的亲和度; 根据亲和度, 在诊断实体与医疗项目实体之间进行互选操作, 以获得互选成功 的实体 对; 按照互选成功的实体对, 构建医疗知识图谱。 2.根据权利要求1所述的方法, 所述按照互选成功的实体对, 构建医疗知识图谱, 包括: 根据互选成功的实体对, 确定与目标诊断实体 配对的医疗项目实体; 基于与目标诊断实体配对的医疗项目实体, 构建以所述目标诊断实体为中心的医疗知 识图谱。 3.根据权利要求1所述的方法, 所述基于所述伴随关系, 分别计算各个诊断实体对各个 医疗项目实体的亲和度以及各个医疗项目实体对各个诊断实体的亲和度, 包括: 基于所述伴随关系, 计算使用目标医疗项目且诊断为目标诊断的就诊次数在所述目标 诊断对应的就诊总次数中的占比, 作为所述目标医疗项目实体对所述目标诊断实体的亲和 度; 基于所述伴随关系, 计算使用所述目标医疗项目且诊断为所述目标诊断的就诊次数在 使用所述目标医疗项目的就诊总次数中的占比, 作为所述目标诊断实体对 所述目标医疗项 目实体的亲和度。 4.根据权利要求1所述的方法, 所述根据亲和度, 在诊断实体与医疗项目实体之间进行 互选操作, 以获得互选成功的实体对, 包括: 在多个指定的项目类型中, 确定目标医疗项目实体所属的目标项目类型; 若目标诊断实体对所述目标医疗项目实体的亲和度和所述目标医疗项目实体对所述 目标诊断实体的亲和度满足所述目标项目类型下要求的亲和度互选标准, 则确定所述目标 诊断实体和所述目标医疗项目互选成功。 5.根据权利要求 4所述的方法, 还 包括: 按照各个诊断实体各自对所述目标医疗项目实体的亲和度, 选择亲和度最大的m个诊 断实体构成所述目标医疗项目实体对应的诊断实体集 合; 从所述目标项目类型下包含的各个医疗项目实体中, 选择对所述目标诊断实体的亲和 度最大的n个医疗项目实体构成所述目标诊断实体在所述目标项目类型下对应的医疗项目 实体集合; 若所述目标诊断实体处于所述诊断实体集合内且所述目标医疗项目实体位于所述医 疗项目实体集合中, 则确定所述目标诊断实体对所述目标医疗项目实体的亲和度和所述目 标医疗项目实体对所述目标诊断实体的亲和度满足所述目标项目类型下要求的亲和度互 选标准。 6.根据权利要求4所述的方法, 所述在多个指定的项目类型中, 确定目标医疗项目实体 所属的目标项目类型, 包括:权 利 要 求 书 1/2 页 2 CN 115033708 A 2从所述就诊医疗数据中抽取 所述目标医疗项目实体相关的描述文本; 将所述描述文本 输入预置的分类模型中; 在所述分类模型中, 基于描述文本与项目类型之间的映射关系, 输出所述目标医疗项 目实体所属的目标项目类型。 7.根据权利要求1所述的方法, 还 包括: 在所述医疗知识图谱中标注各个医疗项目实体所属的项目类型。 8.根据权利要求1所述的方法, 所述从指定范围的就诊医疗数据中, 抽取诊断实体和医 疗项目实体, 包括: 从所述就诊医疗数据中抽取诊断名称和医疗项目名称; 对诊断名称和医疗项目名称分别进行归一 化, 以获得诊断实体和医疗项目实体。 9.根据权利要求8所述的方法, 对所述诊断名称进行归一 化, 包括: 两两计算诊断名称之间的相似度; 基于相似度对诊断名称进行聚类, 以获得多个相互独立的诊断名称集 合; 将同一诊断名称集 合中的各个诊断名称归一 化至统一的诊断实体。 10.根据权利要求9所述的方法, 所述将同一诊断名称集合中的各个诊断名称归一化至 统一的诊断实体, 包括: 统计同一诊断名称集 合内各个诊断名称对应的就诊次数; 将就诊次数最多的诊断名称, 作为所述诊断名称集 合归一化输出的诊断实体。 11.根据权利要求1所述的方法, 还 包括: 从所述就诊医疗数据中, 抽取诊断实体以及医疗项目实体各自对应的属性信息; 在所述医疗知识图谱中标注诊断实体以及医疗项目实体各自对应的属性信息 。 12.根据权利要求1所述的方法, 还 包括: 基于新增的就诊医疗数据, 对所述医疗知识图谱进行 更新。 13.一种计算设备, 包括存 储器、 处理器和通信组件; 所述存储器用于存 储一条或多条计算机指令; 所述处理器与所述存储器和所述通信组件耦合, 用于执行所述一条或多条计算机指 令, 以用于: 从指定范围的就诊医疗数据中, 抽取诊断实体、 医疗项目实体以及诊断实体与医疗项 目实体之间的伴随关系, 其中, 出现在同一就诊医疗数据中的诊断实体和医疗项目实体之 间具有伴随关系; 基于所述伴随关系, 分别计算各个诊断实体对各个医疗项目实体的亲和度以及各个医 疗项目实体对各个诊断实体的亲和度; 根据亲和度, 在诊断实体与医疗项目实体之间进行互选操作, 以获得互选成功 的实体 对; 按照互选成功的实体对, 构建医疗知识图谱。 14.一种存储计算机指令的计算机可读存储介质, 当所述计算机指令被一个或多个处 理器执行时, 致使 所述一个或多个处理器执行权利要求 1‑12任一项 所述的医疗知识图谱的 构建方法。权 利 要 求 书 2/2 页 3 CN 115033708 A 3

.PDF文档 专利 一种医疗知识图谱的构建方法、设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种医疗知识图谱的构建方法、设备及存储介质 第 1 页 专利 一种医疗知识图谱的构建方法、设备及存储介质 第 2 页 专利 一种医疗知识图谱的构建方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。