说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210667292.9 (22)申请日 2022.06.13 (71)申请人 四川数愈医疗科技有限公司 地址 610000 四川省成 都市温江区永宁镇 隆平路408号 (72)发明人 向飞 秦航宇 曾欢 贺涛 葛坤  张金毅  (74)专利代理 机构 成都顶峰专利事务所(普通 合伙) 51224 专利代理师 杨俊华 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/31(2019.01) G06F 16/36(2019.01) G16H 70/20(2018.01) (54)发明名称 一种医疗认知智能科研平台的知识提取方 法 (57)摘要 本发明公开了一种医疗认知智能科研平台 的知识提取方法, 涉及滚塑技术领域, 包括以下 步骤S1、 数据源获取; S2、 数据源采掘; S3、 数据清 洗; S4、 知 识图谱构建; S5、 知识存储和人工纠错。 该医疗认知智能科研平台的知识提取方法, 采用 分布式爬虫框架Scrapy抓取超过10个网页获取 数据, 使得数据具有广泛性与全面性并针对获取 的数据进行采掘融合, 并在融合的数据不限定文 本, 同时融合的还有图片与视频数据, 保证了数 据的全面性同时也方便了查阅人员的直观查看, 并利用NoSQL构建知识图谱使得方便使用者查 询, 并利用数据清洗将数据中重复性数据与无效 性数据剔除, 使得能够减小数据的占用空间保证 知识数据的精炼性的同时也方便了后期对知识 数据的维护。 权利要求书1页 说明书3页 CN 115033694 A 2022.09.09 CN 115033694 A 1.一种医疗认知智能科研平台的知识提取 方法, 其特 征在于, 包括以下步骤: S1、 数据源获取 利用万维网获取原始的知识数据源, 为了保证数据源的可靠性, 采取多抓取式, 在网站 获取疾病 、 症状和手术 等信息; S2、 数据源 采掘 对S1中获取的数据进行采掘提取, 从三个方向对获取的数据进行分类、 存储和剔除, 随 后对处理的知识数据进行融合, 降低知识数据中的重复性数据与无效数据并对重复性数据 与无效数据进行 标注; S3、 数据清洗 将S2中融合的知识数据中受标注的数据进行清洗, 减小数据的占用空间保证知识数据 的精炼性的同时也方便 了后期对知识数据的维护; S4、 知识图谱构建 将清洗后的融合数据基于NoSQL数据库来构建知识图谱, 该知识图谱从实体定义、 属性 定义和关系定义对数据分支构建; S5、 知识存 储与人工纠错 随后将知识数据进行数据保存, 并对标准化的知识数据源使进行预标注, 然后由人工 对知识数据源进行纠错与补标。 2.根据权利要求1所述的一种医疗认知智能科研平台的知识提取方法, 其特征在于: 所 述在S1数据源获取 过程中采用的分布式爬虫框架Scrapy获取 数据。 3.根据权利要求1所述的一种医疗认知智能科研平台的知识提取方法, 其特征在于: 所 述在S2数据源采掘过程中数据分类的三个方向为结构化数据。 半结构化数据和非结构化数 据。 4.根据权利要求1所述的一种医疗认知智能科研平台的知识提取方法, 其特征在于: 所 述在S2数据源采掘过程中对知识数据进行整和管理和保护, 同时数据的融合包括图形、 视 频与文本的自由融合。 5.根据权利要求1所述的一种医疗认知智能科研平台的知识提取方法, 其特征在于: 所 述在S4知识图谱构建过程中N oSQL数据库具有查询性能高、 应用方便、 开发敏捷等优点。 6.根据权利要求1所述的一种医疗认知智能科研平台的知识提取方法, 其特征在于: 所 述在S5知识存 储与人工纠错过程中采用预训练模型进行 预标注。权 利 要 求 书 1/1 页 2 CN 115033694 A 2一种医疗认知智能科研平台的知识提取方 法 技术领域 [0001]本发明涉及医疗认知智能科研平台技术领域, 具体为一种医疗认知智能科研平台 的知识提取 方法。 背景技术 [0002]智能医疗是通过打造健康档案区域医疗信息平台, 利用最先进的物联网技术, 实 现患者与医务人员、 医疗机构、 医疗设备之间的互动, 逐步达到信息化, 由于线下医疗资源 紧缺, 人们越来越倾向于在互联网上寻找健康知识, 采用医疗 数据构建知识图谱, 使用知识 图谱能够以疾病为中心, 显示疾病与其他医学信息(如症状和药物)之间的关系, 并且它们 通常具有查询、 问答功能, 用户可以通过输入关键字, 从知识图谱中获取自己想要的医疗信 息。 [0003]现有的知识提取方法方法常常不够全面, 导致对疾病特征的描述不够清晰导致影 响患者的判断, 同时不能够实时补充信息, 单靠算法抓取信息不够全面, 为此, 我们提出一 种医疗认知智能科研平台的知识提取 方法。 发明内容 [0004]针对现有技术的不足, 本发明提供了一种医疗认知智能科研平台的知识提取方 法, 解决了上述背景技 术中提出的问题。 [0005]为实现以上目的, 本发明通过以下技术方案予以实现、 一种医疗认知智能科研平 台的知识提取 方法, 包括以下步骤: [0006]S1、 数据源获取 [0007]利用万维网获取原始的知识 数据源, 为了保证数据源的可靠性, 采取多抓取式, 在 网站获取疾病 、 症状和手术 等信息; [0008]S2、 数据源 采掘 [0009]对S1中获取的数据进行采掘提取, 从三个方向对获取的数据进行分类、 存储和剔 除, 随后对处理的知识数据进行融合, 降低知识数据中的重复性数据与无效数据并对重复 性数据与无效数据进行 标注; [0010]S3、 数据清洗 [0011]将S2中融合的知识数据中受标注的数据进行清洗, 减小数据的占用空间保证知识 数据的精炼性的同时也方便 了后期对知识数据的维护; [0012]S4、 知识图谱构建 [0013]将清洗后的融合数据基于NoSQL数据库来构建知识图谱, 该知识图谱从实体定义、 属性定义和关系定义对数据分支构建; [0014]S5、 知识存 储与人工纠错 [0015]随后将知识数据进行数据保存, 并对标准化的知识数据源使进行预标注, 然后由 人工对知识数据源进行纠错与补标。说 明 书 1/3 页 3 CN 115033694 A 3

.PDF文档 专利 一种医疗认知智能科研平台的知识提取方法

文档预览
中文文档 5 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共5页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种医疗认知智能科研平台的知识提取方法 第 1 页 专利 一种医疗认知智能科研平台的知识提取方法 第 2 页 专利 一种医疗认知智能科研平台的知识提取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。