说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210596655.4 (22)申请日 2022.05.30 (71)申请人 中电药明数据科技 (成 都) 有限公司 地址 610095 四川省成 都市高新区仁和街 39号6栋2层1号 (72)发明人 王昕昱 甘喜文 邱文 王晓芳 李震 (74)专利代理 机构 北京中慧创科知识产权代理 事务所 (特殊普通合伙) 11721 专利代理师 由元 (51)Int.Cl. G06F 40/126(2020.01) G06F 40/30(2020.01) G16H 50/20(2018.01) (54)发明名称 一种临床诊断数据标准 化方法和装置 (57)摘要 本发明涉及一种临床诊断数据标准化方法 和装置。 所述方法包括: 接收临床诊断数据并进 行数据校验和数据限制; 对所述数据校验和限制 后的数据进行数据预处理; 将标准化疾病分类代 码及名称创建为Trie多叉树; 将所述数据预处理 后的数据与所述Trie多叉树进行数据匹配, 得到 每条临床诊断数据的匹配等级; 根据所述匹配等 级对所述临床诊断数据进行分类; 根据所述分类 的结果对分类后的临床诊断数据进行标准化输 出。 本申请使用基于完整诊断编码的完全匹配和 基于不完整诊断编码的部分匹配再使用基于词 语相似度的匹配, 相对于人工匹配诊断数据提高 了效率, 相对于单纯依靠诊断编码的匹配提高了 匹配的完整性。 权利要求书3页 说明书11页 附图5页 CN 115017868 A 2022.09.06 CN 115017868 A 1.一种临床诊断数据标准 化方法, 其特 征在于, 包括: 接收临床诊断数据并进行 数据校验和数据限制; 对所述数据校验和限制后的数据进行 数据预处 理; 将标准化疾病分类代码及名称创建为Trie多叉树; 将所述数据预处理后的数据与所述Trie多叉树进行数据匹配, 得到每条临床诊断数据 的匹配等级; 根据所述匹配等级对所述临床诊断数据进行分类; 根据所述分类的结果对分类后的临床诊断数据进行 标准化输出。 2.根据权利要求1所述的方法, 其特 征在于, 所述数据校验对数据非法性进行判断, 如果是非法数据则进行异常提示; 数据限制对 所述临床诊断数据的数据元个数以及信息进 行限定, 所述数据元的信息包含: 诊断编 码、 诊 断名称、 和诊断类型。 3.根据权利要求2所述的方法, 其特 征在于, 所述数据预处 理包括: 去掉数据两端空格, 以及清除预设不允许字符。 4.根据权利要求2或3所述的方法, 其特 征在于, 所述数据匹配包括: 精确匹配、 前缀匹配以及名称匹配, 所述数据匹配之后输出的信 息 包含: 诊断类型、 诊断编码、 诊断名称、 标准 化诊断编码、 标准 化诊断名称、 匹配等级。 5.根据权利要求 4所述的方法, 其特 征在于, 所述匹配等级包括: 等级1: 诊断编码6位码、 附加码和诊断名称完全匹配; 等级2: 诊断编码6位码、 附加码精确匹配; 等级3: 诊断编码6位码精确匹配; 等级4: 诊断编码前3位或4 位码匹配; 等级5: 诊断编码缺失或者全不匹配。 6.根据权利要求5所述的方法, 其特 征在于, 所述分类的结果如下: 第一类数据为正常数据, 可直接标准化输出, 对应的数据匹配等级为等级1、 等级2、 和 等级3; 第二类数据为未能匹配到标准 化数据的异常数据。 7.根据权利要求6所述的方法, 其特 征在于, 所述根据所述分类的结果对分类后的临床诊断数据进行 标准化输出, 包括: 对于第一类数据, 直接标准化输出诊断类型、 诊断编码、 诊断名称、 标准诊断编码、 标准 诊断名称、 和匹配等级; 对于第二类数据, 进一步执行NLP语言处理进行智能匹配, 然后输出诊断类型、 诊断编 码、 诊断名称、 标准诊断编码、 标准诊断名称、 和匹配等级。 8.根据权利要求7 所述的方法, 其特 征在于, 所述NLP语言处理包括: 计算待匹配的诊断名称和标准诊断数据中诊断名称的相似度, 取相似度最高的一项作为匹配到的标准诊断名称。权 利 要 求 书 1/3 页 2 CN 115017868 A 29.根据权利要求8所述的方法, 其特 征在于, 所述相似度的计算方法为以下中的一种: Levenshtein算法、 基于词向量的余弦相似 度、 基于同义词 词林的相似度。 10.一种存储介质, 其特征在于, 所述存储介质包括存储的程序, 其中, 在所述程序运行 时由处理器执行权利要求1至9中任意 一项所述的方法。 11.一种临床诊断数据标准 化装置, 其特 征在于, 包括: 校验限制模块, 用于 接收临床诊断数据并进行 数据校验和数据限制; 预处理模块, 用于对所述数据校验和限制后的数据进行 数据预处 理; 多叉树模块, 用于将标准 化疾病分类代码及名称创建为Trie多叉树; 数据匹配模块, 用于将所述数据预处理后的数据与所述Trie多叉树进行数据匹配, 得 到每条临床诊断数据的匹配等级; 分类模块, 用于根据所述匹配等级对所述临床诊断数据进行分类; 输出模块, 用于根据所述分类的结果对分类后的临床诊断数据进行 标准化输出。 12.根据权利要求1 1所述的装置, 其特 征在于, 所述数据校验对数据非法性进行判断, 如果是非法数据则进行异常提示; 数据限制对 所述临床诊断数据的数据元个数以及信息进 行限定, 所述数据元的信息包含: 诊断编 码、 诊 断名称、 和诊断类型。 13.根据权利要求12所述的装置, 其特 征在于, 所述数据预处 理包括: 去掉数据两端空格, 以及清除预设不允许字符。 14.根据权利要求12或13所述的装置, 其特 征在于, 所述数据匹配包括: 精确匹配、 前缀匹配以及名称匹配, 所述数据匹配之后输出的信 息 包含: 诊断类型、 诊断编码、 诊断名称、 标准 化诊断编码、 标准 化诊断名称、 匹配等级。 15.根据权利要求14所述的装置, 其特 征在于, 所述匹配等级包括: 等级1: 诊断编码6位码、 附加码和诊断名称完全匹配; 等级2: 诊断编码6位码、 附加码精确匹配; 等级3: 诊断编码6位码精确匹配; 等级4: 诊断编码前3位或4 位码匹配; 等级5: 诊断编码缺失或者全不匹配。 16.根据权利要求15所述的装置, 其特 征在于, 所述分类的结果如下: 第一类数据为正常数据, 可直接标准化输出, 对应的数据匹配等级为等级1、 等级2、 和 等级3; 第二类数据为未能匹配到标准 化数据的异常数据。 17.根据权利要求16所述的装置, 其特 征在于, 所述根据所述分类的结果对分类后的临床诊断数据进行 标准化输出, 包括: 对于第一类数据, 直接标准化输出诊断类型、 诊断编码、 诊断名称、 标准诊断编码、 标准 诊断名称、 和匹配等级; 对于第二类数据, 进一步执行NLP语言处理进行智能匹配, 然后输出诊断类型、 诊断编权 利 要 求 书 2/3 页 3 CN 115017868 A 3
专利 一种临床诊断数据标准化方法和装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 14:06:53
上传分享
举报
下载
原文档
(1.4 MB)
分享
友情链接
ISO-IEC-IEEE 29119-1 2022 Software and systems engineering - Software testing - Part 1 General concepts.pdf
ISO 22435 2024 Gas cylinders — Cylinder valves with integrated pressure regula.pdf
ISO 22662 2024 Milk and milk products — Determination of lactose content by.pdf
ISO 12224-1 2024 Solder wire solid and flux-cored Specification and test methods Part 1 Classification and performance requirements.pdf
ISO 21308-1 2018 Road vehicles Product data exchange between chassis and bodywork manufacturers (BEP) Part 1 General principles.pdf
ISO 603-9 2024 Bonded abrasive products — Dimensions — Part 9 Grinding wheels.pdf
ISO 7076-6 2016 Fire protection — Foam fire extinguishing systems — Part 6 Vehicle mounted compressed air foam systems.pdf
ISO IEC 26550 2015 Software and systems engineering — Reference model for product line engineering and management.pdf
ISO 13879 1999 Petroleum and natural gas industries — Content and drafting of a functional specification.pdf
ISO 13799 2020 Ships and marine technology Ship s mooring and towing fittings Recessed bitts (casting type).pdf
GB-T 20658-2006 原油和液体石油产品 粘稠烃的体积计量.pdf
GB-T 24136-2009 橡胶或塑料涂覆织物 耐液体性能的测定.pdf
GB-T 4167-2024 砝码.pdf
GB-T 41146-2021 绝缘液体取样方法.pdf
GB-T 21355-2022 无损检测 基于存储磷光成像板的工业计算机射线照相检测 系统分类.pdf
GB-T 17127.2-1997 农业轮式拖拉机和机具 三点悬挂挂接器 第2部分 A型框架式挂接器.pdf
GB-T 44452-2024 工业过程测量控制和自动化 系统和部件的生命周期管理.pdf
GB-T 12204-2010 金属切削 基本术语.pdf
GB-T 23129-2008 家用咖啡机性能测试方法.pdf
GB 9448-1999 焊接与切割安全.pdf
1
/
3
20
评价文档
赞助1.5元 点击下载(1.4 MB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。