说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210841464.X (22)申请日 2022.07.18 (71)申请人 湖南创星科技股份有限公司 地址 410000 湖南省长 沙市长沙高新开发 区岳麓西大道1698号麓谷科技创新创 业园B1栋7楼、 8楼及B2栋7楼、 8楼 (72)发明人 段志强 文建全 彭炜 任强  黄刊迪 谢春梅  (74)专利代理 机构 长沙智德知识产权代理事务 所(普通合伙) 43207 专利代理师 陈铭浩 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/36(2019.01) G06F 40/289(2020.01)G16H 10/60(2018.01) (54)发明名称 一种诊断名称标准化的智能匹配方法及系 统 (57)摘要 本发明公开了一种诊断名称标准化的智能 匹配方法及系统, 本发明提出的诊断名称标准化 的智能匹配方法提出了一种基于自然语言处理 和医学知 识库, 由自然语言诊断名称到IDC9 ‑CM‑ 3、 ICD10标准诊断编码及名称的智能匹配技术, 以提高医学文本的结构化水平; 本发 明可以高效 快速的实现对医师输入的杂乱无序的诊断术语 达到标准有序的后结构化目标, 能够更加高效的 帮助医师将手写的电子病历进行结构化匹配; 在 医院的实际挂号和会诊 过程中发挥 落地能力, 降 低因医师主观疏忽原因导致的误诊事故, 从而推 进数字医疗产业 化。 权利要求书2页 说明书7页 附图1页 CN 114996388 A 2022.09.02 CN 114996388 A 1.一种诊断名称标准 化的智能匹配方法, 其特 征在于, 包括: 获取标准化的字典数据, 国际疾病分类编码以及常用诊断文本数据; 基于字典数据和国际疾病分类编码对常用诊断文本数据进行分词, 以形成语料库; 对分词后形成的所述语料库进行词嵌入训练, 以形成词向量表; 对词向量表进行加权以得到医学术语的训练句子向量; 构建机器学习模型; 获取对语料库中的文本序列进行人工标注后得到的机器学习模型输入所需的标记数 据集; 基于标记数据集将词向量表作为所述机器学习模型的输入, 将训练句子向量作为所述 机器学习模型的输出, 以对所述机器学习模型进行训练; 获取用户通过用户终端输入的实际诊断文本, 将所述实际诊断文本输入完成训练的所 述机器学习模型, 以得到实际句子向量; 基于实际句子向量 生成与实际诊断文本数据对应的候选术语。 2.根据权利要求1所述的一种 诊断名称标准化的智能匹配方法, 其特征在于, 所述基于 字典数据和国际疾病分类编码对常用诊断文本数据进行分词, 以形成语料库, 包括: 获取医学术语表; 基于医学术语表生成自定义词典; 基于字典数据、 国际疾病分类编码和自定义词典对常用诊断文本数据进行分词, 以形 成语料库。 3.根据权利要求1所述的一种 诊断名称标准化的智能匹配方法, 其特征在于, 所述基于 实际句子向量 生成与实际诊断文本数据对应的候选术语, 之后还 包括: 对人工干预过后的候选术语采用协同过 滤算法进行 过滤, 以生成初始推荐结果。 4.根据权利要求3所述的一种 诊断名称标准化的智能匹配方法, 其特征在于, 所述对人 工干预过后的候选术语采用协同过 滤算法进行 过滤, 以生成初始推荐结果, 包括: 获取用户通过用户终端输入的选择 数量; 将所述候选术语的数量设置为所述选择 数量。 5.根据权利要求3所述的一种 诊断名称标准化的智能匹配方法, 其特征在于, 所述对人 工干预过后的候选术语采用协同过 滤算法进行 过滤, 以生成初始推荐结果, 之后还 包括: 采用云原生向量数据库对初始推荐结果进行向量检索以得到倒排索引; 根据索引编号获取初始推荐结果对应的key ‑value数据库中存储的具体术语缓存数 据; 将具体术语缓存数据推荐给用户。 6.根据权利要求5所述的一种 诊断名称标准化的智能匹配方法, 其特征在于, 所述将具 体术语缓存数据推荐给用户, 包括: 将具体术语缓冲数据通过用户终端的显示界面以下拉框的形式进行显示。 7.根据权利要求1所述的一种 诊断名称标准化的智能匹配方法, 其特征在于, 所述基于 字典数据和国际疾病分类编码对常用诊断文本数据进行分词, 以形成语料库, 还 包括: 通过Python的第三方分词模块基于字典数据和国际疾病分类编码对常用诊断文本数 据进行分词, 以形成语料库。权 利 要 求 书 1/2 页 2 CN 114996388 A 28.根据权利要求1所述的一种 诊断名称标准化的智能匹配方法, 其特征在于, 所述基于 标记数据集将词向量表作为所述机器学习模型的输入, 包括: 将词向量表的文本序列中的各个单词, 通过词向量表映射 为对应的词向量序列; 基于所述标记数据集将所述词向量序列 作为所述机器学习模型的输入。 9.根据权利要求1所述的一种 诊断名称标准化的智能匹配方法, 其特征在于, 所述标记 数据集包括标记名; 所述标记名和所述文本序列一 一对应。 10.一种诊断名称标准化的智能匹配系统, 其特征在于, 应用于如权利要求1 ‑9中任一 项所述的诊断名称标准 化的智能匹配方法; 所述系统包括: 标准术语字典建模模块, 用于获取标准化的字典数据, 国际疾病分类编码及常用诊断 文本数据; 基于字典数据和国际疾病分类编码对常用诊断文本数据进行分词, 以形成语料 库; 对分词后形成的所述语料库进 行词嵌入训练, 以形成词向量表; 对词向量表进 行加权以 得到医学术语的训练句 子向量; 构建机器学习模型; 基于标记数据集将词向量表作为所述 机器学习模型 的输入, 将训练句 子向量作为所述机器学习模型的输出, 以对所述机器学习 模型进行训练; 推荐模块, 用于获取对语料库中的文本序列进行人工标注后得到的机器学习 模型输入 所需的标记数据集; 基于实际句子向量 生成与实际诊断文本数据对应的候选术语; 用户画像模块, 用于获取用户通过用户终端输入的实 际诊断文本, 将所述实 际诊断文 本输入完成训练的所述机器学习模型, 以得到实际句子向量。权 利 要 求 书 2/2 页 3 CN 114996388 A 3

.PDF文档 专利 一种诊断名称标准化的智能匹配方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种诊断名称标准化的智能匹配方法及系统 第 1 页 专利 一种诊断名称标准化的智能匹配方法及系统 第 2 页 专利 一种诊断名称标准化的智能匹配方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。