说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211423169.9 (22)申请日 2022.11.15 (71)申请人 南京腾鸿医疗科技有限公司 地址 210000 江苏省南京市雨 花台区软件 大道180号大 数据6号楼3 07室 (72)发明人 林娜 王滔 孙红波 何涛  (74)专利代理 机构 南京中盟科创知识产权代理 事务所 (特殊普通合伙) 32279 专利代理师 孙丽君 (51)Int.Cl. G16H 50/30(2018.01) G16H 50/20(2018.01) G16B 50/00(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于标准化表型术语的疾病和基因预 测方法 (57)摘要 本发明公开了一种基于标准化表型术语的 疾病和基因预测方法, 该方法包括以下步骤: S1、 将原始疾病表型通过输入层进行分层级输入; S2、 将输入后的原始疾病表型通过数据层转换为 标准疾病表型; S3、 将标准疾病表型通过分析层 进行逐级搜索, 并进行评分预测; S4、 将预测结果 通过输出层输出。 本发明通过对表型输入的自然 语言处理, 逐级搜索不同层 级表型进行打分来预 测疾病和基因, 且逐级以上一个标准疾病表型打 分最高的疾病作为搜索域, 逐级减少下一级的搜 索范围, 使得本发明大大减少了计算量的时间, 极大的提高了本发明的使用效率, 以及避免了非 主要表型对于疾病预测的主导作用。 权利要求书2页 说明书6页 附图2页 CN 115512843 A 2022.12.23 CN 115512843 A 1.一种基于标准化表型术语的疾病和基因预测方法, 其特征在于, 该方法包括以下步 骤: S1、 将原始疾病表型通过输入层进行分层级输入; S2、 将输入后的原 始疾病表型通过 数据层转换为标准疾病表型; S3、 将标准疾病表型通过分析层进行 逐级搜索, 并进行评分预测; S4、 将预测结果 通过输出层输出。 2.根据权利要求1所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述将原 始疾病表型通过输入层进行分层级输入 包括以下步骤: S11、 将原始疾病层级依次分为原 始主要表型、 原 始次要表型及原 始其他表型; S12、 将原 始主要表型、 原 始次要表型及原 始其他表型赋予权重。 3.根据权利要求2所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述原 始主要表型、 原 始次要表型及原 始其他表型权 重比分别为7: 3: 1。 4.根据权利要求1所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述将输入后的原 始疾病表型通过 数据层转换为标准疾病表型包括以下步骤: S21、 将输入的原 始疾病表型通过自然语言处 理; S22、 将处理后的原 始疾病表型转 化为人类表型 数据库中的标准疾病表型。 5.根据权利要求4所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述将输入的原 始疾病表型通过自然语言处 理包括以下步骤: S211、 通过语义检索任务, 将人类表型数据库中的标准疾病表型作为被检索对象对输 入的原始疾病表型进行检索; S212、 基于CosENT模型对STS ‑B数据集进行训练, 训练完成后得到用于语义检索的模 型; S213、 设定相似性分数的阈值; S214、 对训练结果进行选择; 其中, 所述标准疾病表型包括标准主 要表型、 标准次要表型及标准 其他表型。 6.根据权利要求5所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述将标准疾病表型通过分析层进行 逐级搜索, 并进行评分预测包括以下步骤: S31、 将标准疾病表型依次按照主 要表型、 次要表型及其 他表型进行搜索; S32、 对搜索后的表型根据权 重计算评分; S33、 将评分结果进行分析 预测。 7.根据权利要求6所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述将标准疾病表型依次按照主 要表型、 次要表型及其 他表型进行搜索包括以下步骤: S311、 将标准疾病表型从主 要表型开始在疾病表型整合数据库进行搜索; S312、 将主要表型搜索完成后的结果通过次要表型在疾病表型整合数据库进行二 次搜 索; S313、 将次要表型搜索完成后的结果通过次要表型在疾病表型整合数据库进行三 次搜 索。 8.根据权利要求7所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述将标准疾病表型从主 要表型开始在疾病表型整合数据库进行搜索包括以下步骤:权 利 要 求 书 1/2 页 2 CN 115512843 A 2对人类表型数据库中所含有的表型、 疾病和基因进行关联, 关联的规则基于一种表型 对应一种疾病的唯一关系去寻找相对应的所有基因, 建立三者的关联关系, 将其整合为一 个数据库用作逐级搜索评分的参 考库。 9.根据权利要求8所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述对搜索后的表型根据权 重计算评分包括以下步骤: 将搜索结果通过权重进行评分计算, 得到搜索的总分并筛选得分最高者作为本次分析 的评分结果。 10.根据权利要求1所述的一种基于标准化表型术语的疾病和基因预测方法, 其特征在 于, 所述将预测结果 通过输出层输出包括以下步骤: 将输入的原始疾病表型所得到的预测疾病、 预测基因及预测疾病的所有表型的结果输 出。权 利 要 求 书 2/2 页 3 CN 115512843 A 3

.PDF文档 专利 一种基于标准化表型术语的疾病和基因预测方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于标准化表型术语的疾病和基因预测方法 第 1 页 专利 一种基于标准化表型术语的疾病和基因预测方法 第 2 页 专利 一种基于标准化表型术语的疾病和基因预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:41:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。