说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211292442.9 (22)申请日 2022.10.21 (71)申请人 南京脑科医院 地址 210029 江苏省南京市广州路264 号 (72)发明人 张锡哲 王菲 孙开金  (74)专利代理 机构 北京睿智保诚专利代理事务 所(普通合伙) 11732 专利代理师 韩迎之 (51)Int.Cl. G16H 50/70(2018.01) G06K 9/62(2022.01) (54)发明名称 一种基于二分类器的生物标志物发现方法 及系统 (57)摘要 本发明公开了一种基于二分类器的生物标 志物发现方法及系统, 应用于医学分析领域, 包 括: 基于bagging思想, 构建正负样本数据集, 划 分为训练集和测试集, 并通过训练集训练二分类 器; 通过投票法计算测试集在二 分类器上的分类 准确率, 并基于零假设和中心极限定理, 以分类 准确为统计量, 计算分类准确率的显著性, 输出 符合预设阈值条件的二分类器; 通过标签集置换 对二分类器性能的显著性进行评估, 评估待测数 据是否符合预设阈值条件, 以确定最终的生物学 标志物。 本发明不需数据样本满足正态分布, 且 适用于多维数据的生物标志物发现, 提高了生物 标志物发现的准确与适用性。 权利要求书2页 说明书10页 附图3页 CN 115482938 A 2022.12.16 CN 115482938 A 1.一种基于二分类 器的生物标志 物发现方法, 其特 征在于, 包括: 步骤(1): 基于bagging思想, 构建正负样本数据集, 划 分为训练集和测试集, 并通过所 述训练集训练二分类 器; 步骤(2): 通过投票法计算所述测试集在所述二分类器上的二分类器准确率, 并基于零 假设和中心极限定理, 以二分类器准确率为统计量, 计算所述二分类器准确率的显著性, 输 出符合预设阈值条件的二分类 器; 步骤(3): 通过标签集置换评估二分类器性能的显著性是否符合预设阈值条件, 以确定 最终的生物学 标志物。 2.根据权利要求1所述的一种基于二分类器的生物标志物发现方法, 其特征在于, 步骤 (1)中, 基于ba gging思想, 构建正负 样本数据集, 具体为: 比较正样本和负样本的数量大小, 以数量大的样本集作为第一样本集, 数量小的样本 集作为第二样本集; 从所述第一样本集中随机抽取与 所述第二样本集中样本数量相同的样本, 与 所述第二 样本集进行正负 样本合并, 直至所述第一样本集中样本全部采样, 得到正负 样本数据集。 3.根据权利要求1所述的一种基于二分类器的生物标志物发现方法, 其特征在于, 步骤 (2)中, 所述测试集在所述 二分类器上的二分类 器准确率的检验统计量计算式, 如下: 其中, 为二分类器的检验统计量, nte为测试集数量, 是指示函数, 为测试集, zi是 中第i个, 且标签为 li的数据集, f(zi)是条件概率分布p(li=1|zi)的估计。 4.根据权利要求3所述的一种基于二分类器的生物标志物发现方法, 其特征在于, 步骤 (2)中, 基于零假设和中心极限定理, 以而分类器准确率为统计量, 计算所述二分类器准确 率的显著性, 并输出符合预设阈值条件的二分类 器, 计算式如下: 5.根据权利要求3所述的一种基于二分类器的生物标志物发现方法, 其特征在于, 步骤 (3)中, 通过 标签集置换评估二分类 器性能的显著性是否符合预设阈值条件, 计算式如下: 其中, 为通过标签 集置换得到的新的数据集的集合; D'为通 过标签集置换得到的新的 数据集; e(f,D')为在通过标签集置换得到的新的数据集上的二分类器准确率; 为所述正负样本数据集上的二分类 器准确率, k 为置换检验重复次数。 6.根据权利要求4或5所述的一种基于二分类器的生物标志物发现方法, 其特征在于, 所述预设阈值条件为: p是否小于预设阈值。权 利 要 求 书 1/2 页 2 CN 115482938 A 27.一种基于二分类 器的生物标志 物发现系统, 其特 征在于, 包括: 数据处理模块: 用于基于ba gging思想, 构建正负 样本数据集, 划分为训练集和 测试集; 二分类器训练模块: 用于通过 所述训练集训练二分类 器; 二分类器准确率计算模块: 用于通过投票法计算所述测试集在所述二分类器上的二分 类器准确率; 第一二分类器检验模块: 用于基于零假设和中心极限定理, 以二分类器准确率为统计 量, 计算所述 二分类器准确率的显著性, 输出符合预设阈值条件的二分类 器; 第二二分类器检验模块: 用于通过标签集置换评估二分类器性 能的显著性是否符合预 设阈值条件; 二分类器输出模块: 用于 输出符合预设阈值条件的所述 二分类器; 生物标志物输出模块: 用于输入待测数据至符合预设阈值条件的所述二分类器, 确定 最终的生物标志 物。权 利 要 求 书 2/2 页 3 CN 115482938 A 3

.PDF文档 专利 一种基于二分类器的生物标志物发现方法及系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于二分类器的生物标志物发现方法及系统 第 1 页 专利 一种基于二分类器的生物标志物发现方法及系统 第 2 页 专利 一种基于二分类器的生物标志物发现方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:41:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。