说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111643594.4 (22)申请日 2021.12.2 9 (71)申请人 东软集团股份有限公司 地址 110179 辽宁省沈阳市 浑南新区新秀 街2号 (72)发明人 郑铭鑫 曹延泽 刘长虹 韩宇  陆可 孙海伦 吴迪 李博文  (74)专利代理 机构 北京英创嘉友知识产权代理 事务所(普通 合伙) 11447 代理人 贺晓蕾 (51)Int.Cl. G16H 50/20(2018.01) G16H 50/70(2018.01) G06K 9/62(2022.01) (54)发明名称 特征筛选方法、 装置、 存 储介质及电子设备 (57)摘要 本公开涉及一种特征筛选方法、 装置、 存储 介质及电子设备, 该方法通过根据多个目标诊断 对象的指定特征数据, 确定每种该状况特征对应 的第一特征权重和第二特征权重; 根据每种该状 况特征对应的该第一特征权重和该第二特征权 重确定该状况特征的目标特征权重, 该目标特征 权重用于表征该状况特征对于确定该目标诊断 对象为该目标病例对象或者该非目标病例对象 的重要程度; 根据每种该状况特征对应的该目标 特征权重从多种该状况特征中确定该目标状况 特征, 能够有效提高特征筛选结果的可靠性, 也 能够有效减少特征筛选所需的计算量, 从而不仅 能够有效提升特征筛选速率, 也能够为医疗科研 人员的后期诊断和后期模型训练提供可靠的数 据依据。 权利要求书3页 说明书12页 附图4页 CN 114429815 A 2022.05.03 CN 114429815 A 1.一种特 征筛选方法, 其特 征在于, 所述方法包括: 获取多个目标诊断对象中每个所述目标诊断对象的指定特征数据, 所述指定特征数据 包括多种状况特征, 以及所述 目标诊断对 象对应的类别标注数据, 所述类别标注数据用于 标注所述目标诊断对象为目标病例对象或者非目标病例对象; 根据所述多个目标诊断对象的所述指定特征数据, 确定每种所述状况特征对应的第 一 特征权重和第二特 征权重; 根据每种所述状况特征对应的所述第一特征权重和所述第二特征权重确定所述状况 特征的目标特征权重, 所述目标特征权重用于表征所述状况特征对于确定所述目标诊断对 象为所述目标病例对象或者所述非目标病例对象的重要程度; 根据每种所述状况特征对应的所述目标特征权重从多种所述状况特征中确定所述目 标状况特征。 2.根据权利要求1所述的方法, 其特征在于, 根据 所述多个目标诊断对象的所述指定特 征数据, 确定每种所述状况 特征对应的第一特 征权重, 包括: 获取多个所述目标诊断对象中指定目标诊断对象与多个所述目标诊断对象中除所述 指定目标诊断对象之外的其 他目标诊断对象之间的欧式距离; 将所述指定目标诊断对象与所述其他目标诊断对象中所述欧式距离小于第一预设距 离阈值的目标诊断对 象作为所述指定目标诊断对 象对应的第一目标诊断对 象集合中的元 素; 在确定所述第一目标诊断对象集合中包括多个目标病例对象和多个非目标病例的情 况下, 将所述第一目标诊断对象集合对应的所述指定目标诊断对象作为待定目标诊断对 象, 以得到由多个所述待定目标诊断对象组成的第二目标诊断对象集 合; 获取所述第一目标诊断对象集合中每个所述待定目标诊断对象对应的目标同类对象 和目标非同类对象; 获取每个所述待定目标诊断对象的每种所述状况特征与该待定目标诊断对象对应的 目标同类对象的该状况特征的第一平均 距离, 以及每个所述待定目标诊断对象的每种所述 状况特征与该待定目标诊断对象对应的目标非同类对象的该状况 特征的第二平均距离; 依次根据所述第二目标诊断对象集合中每个所述待定目标诊断对象的每种状况特征 对应的所述第一平均距离和所述第二平均距离确定每种所述状况特征对应的第一特征权 重。 3.根据权利要求2所述的方法, 其特征在于, 所述获取所述第 一目标诊断对象集合中每 个所述待定目标诊断对象对应的目标同类对象和目标非同类对象, 包括: 在所述待定目标诊断对象为目标病例对象的情况下, 获取所述待定目标诊断对象与 所 述第一目标诊断对象集合中目标病例对象的第一目标距离, 并获取所述待定目标诊断对象 与所述第一目标诊断对象集合中非目标病例对象的第二目标距离, 将所述第一目标诊断对 象集合中所述第一目标距离最小的预设数量个目标病例对象作为所述目标同类对象, 将所 述第一目标诊断对象集合中所述第二目标距离最小的所述预设数量个非目标病例对 象作 为所述目标非同类对象; 在所述待定目标诊断对象为非 目标病例对象的情况下, 获取所述待定目标诊断对象与 所述第一目标诊断对象集合中目标病例对象的第三目标距离, 和所述待定目标诊断对象与权 利 要 求 书 1/3 页 2 CN 114429815 A 2所述第一目标诊断对象集合中非目标病例对象的第四 目标距离, 将所述第一目标诊断对象 集合中所述第四 目标距离最小的预设数量个非目标病例对象作为所述目标同类对象, 将所 述第一目标诊断对象集合中所述第三目标距离最小的预设数量个目标病例对 象作为所述 目标非同类对象。 4.根据权利要求2所述的方法, 其特征在于, 所述依次根据 所述第二目标诊断对象集合 中每个所述待定目标诊断对 象的每种状况特征对应的所述第一平均距离和所述第二平均 距离确定每种所述状况 特征对应的第一特 征权重, 包括: 获取每种所述状况 特征对应的第一预设初始特 征权重; 遍历所述第 二目标诊断对象集合中每个所述待定目标诊断对象的每种状况特征, 执行 以下权重调节步骤, 以得到每种 所述状况特征更新后的所述第一预设初始特征权重, 并将 每种所述状况特征更新后的所述第一预设初始特征权重作为该状况特征对应的第一特征 权重; 其中, 所述权 重调节步骤 包括: 在所述第一平均距离小于所述第 二平均距离的情况下, 将当前所述状况特征的所述第 一预设初始特征权重增加第一预设权重阈值; 在所述第一平均 距离大于所述第二平均距离 的情况下, 将当前所述状况特征 的所述第一预设初始特征权重减小第二预设权重阈值; 在 所述第一平均距离等于所述第二平均 距离的情况下, 保持当前所述状况特征的所述第一预 设初始特 征权重不变。 5.根据权利要求1所述的方法, 其特征在于, 根据 所述多个目标诊断对象的所述指定特 征数据, 确定每种所述状况 特征对应的第二特 征权重, 包括: 获取预设初始模型, 所述预设初始模型包括每种状况 特征的第二预设初始特 征权重; 以所述多个目标诊断对象的指定特征数据为训练数据, 对所述预设初始模型进行迭代 训练, 以得到目标判断模型, 所述 目标判断模型包括每种状况特征对应的所述第二特征权 重。 6.根据权利要求5所述的方法, 其特征在于, 所述以所述多个目标诊断对象的指定特征 数据为训练数据, 对 所述预设初始模型进 行迭代训练, 以得到目标判断模型, 所述目标判断 模型包括每种状况 特征对应的所述第二特 征权重, 包括: 将所述多个目标诊断对象中指定数量个目标病例对象作为 参考对象; 获取所述多个目标诊断对象中除所述参考对象外的每个所述目标诊断对象中的每种 状况特征与所述 参考对象中该状况 特征的目标差值; 根据每种所述状况 特征的所述目标差值确定该状况 特征对应的融合特 征; 根据每种状况特征对应的所述融合特征和预设损失函数对所述预设初始模型进行迭 代训练, 以得到所述目标判断模型。 7.根据权利要求6所述的方法, 其特征在于, 所述根据每种状况特征对应的所述融合特 征和预设损失函数对所述预设初始模型进行迭代训练, 以得到所述目标判断模型, 包括: 将每种所述状况特征对应的所述融合特征输入所述预设初始模型, 以得到目标函数 值; 根据所述目标函数值 通过预设损失函数确定当前损失值; 确定所述当前损失值是否小于或者 等于预设损失值阈值;权 利 要 求 书 2/3 页 3 CN 114429815 A 3

.PDF文档 专利 特征筛选方法、装置、存储介质及电子设备

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 特征筛选方法、装置、存储介质及电子设备 第 1 页 专利 特征筛选方法、装置、存储介质及电子设备 第 2 页 专利 特征筛选方法、装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:45:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。