说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211057871.8 (22)申请日 2022.08.30 (71)申请人 南京邮电大 学 地址 210046 江苏省南京市仙林大 学城文 苑路9号 申请人 安徽晶奇网络科技股份有限公司 (72)发明人 李鹏 周宁 郑会 陈静 徐鹤 王汝传 张玉杰 李友涛 张结魁 陈莉莉 (74)专利代理 机构 南京经纬专利商标代理有限 公司 32200 专利代理师 王美章 (51)Int.Cl. G16H 50/70(2018.01) G06F 16/25(2019.01) (54)发明名称 一种基于医疗场景的模糊 高效用模式挖掘 方法 (57)摘要 本发明提出了一种基于医疗场景的模糊 高 效用模式挖掘方法, 通过引入模糊集理论与模糊 函数模型, 使得高效用模式挖掘算法不仅可以适 用于交易数据库场景中, 同时也可以适用于医疗 数据场景中, 并且能够增强挖掘结果的可解释 性。 该方法结合一阶段高效用模式挖掘算法与两 阶段高效用模式挖掘算法的特点, 在面对不同特 点的数据集时, 模糊过程中对时间以及空间的消 耗相对比较稳定, 挖掘过程中相对于传统的单一 算法具有较好的性能。 权利要求书1页 说明书6页 附图8页 CN 115440385 A 2022.12.06 CN 115440385 A 1.一种基于医疗场景的模糊高效用模式挖掘方法, 其特 征在于, 包括以下步骤: S1、 收集医疗场景下患 者的各项体检数据并对其进行预处理, 所述预处理是: 参考医学 标准的人类各项指标区间以及标准值, 将超出区间范围的值, 用边界值进行填补后得到原 始数据库数据; S2、 该步骤S1得到的原始数据库数据通过模糊函数后, 得到区间的隶属度值, 将其作 为 内部效用值, 人为指定外部效用表, 从而获得可被高效用模式挖掘算法所挖掘的模糊数据 库; S3、 将步骤S2得到的模糊数据库, 使用两阶段挖掘算法进行挖掘, 周期性调用切换模 块, 判断是否满足切换条件, 若满足则切换使用一阶段挖掘算法处理, 挖掘模糊高效用模 式。 2.根据权利要求1所述的基于医疗场景的模糊高效用模式挖掘方法, 其特征在于, 步骤 S1中数据的预处理采用医学上人体属性标准值进行填充, 之后进行归一化处理, 使得数据 全部落在由模糊函数 所确定的区间内。 3.根据权利要求1所述的基于医疗场景的模糊高效用模式挖掘方法, 其特征在于, 所述 步骤S2中, 选择I型模糊函数或II型模糊函数, 数据经过模糊模块后, 分别计算出低、 中、 高 区间的隶属度值; 经过第一遍扫描后, 得到主区间, 继而得到主区间的隶属度值, 该值用于 高效用模式挖掘算法中的内部效用值, 之后将体检数据中各种属性的外部效用值设定为相 同值。 4.根据权利要求1所述的基于医疗场景的模糊高效用模式挖掘方法, 其特征在于, 步骤 S3具体包括以下子步骤: S3.1、 根据模糊 数据库内容构建头表, 并计算得到相 关参数, 根据头表, 找到每个叶子 结点到根结点的路径, 从而获得条件模式基, 当遍历完成后, 得到所有一项集的模糊高效用 模式; S3.2、 设计切换模块, 将高效用模式挖掘算法中的, 一阶段挖掘算法以及二阶段挖掘算 法的特点结合在一起, 设计切换模块使得算法以自适应于各类场景, 之后筛选出候选高效 用项集, 在计算真实效用值的时候采用基于列表的算法, 从而筛 选出高效用项集; S3.3、 使用Utility ‑list挖掘高效用模式, 在数据库的第一次扫描中, 算法找出TWU高 于最低效用阈值的一项集并进行升序排列, 第二次扫描数据库时, 按照一项集排列顺序重 组数据库, 同时生成对于一项集的效用列表, 在生成一项集效用列表之后, 不断通过组合, {k‑1}‑length项集的效用列表生成{k} ‑length项集的效用列表。 5.根据权利要求4所述的基于医疗场景的模糊高效用模式挖掘方法, 其特征在于, 步骤 S3.2中, 设计切换模块使得算法以自适应于各类场景中的算法包括: 只用两阶段挖掘算法, 计算出高估效用值后进行初筛, 再计算真实效用值来进行挖掘 得到高效用模式; 或只采用一阶段挖掘算法直接计算真实效用值, 并挖掘模糊高效用模式; 或使用树结构去构建效用树, 计算高估效用值。权 利 要 求 书 1/1 页 2 CN 115440385 A 2一种基于医疗场景的模糊高 效用模式挖掘方 法 技术领域 [0001]本发明是属于数据挖掘方向, 具体是一种基于医疗场景的模糊高效用模式挖掘方 法。 背景技术 [0002]随着第一台计算机的问世, 数据也随之产生。 超大规模数据库的出现, 如商业数据 仓库和计算机自动收集数据记录手段的普及使得人类数据量成指数增长。 统计方法在数据 处理领域应用的不断深入, 为人们 挖掘数据库提供了方法。 先进的计算机技术, 如更快和更 大的计算能力和并行体系结构使得人们有能力 在超大规模数据库中挖掘知识。 在这样的背 景下, 数据挖掘技术也就随之产生. 数据挖掘技术有着广泛的应用, 例如, 关联规则挖掘、 序 列模式挖掘、 文本 分类、 Web日志分析和协同过滤。 随着这些年的发展, 高效用模式挖掘技术 也飞速发展, 但高效用模式挖掘主要还是应用于挖掘具有利润信息的数据库, 只考虑这些 项的数值信息, 可解释性较差 。 [0003]数据挖掘是指人们通过仔细 研究分析数据来发现蕴藏在 其中的有意义的关系, 趋 势以及模式的过程。 Agrawal等于1994年提出的Apriori算法以及Han等于2000年提出的FP ‑ growth算法为频繁模式挖掘算法 (frequent itemset mining, FIM) 的代表方法, 经常用来 挖掘事务之间的关系。 之后人们在此基础上研究出许多 FIM挖掘算法 并应用于各种场景中。 但是FIM仅考虑项集是否出现, 忽略了项集本身的价值。 因此Liu等于2005年提出的Two ‑ Phase算法为 高效用模式挖掘 (high ‑utility itemset mining, HUIM) 的经典方法。 HUIM能 够通过外部效用表以及内部效用表充分考虑项集出现的频次以及项集本身所蕴含的价值 这两个因素, 相较于FIM更加具有实际的导向性。 但现阶段的高效用模式挖掘算法, 绝大部 分都基于一阶段挖掘模型或二阶段挖掘模型设计, 这两类挖掘算法在处理同一数据集时, 时间复杂度与空间复杂度差别较大。 因此往往需要技术人员具有丰富的经验, 能够根据数 据集的特点选择合 适的挖掘算法, 这无 形中加大了学习成本 。 [0004]模糊 (fuzzy) 方法是数据挖掘中的常用方法方一。 美国控制论专家, 数学家查德 (Zadeh) 于1965年发表的论文 《模糊集合》 (fuzzy sets) 中提出隶属度函数作为模糊集合的 特征函数, 是模糊集合的核心。 而随着模糊集应用范围不断扩 大, 一些扩充模糊集逐渐被使 用在各个领域中, 这些扩充模糊集包括区间值模糊集, 直觉模糊集, Vague集, II型模糊集 等。 生活中有许多的概念是 无法准确定义的, 往 往是一个模糊的概念。 [0005]在医疗场景中, 基于规则的分类器中采用模糊集理论可以有效的模糊掉阈值以及 边界, 从而解决尖锐点的问题。 由于传统医疗场景中我们获取的各项指标数据常为浮点型 数据, 而经典的FIM算法以及HUIM算法擅长处理布尔型, 二元型以及其他类别型数据。 它们 可以挖掘出不同数据特征之间蕴藏的关系, 所以在疾病的预测以及诊断中具有一定的优 势, 对于未来诊断的发展具有独特 的意义。 在传统医疗场景中我们获取 的各项指标数据常 为浮点型数据, 为此, 我们在处理完脏数据之后, 根据人类各项指标的参考值, 将不同数据 特征进行模糊化处理, 将其转化为布尔型, 二元型, 或者类别型数据, 在利用高效用模式挖说 明 书 1/6 页 3 CN 115440385 A 3
专利 一种基于医疗场景的模糊高效用模式挖掘方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 16:59:43
上传分享
举报
下载
原文档
(948.0 KB)
分享
友情链接
ISO IEC 10165-5 1994 Information technology — Open Systems Interconnection — Structure of management information Generic management information.pdf
ISO IEC 24800-4 2010 Information technology — JPSearch — Part 4 File format for metadata embedded in image data (JPEG and JPEG 2000).pdf
ISO 458-2-1985Plastics. Determination of stiffness in torsion of flexible materials. Part 2_Applicat.pdf
ISO 7201-2-1991Fire extinguishing media. Halogenated hydrocarbons. Part 2_Code of practice for safe.pdf
ISO 21232 2018 Textiles — Determination of moisturizing effect of textile materials by measurement of microclimate between textiles and simulated human skin using sweating guarded hotplate.pdf
ISO-PAS 22101-5 2024 Polyethylene reinforced with short glass fibres (PE-sGF) piping systems for industrial applications Part 5 Fitness for purpose of the system.pdf
ISO 558 1980 Conditioning and testing — Standard atmospheres — Definitions.pdf
ISO 10106 2021 Cork stoppers — Determination of global migration.pdf
ISO 22910 2020 Corrosion of metals and alloys Measurement of the electrochemical critical localized corrosion temperature (E-CLCT) for Ti alloys fabricated via the additive manufacturing method.pdf
ISO 6929 2013 Steel products — Vocabulary.pdf
GB-T 783-2013 起重机械 基本型的最大起重量系列.pdf
GB-T 15636-2008 电离辐射厚度计.pdf
GB-T 14699-2023 饲料 采样.pdf
GB-T 25399-2010 农林拖拉机和机械 液压接头 制动回路.pdf
GB-T 17626.15-2011 电磁兼容 试验和测量技术 闪烁仪 功能和设计规范.pdf
GB-T 15695-2008 信息技术 开放系统互连 表示服务定义.pdf
GB-T 4440-2022 活扳手.pdf
GB-T 3099.3-2017 紧固件术语 表面处理.pdf
GB-T 5117-2012 非合金钢及细晶粒钢焊条.pdf
GB-T 10561-2005 钢中非金属夹杂物含量的测定--标准评级图显微检验法.pdf
1
/
3
16
评价文档
赞助1.5元 点击下载(948.0 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。