说明:收录全网最新的团体标准 提供单次或批量下载
ICS11.020 CCSC07 团 体 标 准 T/LXLY31—2024 多模态老年共病数据集构建方法 Constructionmethodofmultimodalelderlycomorbiditydataset 2024-12-30发布 2024-12-30实施 中国老年学和老年医学学会发布 中国标准出版社出版 全国团体标准信息平台 目 次 前言 Ⅲ ………………………………………………………………………………………………………… 1 范围 1 ……………………………………………………………………………………………………… 2 规范性引用文件 1 ………………………………………………………………………………………… 3 术语和定义 1 ……………………………………………………………………………………………… 4 缩略语 2 …………………………………………………………………………………………………… 5 构建流程 2 ………………………………………………………………………………………………… 6 构建方法 3 ………………………………………………………………………………………………… 7 质量评估 6 ………………………………………………………………………………………………… 8 安全和隐私 7 ……………………………………………………………………………………………… 参考文献 12 …………………………………………………………………………………………………… ⅠT/LXLY31—2024 全国团体标准信息平台 前 言 本文件按照GB/T1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由首都医科大学附属北京友谊医院提出。 本文件由中国老年学和老年医学学会归口。 本文件起草单位:首都医科大学附属北京友谊医院、中国科学院自动化研究所、中国医学科学院阜 外医院、郑州大学第一附属医院、北京市朝阳区疾病预防控制中心、华东师范大学、广州互云医院管理有 限公司。 本文件主要起草人:李虹伟、汤雯、杨雪冰、陈炜、孙颖、马丽红、田蕊、李书明、张志忠、李陇豫、 万端畅、王学栋、李明达、潘博、刘冰。 ⅢT/LXLY31—2024 全国团体标准信息平台 多模态老年共病数据集构建方法 1 范围 本文件规定了多模态老年共病数据集的构建流程、构建方法、质量评估、安全和隐私。 本文件适用于医疗机构、医疗数据科研机构和应用机构等相关机构和个人对多模态老年共病数据 集的构建、研究、应用和质量控制。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文 件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于 本文件。 GB/T5271.31 信息技术 词汇 第31部分:人工智能 机器学习 GB/T22239 信息安全技术 网络安全等级保护基本要求 GB/T25069 信息安全技术 术语 GB/T35273 信息安全技术 个人信息安全规范 GB/T39725 信息安全技术 健康医疗数据安全指南 GB/T42755 人工智能 面向机器学习的数据标注规程 3 术语和定义 GB/T5271.31、GB/T25069、GB/T39725界定的以及下列术语和定义适用于本文件。 3.1 多模态 multimodal 多种类型(模态)的数据或信息源。 注:多种类型如图像、文本、音频、视频等。 3.2 老年共病 elderlycomorbidity 2种或2种以上慢性健康问题同时发生在一个老年人个体,影响老年人个体健康状况持续1年及 以上的情况。 注:慢性健康问题可能是脏器疾病、精神心理问题、老年综合征,也能是其他影响老年人健康的问题。 3.3 多模态老年共病数据集 multimodalelderlycomorbiditydataset 从不同的老年共病医疗数据源采集到的多种类型(模态)的数据集。 示例:图像、文本、生理参数。 3.4 时间序列数据 timeseriesdata 在不同时间收集到的数据,反映某一事物、现象等随时间的变化状态或程度。 示例:患者的生命体征数据。 1T/LXLY31—2024 全国团体标准信息平台 4 缩略语 下列缩略语适用于本文件。 ATC:解剖学治疗学及化学分类系统(AnatomicalTherapeuticChemical) CT:计算机断层扫描(ComputedTomography) ICD:国际疾病分类(InternationalClassificationofDiseases) NYHA:美国纽约心脏病学会(NewYorkHeartAssociation) PCA:主成分分析(PrincipalComponentsAnalysis) 5 构建流程 多模态老年共病数据集构建流程包括数据收集、数据预处理、数据标注、数据整合、特征提取、特征 构建、特征融合、导出与存档,构建流程见图1。 图1 多模态老年共病数据集构建流程图 2T/LXLY31—2024 全国团体标准信息平台 6 构建方法 6.1 数据收集 6.1.1 用于构建多模态老年共病数据集的数据来源可为各级医院电子信息平台、自建数据采集平台、 中长期照护机构数据平台、智能养老设备等。数据收集应按相关规定,遵循公开、透明、合法、正当的原 则进行收集。 6.1.2 数据为结构化数据和非结构化数据类型。数据包括但不限于表1规定的类型。 表1 数据类型 数据类型 范围 基线资料 性别、年龄、身高、体重、诊断、手术史、用药史等 生命体征 常规生理检查数据,包括体温、心率、血糖、血压、血氧等 目前症状和体征 意识状态、临床体征、临床症状等 老年综合评估体力状态评估、日常生活能力评估、衰弱评估、营养评估、认知评估、疼痛评估、跌倒风险评 估、视听力障碍评估等 实验室检查 血尿便常规、肝肾功能、电解质、血脂、血糖、糖化血红蛋白等 特殊操作或治疗 冠脉造影、动脉内球囊反搏、起搏器植入、呼吸机辅助通气、穿刺置管等 康复方案 饮食模式、运动频率、运动时间、运动强度等 辅助检查 肺功能、骨密度检查等 新发不良事件 肺炎、呼吸衰竭、急性冠脉综合征、骨折、跌倒、消化道出血、再入院等 药物治疗 处方药及保健药品等 疾病诊断 — 其他模态 心电图、胸部CT、腹部超声、超声心动图等 6.2 数据预处理 6.2.1 去标识化 使用哈希算法为老年患者生成唯一标识,对老年患者个人信息进行保护。 6.2.2 数据清洗 数据清洗遵循完整性、合法性、一致性、唯一性、权威性的原则,处理方式包括以下内容。 a) 缺失值处理: 1) 使用插补(均值、中位数等)或删除缺失值较多的样本; 注:如生命体征、实验室检查数据等关键变量。 2) 人工核实后补充。 b) 异常值处理: 1) 逻辑错误:变量之间不符合逻辑关系,核实后修订,且保留修订记录; 3T/LXLY31—2024 全国团体标准信息平台 示例:出院时间早于入院时间。 2) 自然离群值:采用稳健统计方法进行分析; 3) 人为离群值:人工核实后纠正。 c) 重复值处理: 1) 重复数据结合唯一标识核对并清理,删除完全重复的数据; 2) 由于内部标识编码重复导致数据重复时,人工核实后纠正。 6.2.3 数据转换 将非结构化数据(如文本或图像)转换为结构化格式,并统一格式。 6.3 数据标注 6.3.1 对数据进行标注,包括: a) 确定老年共病患病情况; b) 老年共病相关的临床指标、症状及药物使用情况; c) 老年共病患者不良事件发生情况。 6.3.2 数据标注按GB/T42755的规定执行。 6.4 数据整合 6.4.1 通过哈希算法为老年患者生成的唯一标识字符串,将不同来源的数据进行融合,整合多模态数 据为统一的数据表。 6.4.2 整合后的数据应符合以下要求: a) 数据字段命名规则一致; b) 数值型数据单位一致; c) 编码规则一致; d) 日期时间格式一致,按时间轴对齐。 6.5 特征提取 6.5.1 根据不同类型数据,选择表2规定的方法进行特征提取,将特征值转化为由数字和编码组成的 混合矩阵。 表2 数据特征提取方法 数据类型 处理方法 说明 数值型单一型 直接提取 范围型 取均值年龄、血压、实验室 检查数据等 文本型单一实体描 述型药物→ATC编码 诊断、症状→ICD编码 固定类别型 固定文本选择题→Onehot编码 多实体描述型NER模型→诊断文本和手术文本→诊断ICD和手术ICD编码诊断、手术史、用药 史等 分级/分类型分类型 Onehot编码 性别等 分级型 根据级别总数分配级别,级别对应指标程度 NYHA心功能分级等 4T/LXLY31—2024 全国团体标准信息平台 6.5.2 时间序列数据对应患者编号,单独整理为表格。 6.6 特征构建 6.6.1 为老年共病患者构建特征,包括但不限于: a) 基础疾病信息; b) 基础生命体征; c) 基础用药信息; d) 基础老年综合征情况; e) 不良事件发生情况。 6.6.2 检查特征之间的相关性,去除冗余或高相关的特征,减少多重共线性。使用信息增益或特征重 要性等指标评估特征对目标变量的贡献,剔除不重要或噪声特征。 6.6.3 对所有特征进行处理,确保不同模态的特征在同一尺度上。 6.7 特征融合 6.7.1 从不同模态中提取的特征进行整合,形成一个统一的高维特征矩阵。通过对各模态特征的规范 化和对齐处理,从不同

.pdf文档 T-LXLY 31-2024 多模态老年共病数据集构建方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
T-LXLY 31-2024 多模态老年共病数据集构建方法 第 1 页 T-LXLY 31-2024 多模态老年共病数据集构建方法 第 2 页 T-LXLY 31-2024 多模态老年共病数据集构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-09-01 01:32:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。