说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111653068.6 (22)申请日 2021.12.3 0 (71)申请人 医渡云 (北京) 技 术有限公司 地址 100191 北京市海淀区花园北路3 5号9 号楼8层801 (72)发明人 崔梦璇 王尧  (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 代理人 王辉 阚梓瑄 (51)Int.Cl. G16H 50/50(2018.01) G06K 9/62(2022.01) (54)发明名称 模型训练方法、 数据处理方法、 装置、 介质、 电子设备 (57)摘要 本公开涉及计算机技术领域, 提供了一种模 型训练方法及装置、 数据处理方法及装置、 计算 机可读存储介质和电子设备。 其中, 上述模型训 练方法包括: 获取多个样本对象的候选特征的特 征序列; 基于多个样本对象 的候选特征在采样时 刻的特征值和样本对象在采样时刻的结局, 分别 确定出在采样时刻每个候选特征与结局之间的 相关程度; 根据相关程度和时间窗口, 确定出时 间窗口内任一目标时刻的建模特征, 其中, 时间 窗口基于 预设数量个连续采样时刻确定; 基于多 个样本对象的建模特征在所述目标时刻或之前 时刻的特征值, 训练得到目标时刻对应的结局预 测模型。 本公开基于时间窗口进行建模特征的选 择, 能提高模型的预测准确性。 权利要求书2页 说明书15页 附图4页 CN 114334161 A 2022.04.12 CN 114334161 A 1.一种模型训练方法, 其特 征在于, 包括: 获取多个样本对象的候选特征的特征序列, 所述候选特征的特征序列根据在连续多个 采样时刻采集到的所述 候选特征的特征值确定; 基于多个样本对象的候选特征在采样时刻的特征值和所述样本对象在所述采样时刻 或在所述采样时刻之后时刻的结局, 分别确定出在所述采样时刻每个候选特征与结局之间 的相关程度; 根据所述相关程度和时间窗口, 确定出所述时间窗口内任一目标时刻的建模特征, 其 中, 所述时间窗口基于预设数量个连续采样时刻确定; 基于多个样本对象的所述建模特征在所述目标时刻或在所述目标时刻之前的时刻的 特征值, 训练得到所述目标时刻对应的结局预测模型。 2.根据权利要求1所述的模型训练方法, 其特征在于, 所述样本对象包括医疗对象, 所 述候选特征包括所述医疗对象的临床 体征; 所述目标时刻 对应的结局预测模型用于对与所 述样本对象具有相同医疗属性的其它对象在所述目标时刻之后的结局进行 预测。 3.根据权利要求1所述的模型训练方法, 其特征在于, 所述根据 所述相关程度和时间窗 口, 确定出 所述时间窗口内任一目标时刻的建模特 征, 包括: 选择所述相关程度满足所述采样时刻对应的预设条件的候选特征为所述采样时刻的 目标特征; 根据时间窗口内每个采样时刻的目标特征的选择情况, 确定出所述 时间窗口内任一目 标时刻的建模特 征。 4.根据权利要求3所述的模型训练方法, 其特征在于, 所述基于多个样本对象的候选特 征在采样时刻的特征值和所述样本对 象在所述采样时刻或在所述采样时刻之后时刻的结 局, 分别确定出在所述采样时刻每 个候选特 征与结局之间的相关程度, 包括: 获取训练数据集, 对所述训练数据集中的训练数据进行分组, 以确定出多个子训练数 据集, 训练数据集中包括多个样本对象的候选特征在多个采样时刻的特征值和所述样本对 象在所述采样时刻或在所述采样时刻之后时刻的结局; 针对每个采样时刻的每个候选特征, 分别基于每个所述子训练数据集中的训练数据, 确定出每 个子训练数据集对应的所述 候选特征在所述采样时刻与结局之间的相关程度; 所述选择所述相关程度满足所述采样时刻对应的预设条件的候选特征为所述采样时 刻的目标 特征, 包括: 针对每个采样时刻, 在所述每个子训练数据集中选择出所述相关程度满足所述采样时 刻对应的预设条件的候选特 征; 在所述候选特征被选择的次数大于或等于预设值 时, 确定所述候选特征为所述采样时 刻的目标 特征。 5.根据权利要求3或4所述的模型训练方法, 其特征在于, 所述采样时刻对应的预设条 件包括所述相关程度大于所述采样时刻对应的相关程度阈值; 所述相关程度阈值基于各候 选特征在所述采样时刻的相关程度确定 。 6.根据权利要求3或4所述的模型训练方法, 其特征在于, 所述根据时间窗口内每个采 样时刻的目标 特征的选择情况, 确定出 所述时间窗口内任一目标时刻的建模特 征, 包括: 根据在所述 时间窗口内的每个采样时刻均为目标特征的候选特征, 确定出所述时间窗权 利 要 求 书 1/2 页 2 CN 114334161 A 2口内任一目标时刻的建模特 征。 7.根据权利要求1至4中任一项所述的模型训练方法, 其特征在于, 所述相关程度基于 最大互信息系数、 协方差系数、 秩相关系数中的任一种进行表征。 8.一种数据处 理方法, 其特 征在于, 包括: 获取目标对象在目标时刻的建模特 征对应的目标 特征值; 根据所述目标特征值和目标时刻对应的结局预测模型, 预测所述目标对象在所述目标 时刻之后的结局; 其中, 所述结局预测模型根据权利要求1至7中任一项所述的方法训练得到 。 9.一种模型训练装置, 其特 征在于, 包括: 特征序列获取模块, 被配置为获取多个样本对象的候选特征的特征序列, 所述候选特 征的特征序列根据在连续多个采样时刻采集到的所述 候选特征的特征值确定; 相关程度确定模块, 被配置为基于多个样本对象的候选特征在采样时刻的特征值和所 述样本对象在所述采样时刻或在所述采样时刻之后时刻的结局, 分别确定出在所述采样时 刻每个候选特 征与结局之间的相关程度; 建模特征选择模块, 被配置为根据所述相关程度和时间窗口, 确定出所述时间窗口内 任一目标时刻的建模特 征, 其中, 所述时间窗口基于预设数量个连续采样时刻确定; 模型训练模块, 被配置为基于多个样本对象的所述建模特征在所述目标时刻或在所述 目标时刻之前时刻的特 征值, 训练得到所述目标时刻对应的结局预测模型。 10.一种数据处 理装置, 其特 征在于, 包括: 目标特征值获取模块, 被配置为获取目标对象在目标时刻的建模特征对应的目标特征 值; 结局预测模块, 被配置为根据所述目标特征值和目标时刻对应的结局预测模型, 预测 所述目标对象在所述目标时刻之后的结局; 其中, 所述结局预测模型根据权利要求1至7中任一项所述的方法训练得到 。 11.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器执 行时实现如权利要求1至8中任一项所述的方法。 12.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理 器执行时, 使得 所述一个或多个处 理器实现如权利要求1至8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114334161 A 3

.PDF文档 专利 模型训练方法、数据处理方法、装置、介质、电子设备

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、数据处理方法、装置、介质、电子设备 第 1 页 专利 模型训练方法、数据处理方法、装置、介质、电子设备 第 2 页 专利 模型训练方法、数据处理方法、装置、介质、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:43:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。