说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211052266.1 (22)申请日 2022.08.31 (71)申请人 华东师范大学 地址 200241 上海市闵行区东川路5 00号 (72)发明人 杨燕 庄鹏杰 贺樑  (74)专利代理 机构 上海蓝迪专利商标事务所 (普通合伙) 31215 专利代理师 徐筱梅 张翔 (51)Int.Cl. G06Q 10/04(2012.01) G06N 20/00(2019.01) (54)发明名称 一种用于风险预测任务的特 征组合方法 (57)摘要 本发明公开了一种用于风险预测任务的特 征组合方法, 其特点是该方法包括: 模型特征权 重模块和加权求和组合特征模块, 所述模型特征 权重模块使用输入的特征和标签训练用于分类 或回归的机器学习模型, 得到模 型中对应特征的 权重系数或特征重要性; 所述加权求和组合特征 模块将特征权重系数 或特征重要 性经softmax转 化为对应的特征权重分布, 并与数据中对应的特 征值进行加权求和得到新的组合特征值, 考虑了 数据中各个特征的重要性并基于特征重要性完 成了对新特征的组合。 本发明与现有技术相比具 有选择特征并组合出稳定有效的特征值, 优化了 风险预测任务中的风险分层评估效果, 为风险分 析和风险预测提供支持, 方法简单有效, 具有广 泛的应用前 景。 权利要求书1页 说明书4页 附图1页 CN 115409261 A 2022.11.29 CN 115409261 A 1.一种用于风险预测任务的特征组合方法, 其特征在于该方法采用模型特征权重模块 与加权求和组合特征模块进行特征组合, 所述模型特征权重模块使用输入的特征和标签训 练用于分类或回归的机器学习 模型, 得到模型中对应特征的权重系数Wi或特征重要性Fi以 反映每类特征 的重要性, 为后续特征值的组合做准备; 所述加权求和组合特征模块将特征 权重系数Wi或特征重要性Fi经softmax转化为对应的特征权重分布Pi, 并与数据中对应的特 征值进行加权求和得到最终新的组合特 征值, 具体包括如下步骤: 1)建立模型 特征权重模块 在给定数据输入特征Xi∈X和标签Y的条件下, 使用损失函数训练一个逻辑回归模型或 支持向量机、 决策树以及基于决策树的集成模型, 得到模型中对应特征的权重系数Wi或特 征重要性Fi; 2)建立加权求和组合特 征模块 将模型特征权重模块得到的特征权重系数Wi或特征重要性Fi经softmax转化为其在n个 特征中的特征权重分布Pi, 将特征权重分布Pi与数据中对 应的特征值进行加权 求和, 得到新 的组合特 征值New_Xi; 所述特征权重分布Pi由下述(a)式表示 为: 其中, 为每一类特征值Xi对应的特 征权重系数Wi的元素值; 为每一类特征值Xi对 应的特征重要性Fi的元素值; 所述组合特 征值New_Xi由下述(b)式表示 为: 其中, Xi为数据中不同类对应的特 征值。 2.根据权利要求1所述的用于风险预测任务的特征组合方法, 其特征在于所述逻辑回 归模型的损失函数 由下述(c)式表示 为: 其中, yi∈Y表示数据中的第i条样本的标签; xi∈X表示数据中第i条样本的所有特征; hW(xi)为第i条样本的 的目标函数; 所述目标函数hW(X)由下述(d)式表示 为: 其中, σ(WTX)为经过线性变换WTX与sigmoid激活函数转换得到输入数据样本属于某个 类别的概率的表达式; 为线性回归的表达式; sigmoid激活函数的表达 式为: 权 利 要 求 书 1/1 页 2 CN 115409261 A 2一种用于风险预测任务的特征 组合方法 技术领域 [0001]本发明涉及特征工程技术领域, 具体地说是一种用于风险预测任务的特征组合方 法。 背景技术 [0002]风险预测任务由于其能识别评估对象面临的各种风险、 评估风险概率和可能带来 的负面影响、 确定组织或个人承受风险的能力, 确定风险消减和控制的优先等级以及推荐 风险消减对策等原因, 一直在包括金融、 医疗等领域备 受关注。 此类任务通常依据数据中的 特征和标签的生存状态与天数使用包括Cox模型等来进行风险分析和预测。 考虑到数据限 制这一原因, 风险预测任务往往不能做到有效的风险分层。 因此, 对于特征工程中的探索即 如何充分地 开发和利用数据, 从数据中提取重要 有效的信息 至关重要。 [0003]目前, 特征工程中普遍适用的特征组合方法主要包括特征之间的加减乘除、 组合 独热矢量等, 组合的方式包括依据专家先验知识组合、 随机组合以及机器学习模型自动组 合等。 但是, 对于风险预测任务, 特征组合既要考虑方法上 的可解释性, 又要考虑方式上 的 简单有效, 因此, 在风险预测任务的特征工程中如何选择特征并组合出稳定有效的特征值 十分重要。 [0004]现有技术的特征组合的特征值稳定有效性差, 识别评估对象和风险预测精度低, 缺少针对风险预测任务的特征组合适用方法, 需要高成本的人工规则定义与先验知识参 与, 未将风险预测任务组合特 征的可解释性纳入考虑, 风险分层评估效果差 。 发明内容 [0005]本发明的目的是针对现有技术的不足而设计的一种用于风险预测任务的特征组 合方法, 采用模型特征权重模块和加权求和组合特征模块的方法, 通过特征组合方法发现 新的风险预测指标, 有效优化了风险预测任务中的风险分层评估效果。 模型特征权重模块 使用输入的特征和标签训练用于分类或回归的机器学习模型, 得到模型中对应特征的权重 系数或特征重要性以反 映每类特征 的重要性, 为后续特征值的组合做准备, 加权求和组合 特征模块将特征权重系数或特征重要性经过softmax转化为对应的特征权重分布, 并与数 据中对应的特征值进 行加权求和得到最 终新的组合特征值, 考虑了数据中各个特征的重要 性并基于特征重要性完成了对新特征的组合, 组合出的风险预测指标有效优化了风险预测 任务中的风险分层评估效果, 为风险分析和风险预测提供支持, 方法简单有效, 能选择特征 并组合出稳定有效的特征值, 能够在医学生存分析、 金融风险预测等真实场景中应用, 具有 广泛的实用意 义和应用前 景。 [0006]实现本发明目的的具体技术方案是: 一种用于风险预测任务的特征组合方法, 其 特点是该方法包括如下步骤: [0007]1)建立模型特征权重模块, 该模块完成模型的训练并得到模型中对应特征的权重 系数; 在给定数据输入特征Xi∈X和标签Y的条件下, 训练一个分类或回归的机器学习模型说 明 书 1/4 页 3 CN 115409261 A 3

.PDF文档 专利 一种用于风险预测任务的特征组合方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于风险预测任务的特征组合方法 第 1 页 专利 一种用于风险预测任务的特征组合方法 第 2 页 专利 一种用于风险预测任务的特征组合方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:02:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。