说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210523094.5 (22)申请日 2022.05.13 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 刘文强 宗博文 温舒 刘扬  陈金辉 昌黎  (74)专利代理 机构 北京曼威知识产权代理有限 公司 11709 专利代理师 王宏财 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 一种模型训练的方法、 业务风控的方法及装 置 (57)摘要 本说明书公开了一种模 型训练的方法、 业务 风控的方法及装置, 首先, 获取训练样本。 其次, 将训练样本中目标用户的用户数据输入到待训 练的预测模 型中, 确定用户数据对应的用户业务 特征。 而后, 根据训练样本中记录的目标用户针 对目标业务的已执行业务周期, 将用户业务特征 输入到与训练样本相匹配的预测子模 型中, 以预 测目标用户执行目标业务对应的业务结果, 作为 预测结果。 最后, 以最小化预测结果与训练样本 对应的标签 之间的偏差为优化目标, 对预测模型 进行训练。 本方法可以通过不同已执行业务周期 的训练样本, 对预测模型进行训练, 使得预测模 型具有对最新数据分布的感知, 从而提高预测模 型确定出的预测结果的准确性。 权利要求书3页 说明书15页 附图5页 CN 114997472 A 2022.09.02 CN 114997472 A 1.一种模型训练的方法, 其特征在于, 预测模型包含有主预测子模型和若干辅助预测 子模型, 在 模型训练过程中, 不同预测子模型 处理不同已执行业务周期的训练样本, 针对每 个训练样本, 该训练样本对应的标签是根据该训练样本中用户在已执行业务周期中对目标 业务的执行情况来确定, 包括: 获取训练样本; 将所述训练样本 中目标用户的用户数据输入到待训练的预测模型中, 确定所述用户数 据对应的用户业 务特征; 根据所述训练样本 中记录的所述目标用户针对目标业务的已执行业务周期, 将所述用 户业务特征输入到与所述训练样本相匹配的预测子模型中, 以预测所述目标用户执行目标 业务对应的业 务结果, 作为预测结果; 以最小化所述预测结果与 所述训练样本对应的标签之间的偏差为优化目标, 对所述预 测模型进行训练。 2.如权利要求1所述的方法, 其特征在于, 将所述训练样本 中目标用户的用户数据输入 到待训练的预测模型中, 确定所述用户数据对应的用户业 务特征, 具体包括: 将所述用户数据输入到所述预测模型中, 以确定出 所述用户数据对应的原 始特征; 确定所述用户数据中缺失数据的数据维度, 作为目标维度, 对所述用户数据中目标维 度上的数据进行补充, 以及将所述用户数据中除目标维度以外的其他数据维度删除, 得到 辅助用户数据, 并确定所述辅助用户数据的特 征, 作为补偿特 征; 根据所述原 始特征以及所述补偿特 征, 确定所述用户数据对应的用户业 务特征。 3.如权利要求2所述的方法, 其特征在于, 确定出所述用户数据对应的原始特征, 具体 包括: 通过所述预测模型中的第一权重参数, 对所述用户数据进行特征提取, 以确定出所述 用户数据对应的原 始特征; 对所述用户数据中目标维度 上的数据进行补充, 以及将所述用户数据中除目标维度以 外的其他数据维度删除, 得到辅助用户数据, 并确定所述辅助用户数据的特征, 作为补偿特 征, 具体包括: 通过所述预测模型中的第二权重参数, 对所述用户数据中目标维度上的数据进行补 充, 以及将所述用户数据中除目标维度以外的其 他数据维度删除, 以得到所述补偿特 征。 4.如权利要求1所述的方法, 其特 征在于, 所述预测模型包括: 注意力机制网络; 将所述训练样本 中目标用户的用户数据输入到待训练的预测模型中, 确定所述用户数 据对应的用户业 务特征, 具体包括: 将所述训练样本 中目标用户的用户数据输入到所述注意力 机制网络, 确定所述用户数 据中的各 数据维度上的数据之间的相关性; 针对每个数据维度, 根据该数据维度上的数据与其他数据维度上的数据之间的相关 性, 确定该数据维度对应的相关性权重, 并根据各个数据维度上 的数据以及该数据维度对 应的相关性权 重, 确定该 数据维度对应的综合特 征; 根据各数据维度对应的综合特 征, 确定所述用户数据对应的用户业 务特征。 5.如权利要求4所述的方法, 其特征在于, 所述预测模型包括: 基础特征网络、 组合特征 网络;权 利 要 求 书 1/3 页 2 CN 114997472 A 2根据各数据维度对应的综合特 征, 确定所述用户数据对应的用户业 务特征, 具体包括: 将所述训练样本 中目标用户的用户数据输入到所述基础特征网络, 以通过所述基础特 征网络, 对所述用户数据中的各个数据维度进行单独编 码, 得到基础特征, 并将所述用户数 据输入到所述组合特征网络, 以通过所述组合特征网络, 对所述用户数据中的各个数据维 度进行组合编码, 得到组合特 征; 将所述基础特征、 所述组合特征中的至少一个, 与各数据维度对应的综合特征进行拼 接, 得到所述用户数据对应的用户业 务特征。 6.如权利要求1所述的方法, 其特征在于, 以最小化所述预测结果与 所述训练样本对应 的标签之间的偏差为优化目标, 对所述预测模型进行训练, 具体包括: 若确定该训练样本 中所述目标用户申请所述目标业务的实际申请结果为通过, 将所述 用户业务特征输入到所述目标用户申请所述目标业务对应的预测子模型中, 以预测所述目 标用户申请目标业 务对应的申请结果, 作为预测申请结果; 以最小化所述预测申请结果与实际申请结果之间的偏差、 所述预测结果与 所述训练样 本对应的标签之间的偏差为优化目标, 对所述预测模型进行训练。 7.如权利要求6所述的方法, 其特征在于, 以最小化所述预测申请结果与实际申请结果 之间的偏差、 所述预测结果与所述训练样本对应的标签之间的偏差为优化 目标, 对所述预 测模型进行训练, 具体包括: 根据各个预测子模型对业 务结果的影响程度, 确定各个预测子模型对应的权 重系数; 根据各个预测子模型对应的权重系数、 所述预测申请结果与实际申请结果之间的偏 差、 所述预测结果与所述训练样本对应的标签之间的偏差, 确定损失和值; 以最小化所述损失和值 为优化目标, 对所述预测模型进行训练。 8.一种业 务风控的方法, 其特 征在于, 包括: 接收目标用户针对所述目标业 务的业务申请请求; 根据所述 业务申请请求, 确定所述目标用户的用户数据; 将所述目标用户的用户数据输入到预先训练 的预测模型中, 确定所述用户数据对应的 用户业务特征, 所述预测模型 是通过上述权利要求1~7任一项所述的方法训练得到的; 将所述用户业务特征输入到主预测子模型中, 以根据所述用户业务特征, 预测所述用 户执行所述目标业务后的业务结果, 所述业务结果用于表示所述目标用户是否会履约执行 所述目标业 务; 根据所述 业务结果, 对所述目标用户进行业 务风控。 9.一种模型训练的装置, 其特征在于, 预测模型包含有主预测子模型和若干辅助预测 子模型, 在 模型训练过程中, 不同预测子模型 处理不同已执行业务周期的训练样本, 针对每 个训练样本, 该训练样本对应的标签是根据该训练样本中用户在已执行业务周期中对目标 业务的执行情况来确定, 包括: 获取模块, 用于获取训练样本; 输入模块, 用于将所述训练样本中目标用户的用户数据输入到待训练的预测模型中, 确定所述用户数据对应的用户业 务特征; 预测模块, 用于根据 所述训练样本中记录的所述目标用户针对目标业务的已执行业务 周期, 将所述用户业务特征输入到与所述训练样本相匹配的预测子模型中, 以预测所述 目权 利 要 求 书 2/3 页 3 CN 114997472 A 3

.PDF文档 专利 一种模型训练的方法、业务风控的方法及装置

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种模型训练的方法、业务风控的方法及装置 第 1 页 专利 一种模型训练的方法、业务风控的方法及装置 第 2 页 专利 一种模型训练的方法、业务风控的方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:00:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。