说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210447578.6 (22)申请日 2022.04.26 (71)申请人 厦门大学 地址 361000 福建省厦门市思明南路42 2号 (72)发明人 施芝元 吴哲 林晓冰 谢浩宇  黄联芬 陈建发 赵毅峰  (74)专利代理 机构 厦门创象知识产权代理有限 公司 35232 专利代理师 尤怀成 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 10/04(2012.01) G06F 16/28(2019.01) G06F 16/2458(2019.01) G06K 9/62(2022.01)G06F 17/18(2006.01) (54)发明名称 汽车金融用户申请欺诈概率预测方法及介 质 (57)摘要 本发明公开了一种汽车金融用户申请欺诈 概率预测方法及介质, 其中方法包括: 获取用户 的历史申请数据, 并进行分组; 进行数据衍生, 以 衍生出多维特征; 对多维特征进行过滤式筛选, 随后进行集成式递归特征消除, 以得到最优特 征; 对最优特征进行最优分箱, 并对每个分箱进 行WOE编码; 进行欠采样和过采样组合处理, 以生 成训练样本集; 根据训练样本集进行模型训练, 以得到各单模型, 并进行模型融合, 以生成最终 欺诈概率预测模型; 获取用户申请信息, 并将用 户申请信息输入最终欺诈概率预测模 型, 以通过 最终欺诈概率预测模型输出欺诈概率; 能够根据 用户的申请信息对欺诈概率进行自动计算, 有效 防止欺诈骗车行为的发生, 保障汽 车金融公司的 财产安全。 权利要求书2页 说明书9页 附图3页 CN 114926261 A 2022.08.19 CN 114926261 A 1.一种汽车 金融用户申请 欺诈概率预测方法, 其特 征在于, 包括以下步骤; 获取用户的历史申请数据, 并对所述历史申请数据进行分组; 对分组后的历史申请数据进行数据衍生, 以衍生出所述历史申请数据对应的多维特 征; 对所述多维特征进行过滤式筛选, 以得到特征组, 并对所述特征组中的所有样本进行 欠采样平衡样本, 以及进行递归特 征消除以得到最优特 征; 对所述最优特征进行最优分箱, 并对每 个分箱进行WOE编码; 对WOE编码后的数据进行欠采样和过采样组合处 理, 以生成训练样本集; 根据所述训练样本集进行单模型的训练, 以得到多个单模型, 并将多个单模型进行模 型融合, 以生成最终欺诈概 率预测模型; 获取用户申请信息, 并将所述用户申请信息输入所述最终欺诈概率预测模型, 以通过 所述最终欺诈概 率预测模型输出 所述用户申请信息对应的欺诈概 率。 2.如权利要求1所述的汽车金融用户申请欺诈概率预测方法, 其特征在于, 对所述多维 特征进行过滤式筛选, 包括: 对多维特征进 行皮尔森相关系数筛选, 并在皮尔森相关系数筛 选完成后进行信息价 值筛选, 以及在所述信息价 值筛选完成后进行P SI值筛选。 3.如权利要求2所述的汽车金融用户申请欺诈概率预测方法, 其特征在于, 所述皮尔森 相关系数筛 选根据以下公式进行: 其中, ρX,Y表示两个连续变量X,Y之间的皮尔森相关系数, cov(X,Y)表示变量X、 变量Y之 间的协方差, σXσY为X、 Y各自标准差的乘积, μX与 μY分别表示变量X,Y的均值, E( ……)表示数 学期望, E[(X ‑μX)(Y‑μY)]表示两个 变量总体误差的数 学期望。 4.如权利要求2所述的汽车金融用户申请欺诈概率预测方法, 其特征在于, 信 息价值根 据以下公式计算: 其中, WOEi表示第i个分箱的WOE值, B adi表示第i个分箱的坏人数, B adT表示总坏人数, Goodi表示第i个分箱的好 人数, GoodT表示总好 人数, WOE 值可理解为每个分箱里坏人 分布相 对于好人分布的差异性, IVi表示第i个分箱的IV值, IV表示信息价值, 某一特征的IV值为该 特征各分箱的IVi值的总和。 5.如权利要求2所述的汽车金融用户申请欺诈概率预测方法, 其特征在于, PSI值根据 以下公式计算:权 利 要 求 书 1/2 页 2 CN 114926261 A 2其中, PSI表示PSI值, 表示验证样本在各分数段的实际分布与预期分布的差异, Actuali 表示在第i个分数段验 证样本的数量, ActualT表示验证样本的总数量, 即为表示实际 占比, Expecti表示在第i个分数段训练样本的数量, ExpectT表示训练样本的总数量, 即为表示预期占比。 6.如权利要求1所述的汽车金融用户申请欺诈概率预测方法, 其特征在于, 对所述特征 组中的所有样本进行欠采样平衡样本, 以得到最优特 征, 包括: 在完成过滤式筛选后, 计算过滤式筛选后正样本集中正样本的数量值与负样本集中负 样本的数量值之间的比值, 并根据所述比值对正样本进行划分, 以得到正样本子集, 其中, 所述正样本子集中正样本的数量 值等于负样本集中负 样本的数量 值; 根据正样本子集和负样本集生成多个样本子集, 并根据 所述多个样本子集进行递归特 征消除, 以得到特 征排序, 以及根据特 征排序确定最优特 征。 7.如权利要求1所述的汽车金融用户申请欺诈概率预测方法, 其特征在于, 对WOE编码 后的数据进行欠采样和过采样组合处 理, 以生成训练样本集, 包括: 根据WOE编码后数据中正样本的数量值和负样本的数量值计算欠采样比率, 以根据所 述欠采样比率进行欠采样, 以得到中间样本集; 根据SMOTE算法对所述中间样本集进行过采样, 以得到训练样本集, 其中, 所述训练样 本集中的正样本的数量 值等于负样本的数量 值。 8.一种计算机可读存储介质, 其特征在于, 其上存储有汽车金融用户申请欺诈概率预 测程序, 该汽车金融用户申请欺诈概率预测程序被处理器执行时实现如权利要求1 ‑7中任 一项所述的汽车 金融用户申请 欺诈概率预测方法。权 利 要 求 书 2/2 页 3 CN 114926261 A 3

.PDF文档 专利 汽车金融用户申请欺诈概率预测方法及介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 汽车金融用户申请欺诈概率预测方法及介质 第 1 页 专利 汽车金融用户申请欺诈概率预测方法及介质 第 2 页 专利 汽车金融用户申请欺诈概率预测方法及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:03:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。