说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210464338.7 (22)申请日 2022.04.21 (71)申请人 中银金融科技有限公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区银城中路200号4层 408室 (72)发明人 李思齐  (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 应小波 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06N 20/00(2019.01) (54)发明名称 一种小微 企业信用风险等级预测方法、 设备 及存储介质 (57)摘要 本发明涉及一种小微企业信用风险等级预 测方法、 设备及存储介质, 包括: 步骤S1、 指标定 义: 获取财报数据, 定义样本指标并进行坏样本 打标; 步骤S2、 数据探查: 解析财报数据, 并对数 据进行清洗和校准; 步骤S3、 特征工程: 基于财报 特征指标池, 对 校准得到的优质数据进行特征工 程处理; 步骤S4、 模型训练: 拆分数据集, 将训练 集输入至评分卡模型进行训练, 构建评分卡; 步 骤S5、 迭代优化: 采用训练后的评分卡模型对测 试集进行信用风险等级预测, 并基于预测结果对 评分卡模型进行迭代优化, 得到优化后的评分 卡, 实现对企业的信用风险等级预测。 与现有技 术相比, 本发明具有预测准确性高的优点。 权利要求书1页 说明书5页 附图2页 CN 115018617 A 2022.09.06 CN 115018617 A 1.一种小微企业信用风险等级预测方法, 其特 征在于, 该 方法包括以下步骤: 步骤S1、 指标定义: 获取 财报数据, 定义样本指标并进行坏 样本打标; 步骤S2、 数据探查: 解析 财报数据, 并对数据进行清洗和校准; 步骤S3、 特 征工程: 基于财报特 征指标池, 对校准得到的优质数据进行 特征工程处 理; 步骤S4、 模型训练: 拆分数据集, 将训练集输入至 评分卡模型进行训练, 构建评分卡; 步骤S5、 迭代优化: 采用训练后的评分卡模型对测试集进行信用风险等级预测, 并基于 预测结果对评分卡模型进行迭代优化, 得到优化后的评分卡, 实现对企业的信用风险等级 预测。 2.根据权利要求1所述的一种 小微企业信用风险等级预测方法, 其特征在于, 所述坏样 本打标包括使用客户的征信数据进行打标、 使用线下有坏样本表现的数据进行客户打标、 使用在审批流程中命中某些拒绝规则的样本作为坏样本、 纳 入已有的黑名单进行客户的打 标以及对线下线上 具备相同数据指标的客群进行迁移学习, 创造出线上的坏 样本。 3.根据权利要求1所述的一种 小微企业信用风险等级预测方法, 其特征在于, 所述步骤 S2中数据探查的内容包括数据缺失、 数据类型有误或者 业务含义上不 合理。 4.根据权利要求1所述的一种 小微企业信用风险等级预测方法, 其特征在于, 所述步骤 S2中对数据进行清洗和校准, 包括: 对好样本中空值含量高于预设至的样本直接进行横向的删除, 减少好样本的数量, 同 时采用上采样的方法提高坏 样本的比重; 针对财报脏数据, 根据业务与数据本身的规律进行验证和合并, 将表示财报同样项目 但名称不 一致的指标进行合并, 删除不 正确的财报数据; 对空值和无穷值数据进行 单独分箱处 理。 5.根据权利要求1所述的一种 小微企业信用风险等级预测方法, 其特征在于, 所述步骤 S3具体为: 基于财报特征指标池, 对校准得到的优质数据进 行特征衍生、 特征转换以及分箱 处理。 6.根据权利要求5所述的一种 小微企业信用风险等级预测方法, 其特征在于, 所述财报 特征指标池的维度包括客户信息、 时间信息、 财报概述、 盈利能力、 偿债能力、 债务结构、 运 营能力、 成长性指标、 规模类指标以及流动性水平。 7.根据权利要求1所述的一种 小微企业信用风险等级预测方法, 其特征在于, 所述步骤 S4中拆分数据集具体为: 依据设定的时间周期, 将数据划分为观 察期数据和表现期数据; 所 述观察期数据为训练集, 所述表现期数据为测试集。 8.根据权利要求1所述的一种 小微企业信用风险等级预测方法, 其特征在于, 所述步骤 S4中的评分卡模型为逻辑回归 模型。 9.一种电子设备, 包括存储器和处理器, 所述存储器上存储有计算机程序, 其特征在 于, 所述处 理器执行所述程序时实现如权利要求1~8任一项所述的方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理 器执行时实现如权利要求1~8中任一项所述的方法。权 利 要 求 书 1/1 页 2 CN 115018617 A 2一种小微企业信用风险等级预测方 法、 设备及存储介质 技术领域 [0001]本发明涉及数据处理领域, 尤其是涉及一种小微企业信用风险等级预测方法、 设 备及存储介质。 背景技术 [0002]当前普惠金融在针对小微企业贷款审批时, 主要依赖专家法的规则经验, 客户准 入的规则比较单一, 主要使用客户基本身份信息、 工商司法信息、 税务、 征信等信息进行公 司风险的判断, 但是这些信息并没有进 行信息交互, 每条规则只用了其中的一到两个信息, 并没有考虑信息之间的相关情况或隐藏信息。 只使用可以直接获取 的数据, 没有进行深度 的挖掘, 表层的数据提供的信息很少, 用来判断客户的风险是片面的。 同时由于规则的判断 是非黑即白的, 每个规则 在流程中占据同样重要的地位, 但是真实情况下, 并不是某方面弱 势的企业 就一定风险高, 这样的规则判断是片面的, 需要通过 特征的整合 来缓解这一缺陷。 [0003]其次, 由于上述的规则的严格性, 导致了当前普惠业务的客户都表 现良好, 目前已 有的存量客户都是经过严格筛选后的质量较高的客户, 在实际用款中基本无逾期的情况, 或由于偶尔错过还款日逾期一天又还款。 从而使得模型缺 乏真实的坏样本, 样本的定义以 及样本之间的不均衡是小微企业模型训练的难点之一。 [0004]此外, 但是小微企业由于本身规模小, 未上市, 其财报数据并不像大公司那样规 整, 很多数据存在漏报错报误报, 数据存在大量的异常值, 包括缺失值、 不符合业务逻辑可 解释的数值、 离群值等等。 同时小微企业的财报格式也很难统一, 同样是报文上传, 但是名 称的不一致会导致财报项目的对应难, 导致后续要进行大量的数据验证和清洗工作, 进行 小微企业的财报数据清理和具有大量空值的模型训练是第三个难点。 发明内容 [0005]本发明的目的就是为了克服上述现有技术存在的缺陷而提供了一种预测准确性 高的小微企业信用风险等级预测方法、 设备及存 储介质。 [0006]本发明的目的可以通过以下技 术方案来实现: [0007]根据本发明的第一方面, 提供了一种小微企业信用风险等级预测方法, 该方法包 括以下步骤: [0008]步骤S1、 指标定义: 获取 财报数据, 定义样本指标并进行坏 样本打标; [0009]步骤S2、 数据探查: 解析 财报数据, 并对数据进行清洗和校准; [0010]步骤S3、 特征工程: 基于财报特征指标池, 对校准得到的优质数据进行特征工程处 理; [0011]步骤S4、 模型训练: 拆分数据集, 将训练集输入至评分卡模型进行训练, 构建评分 卡; [0012]步骤S5、 迭代优化: 采用训练后的评分卡模型对测试集进行信用风险等级预测, 并 基于预测结果对评分卡模型进行迭代优化, 得到优化后的评分卡, 实现对企业的信用风险说 明 书 1/5 页 3 CN 115018617 A 3

.PDF文档 专利 一种小微企业信用风险等级预测方法、设备及存储介质

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种小微企业信用风险等级预测方法、设备及存储介质 第 1 页 专利 一种小微企业信用风险等级预测方法、设备及存储介质 第 2 页 专利 一种小微企业信用风险等级预测方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:00:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。