说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210484186.7 (22)申请日 2022.05.06 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 (72)发明人 程琬芸 梁栋 陈为  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 邓丹 (51)Int.Cl. G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 相似样本的确定方法与授信额度的确定方 法 (57)摘要 本申请涉及一种相似样本的确定方法和装 置、 授信额度的确定方法和装置及存储介质。 所 述相似样 本的确定方法包括: 获取待分析的样本 集和无授信额度客户的客户信息; 以预设多个特 征依次对所述待分析的样本集进行分类, 获得多 个样本子集, 并将所述多个样 本子集以所述预设 多个特征为交叉节点构成样本二叉树; 根据所述 客户信息从所述样本二叉树中查找到与所述客 户信息相似的目标样本子集; 获取所述目标样本 子集中各样本分别与所述无授信额度客户的相 似度, 并将所述相似度超 过预设阈值的样本作为 所述无授信额度客户的相似样 本。 采用本方法能 够提高无授信额度客户的相似样 本的准确度, 以 及提高无授信额度客户的授信额度的准确度。 权利要求书3页 说明书11页 附图7页 CN 114881761 A 2022.08.09 CN 114881761 A 1.一种相似样本的确定方法, 其特 征在于, 所述方法包括: 获取待分析的样本集和无授信额度客户的客户信息; 以预设多个特征依次对所述待分析的样本集进行分类, 获得多个样本子集, 并将所述 多个样本 子集以所述预设多个特 征为交叉节点构成样本二叉树; 根据所述 客户信息从所述样本二叉树中查找到与所述 客户信息相似的目标样本 子集; 获取所述目标样本子集中各样本分别与 所述无授信额度客户的相似度, 并将所述相似 度超过预设阈值的样本作为所述无授信额度客户的相似样本 。 2.根据权利要求1所述的方法, 其特征在于, 所述以预设多个特征依次对所述待分析的 样本集进行分类获得多个样本 子集包括: 以预设多个特征中第 一特征对所述待分析的样本集进行分类, 获得第 一样本子集和第 二样本子集; 以预设多个特征中第 二特征对第 一样本子集进行分类, 获得第 三样本子集和第四样本 子集, 并以预设多个特征中第二特征对第二样本子集进行分类, 获得第 五样本子集和第六 样本子集, 依次类推, 直到预设多个特征均对所述待分析的样本集进 行分类, 获得到所述多 个样本子集。 3.根据权利要求2所述的方法, 其特征在于, 所述预设多个特征包括: 基础信息、 行内资 产、 对公流水、 对私流水、 税务和代发工资中的至少两个特 征。 4.根据权利要求1所述的方法, 其特征在于, 所述以预设多个特征依次对所述待分析的 样本集进行分类, 获得多个样本子集, 并将所述多个样本子集以所述预设多个特征为交叉 节点构成样本二叉树之前, 还 包括: 对所述待分析的样本集中各样本的信息进行数据格式检查和/或完整性检查, 获得各 样本信息的检查结果; 根据各样本信息的检查结果进行对应的处 理。 5.根据权利要求4所述的方法, 其特征在于, 所述根据各样本信 息的检查结果进行对应 的处理包括: 在存在数据缺失率大于预设缺失率的第 一样本时, 向用户终端发送与 所述第一样本的 数据缺失率大于预设缺失率对应的提 示信息; 接收用户终端根据所述 提示信息触发的操作指令对所述第一样本进行对应的处 理。 6.根据权利要求1所述的方法, 其特征在于, 所述以预设多个特征依次对所述待分析的 样本集进行分类, 获得多个样本子集, 并将所述多个样本子集以所述预设多个特征为交叉 节点构成样本二叉树之前, 包括: 根据所述待分析的样本集计算预设的多个特 征的方差; 根据各预设的多个特 征的方差对预设的多个特 征进行排序; 所述以预设多个特征依次对所述待分析的样本集进行分类, 获得多个样本子集, 并将 所述多个样本 子集以所述预设多个特 征为交叉节点构成样本二叉树包括: 以排序后的预设多个特征依次对所述待分析的样本集进行分类, 获得多个样本子集, 并将所述多个样本 子集以所述预设多个特 征为交叉节点构成样本二叉树。 7.一种授信额度的确定方法, 其特 征在于, 所述方法包括: 获取无授信额度客户的相似样本, 所述无授信额度客户的相似样本采用如权利要求1 ‑权 利 要 求 书 1/3 页 2 CN 114881761 A 26任一项所述的方法获得; 根据所述相似样本的授信额度计算所述无授信额度客户的授信额度。 8.根据权利要求7所述的方法, 其特征在于, 所述根据所述相似样本的授信额度计算所 述无授信额度客户的授信额度, 包括: 获取所述相似样本的授信额度; 将所述相似样本与 所述无授信额度客户的相似度作为加权系数, 对所述相似样本的授 信额度进行加权计算, 获得 所述无授信额度客户的授信额度。 9.根据权利要求7所述的方法, 其特征在于, 所述获取所述相似样本的授信额度之后, 还包括: 计算所述相似样本的授信额度的平均值, 将所述平均值作为所述无授信额度客户的授 信额度。 10.一种相似样本的确定装置, 其特 征在于, 所述相似样本的确定装置包括: 第一获取模块, 用于获取待分析的样本集和无授信额度客户的客户信息; 第一二叉树构建模块, 用于以预设多个特征依次对所述待分析的样本集进行分类, 获 得多个样本子集, 并将所述多个样本子集以所述预设多个特征为交叉节点构成样本二叉 树; 第一查找模块, 用于根据所述客户信 息从所述样本二叉树中查找到与 所述客户信 息相 似的目标样本 子集; 第一相似样本确定模块, 用于获取所述目标样本子集中各样本分别与 所述无授信额度 客户的相似度, 并将所述相似度超过预设阈值的样本作为所述无授信额度客户的相似样 本。 11.根据权利要求10所述的装置, 其特 征在于, 所述第一 二叉树构建模块还用于: 以预设多个特征中第 一特征对所述待分析的样本集进行分类, 获得第 一样本子集和第 二样本子集; 以预设多个特征中第 二特征对第 一样本子集进行分类, 获得第 三样本子集和第四样本 子集, 并以预设多个特征中第二特征对第二样本子集进行分类, 获得第 五样本子集和第六 样本子集, 依次类推, 直到预设多个特征均对所述待分析的样本集进 行分类, 获得到所述多 个样本子集。 12.根据权利要求11所述的装置, 其特征在于, 所述预设多个特征包括: 客户信 息、 行内 资产、 对公流水、 对私流水、 税务和代发工资中的至少两个特 征。 13.根据权利要求10所述的装置, 其特 征在于, 所述装置还 包括: 第一数据检查模块, 用于对待分析的样本集中各样本的信 息进行数据格式检查和完整 性检查, 获得 各样本的检查结果; 第一处理模块, 用于根据各样本信息的检查结果进行对应的处 理。 14.根据权利要求13所述的装置, 其特 征在于, 所述第一处 理模块还用于: 在存在数据缺失率大于预设缺失率的第 一样本时, 向用户终端发送与 所述第一样本的 数据缺失率大于预设缺失率对应的提 示信息; 接收用户终端根据所述 提示信息触发的操作指令对所述第一样本进行对应的处 理。 15.一种授信额度的确定装置, 其特 征在于, 所述授信额度的确定装置包括:权 利 要 求 书 2/3 页 3 CN 114881761 A 3

.PDF文档 专利 相似样本的确定方法与授信额度的确定方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 相似样本的确定方法与授信额度的确定方法 第 1 页 专利 相似样本的确定方法与授信额度的确定方法 第 2 页 专利 相似样本的确定方法与授信额度的确定方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:04:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。