说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210436751.2 (22)申请日 2022.04.24 (71)申请人 贵州财经 大学 地址 550025 贵州省贵阳市花溪大 学城 (72)发明人 王可 罗孟华 龙洋  (74)专利代理 机构 哈尔滨市阳光惠远知识产权 代理有限公司 2321 1 专利代理师 姜艳红 (51)Int.Cl. G06F 16/26(2019.01) G06K 9/62(2022.01) G06F 40/30(2020.01) G06F 17/18(2006.01) G06Q 40/02(2012.01) (54)发明名称 一种基于语义特征组的信用卡客户流失数 据降维可视化分析方法 (57)摘要 本发明是一种基于语义特征组的信用卡客 户流失数据降维可视化分析方法。 本发明涉及数 据可视化分析技术领域, 所述方法以多视图融合 的方式, 对数据集特征进行可视化分析, 收集信 用卡客户流失的数据; 基于T ‑SNE算法和PCA方 法, 对信用卡客户进行降维可视化分析, 分析信 用卡客户流失的数据; 基于语义特征组, 对信用 卡客户数据进行分析, 进行降维可视化分析, 分 析信用卡客户流失的数据。 本发 明从可视化任务 的实质出发, 提出了基于语义特征组的降维可视 化方法。 对比分析了多视图融合可视化方法、 T ‑ SNE算法和PCA降维可视化方法, 实现了基于语义 特征组的信用卡客户流失数据降维可视化分析 方法。 权利要求书2页 说明书10页 附图7页 CN 114936252 A 2022.08.23 CN 114936252 A 1.一种基于语义特征组的信用卡客户流失数据降维可视化分析方法, 其特征是: 所述 方法包括以下步骤: 步骤1: 以多视图融合的方式, 对数据集特征进行可视化分析, 收集信用卡客户流失的 数据; 步骤2: 基于T ‑SNE算法和PCA方法, 对信用卡客户进行降维可视化分析, 分析信用卡客 户流失的数据; 步骤3: 基于语义特征组, 对信用卡客户数据进行分析, 进行降维可视化分析, 分析信用 卡客户流失的数据。 2.根据权利要求1所述的一种基于语义特征组 的信用卡客户流失数据降维可视化分析 方法, 其特 征是: 所述步骤1具体为: 步骤1.1: 对所有数据特征进行语义分析, 并建立分组, 将全部数据特征根据语义划分 到唯一的语义分组, 且保证组间无交叉; 根据公式(1)和公式(2)对所有数据特 征进行语义分析: 步骤1.2: 当两个语义特征包含同样的语义解释因素则被定义为语义冗余如公式(3)所 示进行删除, 同时进行相关系数计算如公式(4)所示作为 参考, 确定最终语义特 征组: 步骤1.3: 选组之后, 每一组内部的多个特征再按照协方差如公式(5)所示进行数值分 析投影, 以满足最终的降维数量需求: 3.根据权利要求2所述的一种基于语义特征组 的信用卡客户流失数据降维可视化分析 方法, 其特 征是: 所述步骤2具体为: 步骤2.1: 采用当前流行的多视图融合方法对信用卡客户流失数据进行分析; 从客户流 失比例、 年龄层次、 受教育程度、 本科毕业的 已婚男士金卡客户数据比例、 多数据特征最值 和各交易数据螺线等角度进行展示; 将原始数据的客户编号去除, 并将非数值类数据进行 了数值转化之后, 对其进行了T ‑SNE降维, 对流失客户和非流失客户进行了颜色标注; 步骤2.2: 对同一信用卡流失客户数据集进行了PCA降维, 对流失客户和非流失客户进 行了颜色标注; 步骤2.3: 对信用卡客户流失数据特征进行了梳理, 剔除客户编号和数据标签后, 将剩 余19个语义特征进行分组, 并参 考相关系数公式4计算结果进行删除, 最终确认分组。权 利 要 求 书 1/2 页 2 CN 114936252 A 24.根据权利要求3所述的一种基于语义特征组 的信用卡客户流失数据降维可视化分析 方法, 其特 征是: 所述步骤3具体为: 将全部语义特征粗略分为客户个人信息和 交易信息两个组, 其中, 个人信息分组中以 非数值数据居多, 交易信息组中全部为数值类数据; 从语义特征组角度, 在个人信息组进 行 流失客户与个人信息 关联的语义分析为主; 客户年龄、 性别、 婚姻状况相对而言没有关联关 系, 是客户的基本信息; 受教育程度、 年收入和信用卡类型是客户申请信用卡时的重要依 据; 按语义冗余 规则, 此处取客户年龄、 性别、 婚姻状况作为 客户个人信息语义特 征组; 参考系数结果, 交易账面月数与客户年龄相关度较高; 总交易数和过去12个月的交易 总数和交易总额存在一定的相关性, 而后两者的相关性较高; 信用卡额度与开放购买的信 用额度高度相关; 总周转额度和利用率相关性较高; 第四和第一季度 交易数和交易额变化 存在一定的关系。 5.根据权利要求4所述的一种基于语义特征组 的信用卡客户流失数据降维可视化分析 方法, 其特征是: 按照语义冗余规则进行剔除后, 相关系数参考0.6以上1条和0.2 ‑0.6之间2 条的原则, 多条语义特征相关则 保留条数最少的原则进行最终确认, 得到交易信息语义特 征组为交易数量、 第四与第一季度交易 额和交易数量变化, 平均利用率。 6.一种基于语义特征组的信用卡客户流失数据降维可视化分析系统, 其特征是: 所述 系统包括: 视图融合模块, 所述视 图融合模块以多视 图融合的方式, 对数据集特征进行可视化分 析, 收集信用卡 客户流失的数据; 降维分析模块, 所述降维分析模块基于T ‑SNE算法和PCA方法, 对信用卡客户进行降维 可视化分析, 分析信用卡 客户流失的数据; 语义分析模块, 所述语义分析模块基于语义特征组, 对信用卡客户数据进行分析, 进行 降维可视化分析, 分析信用卡 客户流失的数据。 7.一种计算机设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征是: 所述处理器执行所述计算机程序时实现权利要求1至 5中任一项所述方法的步骤。 8.一种计算机可读存储介质, 所述介质上存储有计算机程序, 其特征是: 所述计算机程 序被处理器执行时实现权利要求1至 5中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114936252 A 3

.PDF文档 专利 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法 第 1 页 专利 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法 第 2 页 专利 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:59:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。