说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210502063.1 (22)申请日 2022.05.10 (71)申请人 浙江财经大学 地址 310012 浙江省杭州市西湖区文一西 路83号 (72)发明人 张永全 曹昊 张宇权 齐少春 (74)专利代理 机构 杭州兴知捷专利代理事务所 (特殊普通 合伙) 33338 专利代理师 林振兴 (51)Int.Cl. G06Q 40/02(2012.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于生成对抗学习填补金融数据的方 法 (57)摘要 本发明涉及一种银行个人信贷领域数据解 决不平衡的技术, 具体涉及一种基于生成对抗学 习填补金融数据的方法, 属于金融领域。 首先利 用生成对抗学习中的数据生 成器, 采用变卷积核 的反卷积算法, 随机生成数据特征, 得到未经辨 别的数据, 然后利用生成对抗学习的判别器, 初 步学习真实数据的数据分布, 接着判别器对生成 器的生成数据进行判断, 根据判断结果生成器对 于自己生 成数据进行改正, 同时判别器更新自己 的算法, 最后可以生成与真实数据类似的银行个 人信贷数据。 本发明能避免传统方法解决不平衡 问题仅仅采用的过采样方法, 并对 金银行个人信 贷违约判断领域得到 较好的结果。 权利要求书3页 说明书5页 附图1页 CN 114881762 A 2022.08.09 CN 114881762 A 1.一种基于生成对抗学习填补金融数据的方法, 其特 征在于: 该 方法包括如下步骤: 步骤一: 数据分类和数据预处 理问题 (1.1)将N个区域的银行个人信贷数据作为输入, 首先判断数据是哪一类, 即判断是违 约数据还非违约数据, 并确定是否为数据不平衡问题; (1.2)对于不平衡的数据, 或者需要操作的数据进行正则化操作; 步骤二: 生成器数据生成 (2.1)对于第一 步处理好的数据, 将数据进行维度拓展; (2.2)对于生成器的搭建过程, 确定数据的基础框架, 首 先确定数据来源维度; (2.3)根据(2.2)的维度, 进行数据 生成器的模型搭建, 采用变卷积核反卷积操作, 做批 量正则化和激活函数; (2.4)对于数据生成器的神经网络的块数确定的设置, 设置为(2.1)中数据维度的N 值; 步骤三: 人脸识别分类 (3.1)采用一个二维的卷积操作, 将数据放大到更高的维数, 并进行标准化和激活函 数; 步骤四: 生成器和辨别器的训练 (4.1)进行真实数据与生成数据的加权组合, 组合进入训练; (4.2)为每一次训练设置梯度惩罚; (4.3)加入 含有梯度惩罚项的损失函数进行训练; (4.4)多次训练得到最终的生成数据。 2.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法, 其特征在于: 所 述的步骤一(1.2)中: 对数据进行 标准化, 具体操作步骤为: 其中, xi为每一项数据, μ为每一项数据的均值, d为方差 。 3.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法, 其特征在于: 所 述的步骤二(2.1)中: 具体的维度拓展为(b,c,h,w), 其中b 为数据的总条数, c默认为1, h默 认为1, w为数据的具体维度。 4.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法, 其特征在于: 所 述的步骤二(2.2)中: 数据 维度可以分为类似用户个人信贷历史, 个人经济状况, 个人用户 行为等各个维度等, 设置为维度为N, 同时统计每一个维度中各项数据的小维度数量, 计数 为n。 5.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法, 其特征在于: 所 述的步骤二(2.3)中: 采用反卷积思想, 其公式满足: Hout=(Hin‑1)*stride[0]‑2*padding[0]+Kernel_size[0]+output_pad ding[0] Wout=(Win‑1)*stride[1]‑2*padding[1]+Kernel_size[1]+output_pad ding[1] 其中, Hin代表输入数据的h值, Hout代表输出数据的h值, stride[0]代表步长的第一维大 小, stride[1]代表步长的第二个维度的大小, padding[0]代表填充值的第一维的值, padding[1]代表填充值的第二维的值, Kernel_size[0]代表卷积核的第一个维度, Kernel_ size[1]代表卷积核的第二个维度; output_padding[0]默认为0, output_padding[1]默认权 利 要 求 书 1/3 页 2 CN 114881762 A 2为0, 其中, 反卷积操作变卷积核操作, 其思想为: 设定卷积核的大小为[1,m], 其中m遵循 (2.1)中确认的关于数据的小维度的n值, 从而保证生 成的数据符合某个领域的数据分布的 假设。 6.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法, 其特征在于: 步 骤(2.3)中的激活函数采用批量正则化, 其公式遵循 激活函数采用 ReLU函数, 公式为ReLU(x)=(x)+=max(0,x)。 7.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法, 其特征在于: 所 述的步骤二(2.4)中, 神经网络最后一层通过反卷积操作后, 需要保证最后的维数与(1.1) 中数据每一条维度必须相同, 从而设置单独的卷积核, 且最后采用Tanh激活函数, 其中, tanh激活函数为 8.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法, 其特征在于: 所 述的步骤三(3.1)中, 卷积 操作遵循的公式为: 其中, bias代表扰动项, weight代表权重, *表示为互相关计算; 放大到 的维数, 依照具 体情况确定; 其中采用的正则化操作为 InstanceN orm2d, 遵循的操作为: 其中x 为输入特征, E[x]为特征的期望值, Var[x]为特征方差, ε为残差项, 其中γ和β 表示这个向 量所对应的g amma和beta参数的通道值; 其中, 采用的激活函数为 LeakyReLU, 遵循的操作为: 9.根据权利要求1所述的一种基于生成对抗学习填补金融数据的方法, 其特征在于: 所 述的步骤四(4.1)中, 所采用的数据加权方式为 其中, xg为生成器生成的 数据, xr为真实数据; 所述的步骤四(4.2)中, 所采用的梯度惩罚项为: 每次训练的梯度项进行标准化之后, 采用 其中, 为生成数据的数据分布的均值, 为 组合后数据的数据分布的二范 数; 所 述 的 步 骤 四 ( 4 . 3 ) 中 ,所 采 用 的 更 新 后 的 损 失 函 数 为 :采 用 其中, 为生成数据的数据分布的均值, 真实数据的数据分布的均 值, 为组合后数据的数据分布的二范 数;权 利 要 求 书 2/3 页 3 CN 114881762 A 3
专利 一种基于生成对抗学习填补金融数据的方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 16:59:53
上传分享
举报
下载
原文档
(487.6 KB)
分享
友情链接
ISO 16237 2015 Mechanical joining — Destructive testing of joints — Specimen dimensions and test procedure for cross-tension testing of single joints.pdf
ISO 105-F07 2001 Textiles — Tests for colour fastness — Part F07 Specification for secondary acetate adjacent fabric.pdf
ISO 6742-1 2023 Cycles — Lighting and retro-reflective devices — Part 1 Lighting and li.pdf
ISO 18219-1 2021 Leather Determination of chlorinated hydrocarbons in leather Part 1 Chromatographic method for short-chain chlorinated paraffins (SCCPs).pdf
ISO CIE 11664-2 2022 Colorimetry — Part 2 CIE standard illuminants.pdf
ISO 11064-4 2013 Ergonomic design of control centres — Part 4 Layout and dimensions of workstations.pdf
ISO-IEC TR 15942 2000 Information technology -- Programming languages -- Guide for the use of the Ada programming language in high integrity systems.pdf
ISO 20121-2024 中文版.pdf
ISO 2426-1 2020 Plywood — Classification by surface appearance — Part 1 General.pdf
ISO TR 19867-3 2018 Clean cookstoves and clean cooking solutions — Harmonized laboratory test protocols — Part 3 Voluntary performance targets for cookstoves based on laboratory testing.pdf
GB-Z 25425-2010 风力发电机组 公称视在声功率级和音值.pdf
GB-T 28131-2011 溴氰菊酯原药.pdf
GB-T 3290-1982 信息交换用磁带盘的尺寸和性能.pdf
GB-T 30415-2013 钟表 功能和非功能宝石.pdf
GB-T 311.6-2005 高电压测量标准空气间隙.pdf
GB-T 30912-2014 汽车液压盘式制动缸用橡胶密封件.pdf
GB-T 44842-2024 微机电系统(MEMS)技术 薄膜材料的弯曲试验方法.pdf
GB-T 3920-2008 纺织品 色牢度试验 耐摩擦色牢度.pdf
GB-T 28534-2012 高压开关设备和控制设备中六氟化硫(SF6)气体的释放对环境和健康的影响.pdf
GB-T 17707-1999 报价报文.pdf
1
/
3
10
评价文档
赞助1.5元 点击下载(487.6 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。