说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210369157.6 (22)申请日 2022.04.08 (71)申请人 上海电力大 学 地址 201306 上海市浦东 新区沪城环路 1851号 (72)发明人 彭柏程 张安勤 (74)专利代理 机构 南京禹为知识产权代理事务 所(特殊普通 合伙) 32272 专利代理师 朱宝庆 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 40/02(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于生成对抗网络的不平衡数据集的 预测方法 (57)摘要 本发明公开了一种基于生成对抗网络的不 平衡数据集的预测方法, 主要流程为: 接收预测 请求; 采集数据, 形成数据集, 明确数据集中的特 征与标签及少数类样本和多数类样 本的数量; 将 数据集中的非数值特征列以及标签列转变为分 类数值; 将处理的数据集进行标准化, 并将标准 化后数据集中的多数类样本和少数类样本进行 分离; 用条件生成对抗网络合成少数类样本, 形 成平衡数据集; 将平衡数据集划分为训练集和测 试集; 构建卷积神经网络, 用划分好的训练集训 练卷积神经网络, 得到训练好的卷积神经网络; 最后, 将测试集输入训练好的卷积神经网络得到 预测结果。 本发明预测方法, 解决了现有方法存 在处理大数据时生成少数类样本非常困难甚至 不能生成的问题。 权利要求书2页 说明书7页 附图2页 CN 114676928 A 2022.06.28 CN 114676928 A 1.一种基于生成对抗网络的不平衡数据集的预测方法, 其特 征在于: 包括, 网络app端接收预测请求; 数据后台采集数据, 形成原始业务数据集, 确定所述原始业务数据集中的少数类样本 Smin和多数类样本Smaj的数量; 将所述原始业务数据集中的非数值特征列进行独热编码, 转变为计算机可识别的向 量; 将处理之后的数据集进行标准化, 并将标准化后数据集中的多数类样本Smaj和少数类 样本Smin进行分离; 用条件生成对抗网络合成少数类样本a, 形成平衡数据集; 将平衡数据集划分为训练集和 测试集; 构建卷积神经网络, 利用训练集训练卷积神经网络, 得到训练好的卷积神经网络; 将测试集输入训练好的卷积神经网络得到预测结果。 2.根据权利要求1所述的基于生成对抗网络的不平衡数据集的预测方法, 其特 征在于: 所述标准 化为将输入数据集中的数据按比例缩放, 使数据属于[0,1]内。 3.根据权利要求1或2所述的基于生成对抗网络的不平衡数据集的预测方法, 其特征在 于: 所述形成平衡数据集包括: 初始化生成器G和判别器D的参数; 将所述少数类样本Smin输入至生成器G中, 生成器G利用噪声z和条件c生成与输入 的少 数类样本Smin数量相同的人工合成少数类样本a; 依次循环更新判别器D、 生成器G, 直至判别概 率为0.5为止, 完成训练。 4.根据权利要求3所述的基于生成对抗网络的不平衡数据集的预测方法, 其特征在于: 所述生成器G的损失函数为: G=log(1‑D(G(z|c) )) 公式中G(z|c)表示生成器的输出, D(G(z|c))表示判别器D判断生成器G生成的数据为 真实数据的概 率, z表示噪声。 5.根据权利要求 4所述的基于生成对抗网络的不平衡数据集的预测方法, 其特 征在于: 所述判别器D的损失函数为: D=log(1‑D(G(z|c) ))+logD(x)+BC E(AC(G(z|c) )) 上式中, D(x)表示判别模型的输出, 即输入参数x为真实数据的概率; D(G(z|c))表示判 别器D判断生成器G生成 的数据为真实数据的概率, BCE(AC(G(z|c)))代表辅助 分类器输出 的数据标签。 6.根据权利要求5所述的基于生成对抗网络的不平衡数据集的预测方法, 其特 征在于: 生成对抗网络的目标优化 函数为: 在上述公式中, pdata表示真实数据的分布, pz表示生成器输出合成数据的分布, c表示加 入的条件限制。 模 型训练目的是希望生 成器G的损失V(D,G)越小越好, 判别器的损失V(D,G) 越大越好。 7.根据权利要求4~6任一所述的基于生成对抗网络的不平衡数据集的预测方法, 其特权 利 要 求 书 1/2 页 2 CN 114676928 A 2征在于: 所述训练卷积神经网络包括, 将卷积神经网络 权值进行初始化; 在输入层输入数据, 输入数据经过第一卷积层、 池化层、 第二卷积层、 全连接层得到输 出值, 计算输出值与目标值的误差值; 当所述预测结果的误差值大于期望值时, 将误差值传回进行反向传播, 依次计算全连 接层、 第二卷积层、 池化层、 第一卷积层的误差, 至预测误差值不大于期 望值时结束训练, 得 到训练好的卷积神经网络 。 8.根据权利要求7 所述的基于生成对抗网络的不平衡数据集的预测方法, 其特 征在于: 计算卷积神经网络的输出值的表达式为: Op=Fl(…(F2(F1(W1X1))W2)Wl) 上式中, X1为网络的输入; W1表示网络第一层的权重系数矩阵; W2表示网络第二层的权 重系数矩阵; Wl表示网络第l层的权重系数矩阵; F1表示网络第一层采用的sigmoid函数, 以 此类推, Fl表示网络第l层的激活函数。 9.根据权利要求8所述的基于生成对抗网络的不平衡数据集的预测方法, 其特 征在于: 反向传播计算 误差的表达式为: δl=(Wl+1)Tδl+1×f′(ul) ul=Wlxl‑1+bl 其中, δl+1項表示第l+1层的误差函数; Wl+1表示第l+1层权重系数矩阵; δl表示传播至第l 层的误差函数; ul表示第l层的输出; bl表示第l层的偏置; xl‑1表示第l层的输入。 10.根据权利要求8或9所述的基于生成对抗网络的不平衡数据集的预测方法, 其特征 在于: 所述输入层的输入数据为 4*4像素点构成的矩阵; 第一卷积层包含10个特征图, 利用3*3的窗口对输入图像进行卷积, 得到每个特征图的 大小为4*4; 池化层对第一卷积层进行降采样操作, 选用最大池化的方式得到10个特征图, 每个特 征图的大小减小到2*2; 第二卷积层包含20个特征图, 采用的卷积核大小为2*2,得到每个特征图的大小为1*1; 第二卷积层得到的特 征图经过全连接层, 得到大小为1*2的输出 结果。权 利 要 求 书 2/2 页 3 CN 114676928 A 3
专利 一种基于生成对抗网络的不平衡数据集的预测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 16:59:53
上传分享
举报
下载
原文档
(437.4 KB)
分享
友情链接
ISO IEC 10165-5 1994 Information technology — Open Systems Interconnection — Structure of management information Generic management information.pdf
ISO IEC 24800-4 2010 Information technology — JPSearch — Part 4 File format for metadata embedded in image data (JPEG and JPEG 2000).pdf
ISO 458-2-1985Plastics. Determination of stiffness in torsion of flexible materials. Part 2_Applicat.pdf
ISO 7201-2-1991Fire extinguishing media. Halogenated hydrocarbons. Part 2_Code of practice for safe.pdf
ISO 21232 2018 Textiles — Determination of moisturizing effect of textile materials by measurement of microclimate between textiles and simulated human skin using sweating guarded hotplate.pdf
ISO-PAS 22101-5 2024 Polyethylene reinforced with short glass fibres (PE-sGF) piping systems for industrial applications Part 5 Fitness for purpose of the system.pdf
ISO 558 1980 Conditioning and testing — Standard atmospheres — Definitions.pdf
ISO 10106 2021 Cork stoppers — Determination of global migration.pdf
ISO 22910 2020 Corrosion of metals and alloys Measurement of the electrochemical critical localized corrosion temperature (E-CLCT) for Ti alloys fabricated via the additive manufacturing method.pdf
ISO 6929 2013 Steel products — Vocabulary.pdf
GB-T 783-2013 起重机械 基本型的最大起重量系列.pdf
GB-T 15636-2008 电离辐射厚度计.pdf
GB-T 14699-2023 饲料 采样.pdf
GB-T 25399-2010 农林拖拉机和机械 液压接头 制动回路.pdf
GB-T 17626.15-2011 电磁兼容 试验和测量技术 闪烁仪 功能和设计规范.pdf
GB-T 15695-2008 信息技术 开放系统互连 表示服务定义.pdf
GB-T 4440-2022 活扳手.pdf
GB-T 3099.3-2017 紧固件术语 表面处理.pdf
GB-T 5117-2012 非合金钢及细晶粒钢焊条.pdf
GB-T 10561-2005 钢中非金属夹杂物含量的测定--标准评级图显微检验法.pdf
1
/
3
12
评价文档
赞助1.5元 点击下载(437.4 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。