(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111610782.7
(22)申请日 2021.12.27
(71)申请人 淮阴工学院
地址 223400 江苏省淮安市 涟水县海安路
10号安东大厦8楼
(72)发明人 彭甜 马慧心 花磊 嵇春雷
李沂蔓 孙伟 张楚
(74)专利代理 机构 南京苏高专利商标事务所
(普通合伙) 32204
代理人 柏尚春
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06N 7/08(2006.01)G01W 1/14(2006.01)
G06Q 10/04(2012.01)
G06Q 50/06(2012.01)
(54)发明名称
基于随机森林和IFDA优 化CNN-GRU的中长期
径流预测方法
(57)摘要
本发明公开了一种基于随机森林和IFDA优
化CNN‑GRU的中长期径流预测方法, 包括以下步
骤: (1)预先获取旬径流历史数据以及历史旬降
雨数据, 对数据进行预处理, 并分为训练集和测
试集; (2)构建CNN ‑GRU混合预测模型, 并确认卷
积神经网络门控循环单元的结构; (3)使用改进
后的流向算法IFDA优化CNN ‑GRU混合预测模型:
先采用混沌算法对流向算法进行初始化, 然后使
用改进好的流向算法优化CNN ‑GRU模型的学习率
以及隐含层 节点个数, 最后建立基于改进的流向
算法IFDA优化CNN ‑GRU的混合模型IFDA ‑CNN‑
GRU; (4)使用训练集对建立好的IFDA ‑CNN‑GRU模
型进行训练, 将测试集送入训练好的模型中运
行, 得到预测结果。 本发明能够有效地进行中长
期径流预测, 并且比其他模型具有更好的准确
性。
权利要求书3页 说明书8页 附图2页
CN 114282614 A
2022.04.05
CN 114282614 A
1.一种基于随机森林和IFDA优化CNN ‑GRU的中长期径流预测方法, 其特征在于, 包括以
下步骤:
(1)预先获取旬径流历史数据以及历史旬降雨数据, 对数据进行预处理, 并分为训练集
和测试集;
(2)构建CNN ‑GRU混合预测模型, 并确认卷积神经网络的输入层、 卷积层、 池化层, 输出
层; 以及门控循环单 元的输入层、 隐藏层和输出层;
(3)使用改进后的流向算法IFDA优化CNN ‑GRU混合预测模型: 先采用混沌算法对流向算
法进行初始化, 然后使用改进好的流向算法优化CNN ‑GRU模型的学习率以及隐含层节点个
数, 最后建立基于改进的流向算法IFDA优化CN N‑GRU的混合模型IFDA ‑CNN‑GRU;
(4)使用训练集对建立好的IFDA ‑CNN‑GRU模型进行训练, 将测试集送入训练好的模型
中运行, 得到预测结果。
2.根据权利要求1所述的基于随机森林和IFDA优化CNN ‑GRU的中长期径流预测方法, 其
特征在于, 所述 步骤(1)实现过程如下:
将N个水文站点的径流数据和降雨数据分为N个径流数据集和N个降雨数据集; 使用随
机森林RF对(N+N)个降雨和径流数据所构成的高维因子集进行因子选择, 根据变量重要性
评分挑选对旬径流影响较大的因子集;
采用bootstrap(有放回抽样)方法进行抽样, 判断重要性的计算公式如下:
VIF=∑(OB B2‑OBB1)/k (1)
其中, VIF为重要性, OBB1为利用袋内数据构建随机森林模型得到的袋外数据误差; OBB2
为在袋外数据的样本中, 随机改变其中的某些数据要素后, 得到的袋外误差; k为 随机森林
决策树数量;
设定随机森林中树的数量为k, 利用bootstrap(有放回抽样)方法随机在原始样本中抽
取与原始样本容量相同的样本, 重复k次, 把每一次的抽样结果作为每棵决策树的输入; 每
棵决策树根据二叉树分类原则得到每棵树的分类结果, 并对因子集进行重要性排序; 删除
当前高维因子集中不重要的因子, 选择重要性前85%的因子集作为 最后的输出;
将随机森林RF处理过的数据集分为训练集和测试集, 其中训练集占总数据集的70%,
测试集占总数据集的3 0%。
3.根据权利要求1所述的基于随机森林和IFDA优化CNN ‑GRU的中长期径流预测方法, 其
特征在于, 所述 步骤(2)实现过程如下:
卷积神经网络在卷积层通过卷积运算从输入特征图中提取数据块, 然后对所有的数据
块应用相同的变换, 生成输出特征图, 并对输出特征图进行 空间重组, 输出特征图中的每个
空间位置都对应于 输入特征图中的相同位置; 卷积层公式如下:
式中, Conk为卷积层输出 的第k个卷积核的特征图; α 为激活函数; Wtk为当前卷积层第k
个卷积核的权重矩阵; Bik为当前卷积层第k个卷积核的偏置;
为卷积运算; k为卷积核的
个数;
池化层对卷积层输出的信息进行降维处 理, 去除冗余信息的同时加快计算速度:
O=maxCo nk (3)权 利 要 求 书 1/3 页
2
CN 114282614 A
2式中, O为池化层的输出; Co nk为池化层的输入;
将CNN输出的数据矩阵输入GRU, GRU模型包 含重置门和更新门, 具体运 算公式如下:
at=σ(Wa·[dt‑1,xt]) (4)
bt=σ(Wb·[dt‑1,xt]) (5)
kt=σ(Wo·dt) (8)
其中, kt为t时间点GRU单元的所有输 出, tanh和σ 分别是正切激活函数和Sigmoid激活函
数, at, zt分别是t时间点重置门和更新门的计算方法,
包含了当前输入xt的数据, 有目的
性的将
添加到当前的隐藏状态; 门控信号b的范围为[0,1], b越接近1, 表示 “记忆”下来的
信息越多, 而接近0则表示 “遗忘”的信息越多; (1 ‑bt)*dt‑1表示对原本隐藏状态的选择性
“遗忘”, b可以看作遗忘门, 去除dt‑1维度中某些不重要的信息;
表示对含有当前输入
数据信息的
进行筛选“记忆”, 对
维度中的信息进行选择。
4.根据权利要求1所述的基于随机森林和IFDA优化CNN ‑GRU的中长期径流预测方法, 其
特征在于, 所述 步骤(3)包括以下步骤:
(31)随机生成一个向量X=[xm1,xm2,...,xmn], 且每个分量都在[0,1]之间;
(32)采用Circle映射得到混沌序列:
(33)将混沌序列的各个分量映射回取值范围, 得到新的初始化 位置公式:
Fl_X(i)= lb+xmn*(ub‑lb) (11)
其中流向周围还有b个邻域, 邻域的位置公式如下:
Ne_X(j)=Fl_X(x)+rand* △ (12)
其中, Ne_X(j)表示第j个邻域的位置, △若为小数字则在小范围内搜索, 若为大数字则
在大范围内搜索;
(34)为了确定流向的新 位置, 还要确定流向的流速 矢量V,计算公式如下:
V=randn*S (13)
式中, randn 为随机数, S表示 流的邻域和当前位置之间的斜 率向量;
流向新位置更新公式如下:
式中Fl_newX(i)表示 流向的新 位置, 同时模拟流向的具体 计算公式如下:
权 利 要 求 书 2/3 页
3
CN 114282614 A
3
专利 基于随机森林和IFDA优化CNN-GRU的中长期径流预测方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:57:43上传分享