专利基于随机森林和IFDA优化CNN-GRU的中长期径流预测方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111610782.7 (22)申请日 2021.12.27 (71)申请人淮阴工学院地址 223400 江苏省淮安市涟水县海安路 10号安东大厦8楼 (72)发明人彭甜　马慧心　花磊　嵇春雷　李沂蔓　孙伟　张楚　 (74)专利代理机构南京苏高专利商标事务所 (普通合伙) 32204 代理人柏尚春 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 7/08(2006.01)G01W 1/14(2006.01) G06Q 10/04(2012.01) G06Q 50/06(2012.01) (54)发明名称基于随机森林和IFDA优化CNN-GRU的中长期径流预测方法 (57)摘要本发明公开了一种基于随机森林和IFDA优化CNN‑GRU的中长期径流预测方法，包括以下步骤： (1)预先获取旬径流历史数据以及历史旬降雨数据，对数据进行预处理，并分为训练集和测试集； (2)构建CNN ‑GRU混合预测模型，并确认卷积神经网络门控循环单元的结构； (3)使用改进后的流向算法IFDA优化CNN ‑GRU混合预测模型：先采用混沌算法对流向算法进行初始化，然后使用改进好的流向算法优化CNN ‑GRU模型的学习率以及隐含层节点个数，最后建立基于改进的流向算法IFDA优化CNN ‑GRU的混合模型IFDA ‑CNN‑ GRU； (4)使用训练集对建立好的IFDA ‑CNN‑GRU模型进行训练，将测试集送入训练好的模型中运行，得到预测结果。本发明能够有效地进行中长期径流预测，并且比其他模型具有更好的准确性。权利要求书3页说明书8页附图2页 CN 114282614 A 2022.04.05 CN 114282614 A 1.一种基于随机森林和IFDA优化CNN ‑GRU的中长期径流预测方法，其特征在于，包括以下步骤： (1)预先获取旬径流历史数据以及历史旬降雨数据，对数据进行预处理，并分为训练集和测试集； (2)构建CNN ‑GRU混合预测模型，并确认卷积神经网络的输入层、卷积层、池化层，输出层；以及门控循环单元的输入层、隐藏层和输出层； (3)使用改进后的流向算法IFDA优化CNN ‑GRU混合预测模型：先采用混沌算法对流向算法进行初始化，然后使用改进好的流向算法优化CNN ‑GRU模型的学习率以及隐含层节点个数，最后建立基于改进的流向算法IFDA优化CN N‑GRU的混合模型IFDA ‑CNN‑GRU； (4)使用训练集对建立好的IFDA ‑CNN‑GRU模型进行训练，将测试集送入训练好的模型中运行，得到预测结果。 2.根据权利要求1所述的基于随机森林和IFDA优化CNN ‑GRU的中长期径流预测方法，其特征在于，所述步骤(1)实现过程如下：将N个水文站点的径流数据和降雨数据分为N个径流数据集和N个降雨数据集；使用随机森林RF对(N+N)个降雨和径流数据所构成的高维因子集进行因子选择，根据变量重要性评分挑选对旬径流影响较大的因子集；采用bootstrap(有放回抽样)方法进行抽样，判断重要性的计算公式如下： VIF＝∑(OB B2‑OBB1)/k (1) 其中， VIF为重要性， OBB1为利用袋内数据构建随机森林模型得到的袋外数据误差； OBB2 为在袋外数据的样本中，随机改变其中的某些数据要素后，得到的袋外误差； k为随机森林决策树数量；设定随机森林中树的数量为k，利用bootstrap(有放回抽样)方法随机在原始样本中抽取与原始样本容量相同的样本，重复k次，把每一次的抽样结果作为每棵决策树的输入；每棵决策树根据二叉树分类原则得到每棵树的分类结果，并对因子集进行重要性排序；删除当前高维因子集中不重要的因子，选择重要性前85％的因子集作为最后的输出；将随机森林RF处理过的数据集分为训练集和测试集，其中训练集占总数据集的70％，测试集占总数据集的3 0％。 3.根据权利要求1所述的基于随机森林和IFDA优化CNN ‑GRU的中长期径流预测方法，其特征在于，所述步骤(2)实现过程如下：卷积神经网络在卷积层通过卷积运算从输入特征图中提取数据块，然后对所有的数据块应用相同的变换，生成输出特征图，并对输出特征图进行空间重组，输出特征图中的每个空间位置都对应于输入特征图中的相同位置；卷积层公式如下：式中， Conk为卷积层输出的第k个卷积核的特征图； α 为激活函数； Wtk为当前卷积层第k 个卷积核的权重矩阵； Bik为当前卷积层第k个卷积核的偏置；为卷积运算； k为卷积核的个数；池化层对卷积层输出的信息进行降维处理，去除冗余信息的同时加快计算速度： O＝maxCo nk (3)权　利　要　求　书 1/3 页 2 CN 114282614 A 2式中， O为池化层的输出； Co nk为池化层的输入；将CNN输出的数据矩阵输入GRU， GRU模型包含重置门和更新门，具体运算公式如下： at＝σ(Wa·[dt‑1,xt]) (4) bt＝σ(Wb·[dt‑1,xt]) (5) kt＝σ(Wo·dt) (8) 其中， kt为t时间点GRU单元的所有输出， tanh和σ 分别是正切激活函数和Sigmoid激活函数， at， zt分别是t时间点重置门和更新门的计算方法，包含了当前输入xt的数据，有目的性的将添加到当前的隐藏状态；门控信号b的范围为[0,1]， b越接近1，表示 “记忆”下来的信息越多，而接近0则表示 “遗忘”的信息越多； (1 ‑bt)*dt‑1表示对原本隐藏状态的选择性 “遗忘”， b可以看作遗忘门，去除dt‑1维度中某些不重要的信息；表示对含有当前输入数据信息的进行筛选“记忆”，对维度中的信息进行选择。 4.根据权利要求1所述的基于随机森林和IFDA优化CNN ‑GRU的中长期径流预测方法，其特征在于，所述步骤(3)包括以下步骤： (31)随机生成一个向量X＝[xm1,xm2,...,xmn]，且每个分量都在[0,1]之间； (32)采用Circle映射得到混沌序列： (33)将混沌序列的各个分量映射回取值范围，得到新的初始化位置公式： Fl_X(i)＝ lb+xmn*(ub‑lb) (11) 其中流向周围还有b个邻域，邻域的位置公式如下： Ne_X(j)＝Fl_X(x)+rand* △ (12) 其中， Ne_X(j)表示第j个邻域的位置， △若为小数字则在小范围内搜索，若为大数字则在大范围内搜索； (34)为了确定流向的新位置，还要确定流向的流速矢量V,计算公式如下： V＝randn*S (13) 式中， randn 为随机数， S表示流的邻域和当前位置之间的斜率向量；流向新位置更新公式如下：式中Fl_newX(i)表示流向的新位置，同时模拟流向的具体计算公式如下：权　利　要　求　书 2/3 页 3 CN 114282614 A 3

专利 基于随机森林和IFDA优化CNN-GRU的中长期径流预测方法

专利基于随机森林和IFDA优化CNN-GRU的中长期径流预测方法