(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111674519.4
(22)申请日 2021.12.31
(71)申请人 天津大学
地址 300072 天津市南 开区卫津路9 2号
(72)发明人 谢宗霞 毛凯舟 孙彦茹
(74)专利代理 机构 天津市北洋 有限责任专利代
理事务所 12 201
专利代理师 李丽萍
(51)Int.Cl.
G06F 30/27(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于多任务深度学习神经网络的太阳风速
度预测方法
(57)摘要
本发明公开了一种基于多任务深度学习神
经网络的太阳风速度预测方法, 所用的模型包括
一个由一维卷积神经网络CNN和一个长短时记忆
神经网络LS TM组成的共 享模块, 一个主 LSTM模块
以及一个自回归层AR模块。 共享模块用于提取多
个任务共用的浅层空间和时间特征, 主 LSTM模块
用于单独提取主任务的特性, 自回归模块用于以
一种线性的方式对神经网络模型进行适当的修
正。 采用多任务学习机制来实现多步预测, 构建
模型。 在太阳风速度预测领域, 引入多任务学习
的机制是一种新的尝试。 本发明的优点是, 联合
多个独立的预测任务来同时并行学习, 充分利用
数据信息, 共享公共信息来帮助改进浅层特征提
取, 并为主要任务设计独立的结构来提高预测性
能。
权利要求书3页 说明书7页 附图2页
CN 114492171 A
2022.05.13
CN 114492171 A
1.一种基于多任务深度学习神经网络的太阳风速度预测方法, 其特征在于, 所采用的
神经网络模型包括 一个共享模块、 一个主LSTM模块以及一个自回归层(AR)模块;
所述共享模块由一维CN N模块和一个共享 LSTM模块组成;
所述一维CNN模块用于接收序列输入和自动学习数据空间特征, 对不同维度的输入属
性的相互关系进行建模; 所述共享LSTM模块用于捕获时间序列的时间相关性, 并提取不同
预测任务之间的相关信息, 在多任务并行训练中, 通过神经网络的反向传播实现所述共享
模块参数的联合学习和共享;
所述主LSTM模块用于解码所述共享模块中的多任务共享信 息, 并单独用于主任务的预
测, 所述主LSTM模块用于接收所述共享模块的输出; 所述主LSTM模块和所述共享LSTM模块
的结构相同;
所述自回归层(AR)模块用于以一种线性的方式对神经网络模型进行修 正。
2.根据权利要求1所述的太阳风速度预测方法, 其特 征在于, 包括以下步骤:
步骤1、 数据处 理:
使用的数据集包括以下3个部分:
(1)从低分辨率OMNI数据集中选择五个物理量属性, 分别是太阳风速度(Bulk speed)、
质子密度(Proton density)、 质子温度(Proton temperature)、 流压力(Flow pressure)和
场矢量的均方根标准偏差(Sigma ‑b);
(2)根据ICME列表引入日冕物质抛射属性: 将ICME列表二值化为一个新特征, 并将存在
日冕物质抛射事 件的时间点设为1, 不存在的则为0;
(3)通过计算大气成像组件(AIA)
图像中冕洞的像素值之和, 引入了冕洞信息属
性: 将所述的
图像转换为灰度图像后, 计算图像中小于15px的像素值之和, 用于表征
冕洞的影响, 并记为area;
使用上述数据源的数据所构成的7个属性的多元时间序列作为神经网络模型的输入,
分别进行2 4小时和96小时的预测, 目标输出分别是距离观测序列未来2 4小时和96小时后的
太阳风速度的预测值;
对于24小时的预测, 7维时间序列数据的时间间隔为1小时, 即每小时1个7维向量, 每个
向量的7个向量元 素分别对应7个属性;
对于96小时的预测, 7维时间序列数据的时间间隔为24小时, 即每24小时1个7维向量,
每个向量的7个向量元 素分别对应7个属性, 每 个属性值通过计算24小时里的平均值得到;
根据7维时间序列数据各个维度的均值和标准差, 采用z ‑score标准化方法进行数据的
标准化, 经过处理的数据符合标准 正态分布, 即均值 为0, 方差为1, 计算公式为:
式(1)中, μ为所有样本数据的均值, σ 为所有样本数据的标准差, 计算时对每个维度的
属性分别进行;
按照8:1:1的比例将数据分为训练集、 验证集和 测试集;
步骤2、 共享模块特 征提取:
设置5个相邻时间点的太阳风预测任务进行联合多任务学习; 其中, 对于24小时预测
的, 将第22小时、 第23小时、 第24小时、 第25小时和第26小时分别作为5个单独预测 任务, 对权 利 要 求 书 1/3 页
2
CN 114492171 A
2于96小时预测的, 将第48小时、 第72小时、 第96小时、 第120小时和第144小时分别作为5个单
独预测任务; 5个单独预测任务的编号分别依次为1、 2、 3、 4和5, 将第3个单独预测作为主任
务, 其他4个单独预测作为辅助任务;
预处理的数据首先通过共享模块提取数据的空间和时间特征, 作为5个单独预测任务
的共享浅层特 征, 操作如下:
空间特征的提取: 将所述多元时间序列作为一维CNN模块的输入, 设xn=[X1, ..., Xn],Xi
是由七维属性组成的向量, n是输入窗口 的长度, c代 表一维CN N模块提取的抽象特 征,
C=Conv1D(Xn) (2)
式(2)中, Co nv1D代表一维卷积 操作;
时间特征的提取: 将一维CNN模块提取的抽象特征作 为共享LSTM模块的输入, 从而捕获
时间序列的时间相关性; 共享LSTM模块的初始隐藏状态和初始单元状态设置为零, 在训练
过程中, 5个单独预测任务共享该共享LSTM模块的权重和偏 差, 从而集成了多任务的时间特
性; 训练后, 将所述的多任务的时间特性存储在该共享LSTM模块的共享参数中; 对于该共享
LSTM模块的输入c, k∈{1, 2, 3, 4, 5}代 表任务编号, 共享 LSTM模块执 行以下操作:
式(3)中, c为共享LSTM模块的内部单元状态参数, h为共享LSTM模块的隐藏单元状态参
数, 0≤p≤L是RN N网络的循环次数, shared_LSTM代 表共享LSTM模块 运算;
步骤3、 主任务单独特 征提取:
对于主任务, 将共享 LSTM模块中的最后一个输出序列 作为主LSTM模块的输入:
式(4)中, c ′是主LSTM模块的内部单元状态参数, h ′是主LSTM模块的隐藏单元状态参
数;
主LSTM模块执 行以下操作:
式(5)中, mai n_LSTM代 表主LSTM模块 运算;
步骤4.太阳风速度预测值的输出:
对于辅助任务, 通过共享模块全连接层的输出加上自回归层(AR)模块输出获得与该辅
助任务对应时间点的太阳风速度预测值;
对于主任务, 通过主LSTM模块全连接层的输出加上自回归层(A R)模块输出获得与主任
务对应时间点的太阳风速度预测值;
全连接层的操作如下:
式(6)中, Dk是全连接层任务 k的预测结果输出,
分别是全连接层的权 重和偏差;权 利 要 求 书 2/3 页
3
CN 114492171 A
3
专利 基于多任务深度学习神经网络的太阳风速度预测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 00:19:43上传分享