(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202111382855.1
(22)申请日 2021.11.22
(65)同一申请的已公布的文献号
申请公布号 CN 113821986 A
(43)申请公布日 2021.12.21
(73)专利权人 中国海洋大学
地址 266100 山东省青岛市崂山区松岭路
238号
(72)发明人 马纯永 王菲菲 高占文 梁达
陈戈
(74)专利代理 机构 青岛海昊知识产权事务所有
限公司 37201
代理人 刘艳青
(51)Int.Cl.
G06F 30/27(2020.01)
G06K 9/62(2022.01)
G06N 7/00(2006.01)
G06F 111/08(2020.01)
G06F 113/08(2020.01)
G06F 119/08(2020.01)(56)对比文件
CN 105894439 A,2016.08.24
CN 109543 356 A,2019.0 3.29
CN 112883564 A,2021.0 6.01
CN 107784667 A,2018.0 3.09
KR 10-1513591 B1,2015.04.14
孙春健.卫星遥感重构海 洋次表层研究进
展. 《海洋信息》 .2018,
刘长东.海 洋多源数据获取及基 于多源数据
的海域管理信息系统. 《中国博士学位 论文全文
数据库》 .20 09,
He Honglin.Uncertai nty analysis of
eddy flux measurements i n typical
ecosystem s of ChinaFlux. 《ECOLOGICAL
INFORMATICS》 .2010,
刘炜.基于随机森林算法的吴堡站测流断面
形态预测. 《人民黄河》 .2018,
马纯永.Altimeter Observati on-Based
Eddy Nowcasting Using an Improved Co nv-
LSTM Netw ork. 《remote sensi ng》 .2019,
审查员 白硕
(54)发明名称
基于随机森林的涡旋海面信号与水下关键
参数反演方法
(57)摘要
一种基于随机森林的涡旋海面信号与水下
关键参数反演方法, 该方法对Argo浮标数据和基
于SLA的涡旋识别与追踪数据集求交集; 统计交
集内涡旋识别数据的主要参数与水下温度异常
数据的相关性, 得到相关性参数; 基于随机森林
算法并结合得到的相关性参数, 预测水下温度 异
常极值; 基于概率密度函数对水下温度异常极值
所处深度进行统计 分析, 并得到水下深度的概率
分布数据。 本发明利用随机森林算法, 根据涡旋
海表层信号反演出涡旋的水下温度异常极值及
其所处深度的信息, 并将反演结果与实际数据做
精确性检验, 能够完成对全球涡旋水下温度异常关键参数的反演与精确性统计, 对于海洋中尺度
涡旋的水 下研究具有参 考价值。
权利要求书3页 说明书11页 附图5页
CN 113821986 B
2022.02.22
CN 113821986 B
1.一种基于随机森林的涡旋海面信号与水下关键参数反演方法, 其特征在于, 该方法
包括以下步骤:
(1)对Argo浮标数据和基于SLA的涡旋识别与追踪数据集 求交集; 所述交集具体为:
1)求浮标与涡 心连线的延长线与涡旋边界的交点;
2)求交点与涡 心的距离;
3)提取位于涡旋内部的A rgo浮标;
交点与涡心的总距离为L1, 浮标与涡心的总距离为L2, a=L2/L1, 若a<=1, 则判定Argo
浮标位于涡旋内部, 以此方法遍历Argo浮标数据, 得到Argo 温度异常数据与基于SLA的涡旋
识别数据的交集数据集;
(2)统计交集内涡旋识别数据的主要参数与水下温度异常数据的相关性, 得到相关性
参数; 所述 步骤(2)具体为:
1)首先导入滤波函数, 使Ybf(t)=Yfb(t)的初始条件同时会消除数据的瞬变; Ybf(t)=Yfb(t)
是在最小二乘框架下工作,
其中, Yfb和Ybf为初始值
初始参数设置如下:
零相位低通滤波器参数设置如下:
2)再调用核密度估计函数, 高斯核密度估计公式如下:
其中h是带宽; 对温度异常和深度数据 经过高斯核密度处理后得到一个二维数组表, 返
回二维数组值从小到大的索引值, 得到温度异常极值、 深度及其索引值x,y,z, 对x,y按照z
的升序进行排列, 即可 得到全球涡旋海表面信号与水 下温度异常数据的二维索引表;
(3)基于随机森林算法并结合 步骤(2)得到的相关性 参数, 预测水 下温度异常 极值;
(4)基于概率密度函数对水下温度异常极值所处深度进行统计分析, 并得到水下深度
的概率分布数据。
2.如权利要求1所述的反演方法, 其特征在于, 所述步骤(1)中, 所述步骤(1)中Argo浮权 利 要 求 书 1/3 页
2
CN 113821986 B
2标数据收集要超过20年。
3.如权利要求1所述的反演方法, 其特征在于, 所述步骤(2)中, 所述相关性参数包括涡
旋海表面信号的半径、 振幅、 动能。
4.如权利要求1所述的反演方法, 其特征在于, 所述步骤(3)中: 使用步骤(2)得到的涡
旋与水下特征信息的二 维索引表文件, 在随机森林算法中导入 该文件, 使用涡旋的半径、 动
能、 振幅作为主要输入量, 浮标距离涡心的距离、 经纬度等信息作为辅助输入量, 来预测水
下温度异常 极值。
5.如权利要求 4所述的反演方法, 其特 征在于, 所述 步骤(3)具体为:
1)首先对二维索引表文件使用网格搜索, 即网格搜索和交叉验证; 对训练数据集采用
随机森林 预测, 得到温度异常 极值的预测结果。
训练集划分公式如下:
∈是均值 为0, 方差为1的正态分布数据集, 变量数m为 正整数;
{xm}来自平均集合正态分布数据集EXiXj=ρ|i‑j|迭代后的结果, ρ 是从[0,1]的均匀分布
中选择的。
βm=c[(h‑|m‑k|)+]2, m=1, ..., 30
βm是子集, k是聚类中心, h为分组系数;
2)对训练数据集进行拟合处理, 然后进行标准归一化处理; 标准归一化采用的是Z ‑
score标准化, 其思路是把所有数据归一到均值 为0方差为1的分布中, 公式如下:
Xscale=(X ‑Xmean)/σ
其中, Xmean是特征的均值; σ: 每组特征值 的标准差; X: 每一个特征值; Xscale: 归一化
后的特征值;
3)对训练数据集进行随机森林预测, 得到基于涡旋海面信号的水下温度异常极值反演
结果, 随机森林算法公式如下:
其中,
为预测因子, x为输入值, y为输出值
使用
公式并应用不平等 函数EZ2≥(EZ)2带入到上式 中得到
对公式两边积分可得到输入值x和预测值y的分布情况, 同时可得到均方误差φA(x), 平
均均方误差
经过随机森林 预测算法处 理可得到最后的温度异常预测值y。
6.如权利 要求1所述的反演方法, 其特征在于, 所述步骤(4)是将步骤(2)中得到的Argo
温度异常数据与基于SLA的涡旋识别数据的交集数据集中的涡旋 半径、 振幅、 动能及温度异
常及其所处深度信息, 基于涡旋的半径、 动能、 振幅作为主要输入量, 使用核密度估计的概
率密度函数来预测水 下温度异常 极值所处深度的情况。权 利 要 求 书 2/3 页
3
CN 113821986 B
3
专利 基于随机森林的涡旋海面信号与水下关键参数反演方法
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 05:17:02上传分享