说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111417170.6 (22)申请日 2021.11.25 (71)申请人 江苏科技大学 地址 212000 江苏省镇江市梦溪路2号 (72)发明人 郑艳芳 秦伟舒 李雪宝 田会峰  周瑜 刘乾 赵丽 秦海亭  (74)专利代理 机构 南京创略知识产权代理事务 所(普通合伙) 32358 代理人 刘文艳 (51)Int.Cl. G06T 7/00(2017.01) G06K 9/62(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01)G06N 3/02(2006.01) G06N 20/00(2019.01) (54)发明名称 一种基于K-近邻的太阳耀斑预报方法 (57)摘要 本发明公开了一种基于K ‑近邻的太阳耀斑 预报方法, 通过采用k ‑NN算法, 对太阳特征进行 提取, 数据分割, 数据清洗三个阶段实现对太阳 耀斑发生概率进行预测, 在模型构建阶段, 对数 据筛选和剔除, 将短而复杂的中性线剔除, 以及 采用了视线磁图的检测方式, 使检测效率有所提 升, 同时相较于传统方法对可能存在的跨越两种 耀斑基本的现象进行剔除, 并且对太阳耀斑原始 数据进行标准化, 标准化后进行数据拟合处理, 使其精准度更高, 数据更加合理, 表现力更好, 整 个过程中, 处理效果都优于传统算法, 具有创新 性, 具有良好的应用前 景。 权利要求书2页 说明书8页 附图2页 CN 113989273 A 2022.01.28 CN 113989273 A 1.一种基于K ‑近邻的太阳耀斑预报方法, 其特 征在于: 包括以下步骤, 步骤(A), 模型构建, 检测ARs, 从下载的观测数据库图像中提取太阳特征, 利用探测到 的ARs数据库, 从每 个AR中提取太阳 特征; 步骤(B), 使用格朗日插值法处理缺失值, 将不完整原始数据的值用NAN进行替换, 减少 有价值数据损失, 用于后续模型训练; 步骤(C), 剔除 同一活动区的太阳耀斑记录中跨越两种耀斑级别的现象; 步骤(D), 将提取的单位不一致的太阳特征原始数据x使用最大最小值进行标准化, 公 式如下: 其中: xmin是最小值, xmax是最大值, X ’为所求值; 步骤(E), 设置分类器预测发生和不发生耀斑的ARs两类的成本参数, 确保分类器不会 只关注负类, 检测模型 是否过度拟合; 步骤(F), 使用k ‑NN算法计算测试数据与各个训练数据之间的距离, 按照距离的递进关 系进行排序, 选取距离最小的K个点, 确定前K个点所在类别的出现频率, 返回前K个点中出 现频率最高的类别作为测试 数据的预测分类; 步骤(G), 模型验证。 2.根据权利 要求1所述的一种基于K ‑近邻的太阳耀斑预报方法, 其特征在于: 步骤(B), 所述缺失值取值范围为: K+1个取值点: (x0,y0),…,(xk,yk), 其中x对应自变量的位置, y对 应这函数在这个位置, 这里每一个y值都不 等于0的取值; 解设任意两个不同的xj都互不相同, 其中j的含义为: K+1个取值点: (x0,y0),…,(xk,yk) 中的任意第j个元 素xj, 对应的拉格朗日插值所 得到的拉格朗日插值多 项式为: 其中每个lj(x)为拉格朗日基本多 项式(或称插值基函数), 其表达式为: 3.根据权利 要求1所述的一种基于K ‑近邻的太阳耀斑预报方法, 其特征在于: 步骤(C), 剔除同一活动区的太阳耀斑记录中跨越两种耀斑级别的现象的具体流 程为: (C1), 将数据集分类为由低到高的B、 C、 M、 X四个耀斑级别; (C2), 遍历一个级别的数据集, 判断是否存在于更高类 中, 如果存在则删除更高类中的 一条记录, 如果 不存在则继续遍历, 直到整个数据集遍历完成; (C3), 判断是否为倒数第二个数据集, 如果 不是则返回(C2), 如果是 该步骤(C 3)结束。 4.根据权利要求1所述的一种基于K ‑近邻的太阳耀斑预报方法, 其特征在于: 所述步骤 (E)中将正类成本参数设置为C1, 负类的成本参数C2, 其中设置C1>C2, 改变了正类和负类 之 间的惩罚csot, 其公式为: 其中: W代 表混淆矩阵, wT代表混淆矩阵的转置矩阵。权 利 要 求 书 1/2 页 2 CN 113989273 A 25.根据权利 要求1所述的一种基于K ‑近邻的太阳耀斑预报方法, 其特征在于: 步骤(E), 采用shuf fle和spl it CV来证明模型的有效性, 其中两组数据的大小比为8 :2。 6.根据权利 要求1所述的一种基于K ‑近邻的太阳耀斑预报方法, 其特征在于: 步骤(F), 为优化的模型, 令K=5 0, 采用了曼哈顿距离d1(x,y), 该距离如下表示: 7.根据权利 要求1所述的一种基于K ‑近邻的太阳耀斑预报方法, 其特征在于: 步骤(E), 其中定义预测正确的耀斑ARs为真阳性TP, 预测错误的耀斑ARs为假阴性FN, 预测正确的耀 斑ARs为真阴性TN, 预测错 误的耀斑ARs为 假阳性FP, 从这四个量中, 计算出 各种度量: 精度描述分类 器不将一个例子标记为 正或负的能力, 定义 为: 召回率是分类 器找到所有正 面例子的能力的特 征: 精度和查全率通常是反相关的, 查全率会随着精度的提高而降低, 反之亦然, 计算谐波 均值是一个有用的量, 即f1得分: 以上的定义是针对正类的, 通过用TN替换TP, 用FN替换FP(反之亦然), 可以为负类定义 类似的数量; 其中, 负召回率被定义为TN/(TN+FP); 另一个广泛使用的分类器性能指标是准确度, 定 义为: 8.根据权利要求7所述的一种基于K ‑近邻的太阳耀斑预报方法, 其特征在于: 当一个分 类器总是预测一个活动区总是不发生耀斑时, 此时精度与f1得分无意义, 评估分类器性能 是通过计算技能得分来确定它与给定基准的比较方式, 使用HSS技能评分方式, 将HSS定义 如下: 其中, P=TP+FN为正样本总数, N=TN+FP为负样本总数, HSS1的范围在负无穷到1之间, 得分为1表示预测完 美, 得分为负表示预测没有耀斑的表现更差 。 9.根据权利要求8所述的一种基于K ‑近邻的太阳耀斑预报方法, 其特征在于: 当比较不 同预测研究结果时, HS S技能得分失效, 此时采用TS S技能得分, 定义如下: 权 利 要 求 书 2/2 页 3 CN 113989273 A 3

.PDF文档 专利 一种基于K-近邻的太阳耀斑预报方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于K-近邻的太阳耀斑预报方法 第 1 页 专利 一种基于K-近邻的太阳耀斑预报方法 第 2 页 专利 一种基于K-近邻的太阳耀斑预报方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:19:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。