说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221098280 6.X (22)申请日 2022.08.16 (71)申请人 电子科技大 学 地址 611731 四川省成 都市高新区 (西区) 西源大道 2006号 (72)发明人 李福生 叶俊廷 杨婉琪  (74)专利代理 机构 电子科技大 学专利中心 51203 专利代理师 闫树平 (51)Int.Cl. G01N 23/223(2006.01) G06N 20/00(2019.01) (54)发明名称 一种随机森林回归结合主成分分析的元素 含量定量分析方法 (57)摘要 本发明公开了一种随机森林回归结合主成 分分析的元素含量定量分析方法, 属于X射线荧 光仪(XRF)元素定量分析领域。 本发明从获取的 XRF光谱数据中提取待测元素信息、 干扰元素信 息作为特征, 通过PCA算法对特征进行降维处理, 将降维处理的数据划分为训练样本集和测试样 本集, 基于训练样本集得到PCA ‑RFR模型, 通过该 模型实现元素的定量分析。 本发 明通过在随机森 林回归的基础上加入PCA特征降维, 消除了训练 样品集中特征的冗余数据, 使得数据具有更强的 线性度, 从而达到提高定量分析模 型的精度以及 泛化能力。 权利要求书3页 说明书7页 附图2页 CN 115436407 A 2022.12.06 CN 115436407 A 1.一种随机森林回归结合主成分分析的元素含量定量分析方法, 其特征在于: 包括以 下步骤: 步骤1、 选 定待测元 素a, 采集 n个国家标准样品作为目标样本; 步骤2、 使用光谱仪测得各目标样本的XRF光谱数据, 并对每个光谱数据进行归一化处 理; 步骤3、 从步骤2归一化处理后的XRF光谱数据中, 筛选出待测元素a的峰值信息和含量 信息、 待测元 素a的m个干扰元 素的峰值信息和含量信息, 得到XRF光谱的原 始数据集A; 步骤4、 根据应用需求确定降维后的特征维数; 对步骤3得到的XRF光谱原始数据集A中 的m个干扰元素的峰值信息做P CA降维处理, 得到压缩后含有p个特征的目标样本集; 同时将 PCA降维后的m个干扰元 素的峰值信息作为特 征集; 步骤5、 将步骤4得到的目标样本集随机划分为训练样本集和 测试样本集; 步骤6、 基于训练样本集进行训练得到PCA ‑RFR模型; 该模型的输入数据 为待测元素a的 峰值数据和经PCA降维后的特 征集, 输出 数据为待测元 素a的含量; 步骤7、 将测试样本集中的输入数据代入步骤6所得PCA ‑RFR模型进行预测, 得到测试样 本集中待测元 素a的含量预测结果。 2.根据权利要求1所述的一种随机森林回归结合主成分分析的元素含量定量分析方 法, 其特征在于: 还 包括了PCA ‑RFR模型的验证过程, 该 过程包括 步骤8和步骤9: 步骤8、 对步骤7 得到的待测元 素a的含量预测结果反归一 化处理; 步骤9、 根据 步骤8的反归一化处理结果, 分别计算PCA ‑RFR模型的均方误差与拟合优度 两种性能指标, 根据计算结果发现PCA ‑RFR模型的均方误差和拟合优度性能均在标准范围 内; 所述PCA ‑RFR模型的均方误差和拟合优度计算公式如下: 其中, yi为第i个测试样本集中待测元素a的含量值, 为经反归一化处理后的第i个测 试样本集 中待测元素a的含量预测值, 为所有测试样本集中待测元素a的含量真实值的平 均值; R=1, 2, . ..n。 3.根据权利要求1所述的一种随机森林回归结合主成分分析的元素含量定量分析方 法, 其特征在于: 所述 步骤4中PCA降维过程如下: 步骤4.1、 假设原 始数据集A={Y1, Y2, Y3, ..., Yn},每个样本有s维特 征值 对所有特 征进行中心化: 权 利 要 求 书 1/3 页 2 CN 115436407 A 2其中, 为第j个特 征的特征均值, 第i个样本的第j维特 征值; 步骤4.2、 利用步骤4.1中所 得到的特 征均值 更新原始数据集Yi, 得到Yi*: 步骤4.3、 根据步骤4.2中所 得到的Yi*建立协方差矩阵B: 其中, xb与xc分别为样本中第b个 特征和第c个 特征,b=1, ..., s,c=1, ..., s, 与 为 第b个特征与第c个特征的均值, 矩阵B的对角线 是特征的方差, 其余 非对角线 上的元素为对 应特征的协方差; 步骤4.4、 确定降维后特征维数p, 利用线性代数相关知识对协方差矩阵进行特征值分 解, 得到s个特征值λ={ λ1, λ2, λ3, ..., λs}及其对应的特征向量 μ={ μ1, μ2, μ3, ..., μs}, 将全 部特征向量标准 化, 并将其组成特 征向量矩阵W; 其中p<s; 步骤4.5、 计算s个特 征向量所对应的主成分: Zr=(ur)TB              (7) 其中, r=1, 2, . .., s; 步骤4.6、 求 解s个特征值所对应的主成分 贡献率: 其中, Wt为第t个特 征值对应的主成分 贡献率, λt为第t个特 征值, t=1, . .., 6; 步骤4.7、 根据步骤4.6中所得到的主成分贡献率大小进行降序排序, 并选取前p大的特 征值作为降维后的特 征值, 得到这p个特 征值的特 征向量矩阵W*; 步骤4.8、 利用步骤4.7中所得到的特征向量矩阵W*, 对原始特征通过公式(7)计算转化 为新特征: zi=(W*)Txi               (9) 其中, zi为转化后的第i个特 征; i=1, 2, ..., p 步骤4.9、 根据步骤4.8中所 得到的新特 征数据, 得到降维后的特 征集D: D=(z1, z2, ..., zp)               (10)权 利 要 求 书 2/3 页 3 CN 115436407 A 3

.PDF文档 专利 一种随机森林回归结合主成分分析的元素含量定量分析方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种随机森林回归结合主成分分析的元素含量定量分析方法 第 1 页 专利 一种随机森林回归结合主成分分析的元素含量定量分析方法 第 2 页 专利 一种随机森林回归结合主成分分析的元素含量定量分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:04:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。