说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202110447724.0 (22)申请日 2021.04.25 (65)同一申请的已公布的文献号 申请公布号 CN 112989711 A (43)申请公布日 2021.06.18 (73)专利权人 昆明理工大 学 地址 650500 云南省昆明市呈贡区景明南 路727号 (72)发明人 金怀平 李友维  (74)专利代理 机构 昆明科众知识产权代理事务 所(普通合伙) 53218 专利代理师 蒋晗 (51)Int.Cl. G06F 30/27(2020.01) G06N 3/12(2006.01)审查员 寇惠云 (54)发明名称 基于半监督集成学习的金霉素发酵过程软 测量建模方法 (57)摘要 本发明公开了一种基于半监督集成学习的 工业过程软测量建模 方法。 该方法针对工业过程 数据普遍存在的有标记数据缺乏但未标记数据 充裕导致的传统软测量模型性能不佳及常规软 测量方法采用单一模型导致的模 型准确性、 稳定 性难以保证的问题, 采用进化优化的方式对未标 记数据进行伪标记估计, 从而充分利用未标记数 据携带的信息, 扩充有标记训练集, 提升了软测 量模型的性能。 同时, 采用集 成学习策略, 通过利 用扩充后的有标记训练集, 构建具有多样性的基 模型, 从而进一步提升模型的准确性与稳定性, 最终提升 了工业过程软测量建模的性能。 权利要求书4页 说明书9页 附图2页 CN 112989711 B 2022.05.20 CN 112989711 B 1.一种基于半监督集成学习的金霉素发酵过程软测量建模方法, 其特征在于, 包括以 下步骤: (1)收集金霉素发酵过程数据D, 构建用于软测量建模的数据库, 通过对金霉素发酵过 程的机理分析, 确定与预测变量y相关的辅助变量X, 辅助变量X即输入量, X={x1,x2,..., xM}; 所收集数据包括有标签数据集与无标签数据集, 有标签数据集为同时包含预测变量与 输入变量的数据集, 而无 标签数据集即为仅包 含输入变量的数据集; (2)基于Z ‑Score方法对样本集D进行归一化处理, 进而得到有标签数据集L∈RN×Q、 无标 签数据集U∈RK×J, 其中, N和Q分别表示有标签数据的样本个数和过程变 量个数, K和J分别表 示无标签数据的样本个数和辅助变量个数, 同时, 将有标签数据集L划分成为训练集Ltrain、 验证集Lvalidate及测试集 Ltest; (3)考虑到金霉素发酵过程的强非线性, 选择集成极限学习机作为基模型, 由于其属于 参数模型, 参数不同, 对应模型也有所差异, 其隐层权重参数由随机初始化产生, 因此可 由 同一训练集 Ltrain构建出M个具有 多样性的初始模型, 分别记为E ELM1,EELM2,···,EELMM; (4)将未标记的伪标记估计转换为一个优化问题, 将所有未标记样本的伪标记作为决 策变量, 并采用进化优化 算法对其进行优化 求解, 而获得优化完毕的伪标记样本; (5)将步骤(4)中优化完毕的伪标记样本用于训练样本集的扩充, 并将进行等量划分, 分别送入不同的基模型中, 并进行训练, 进一 步提升基模型准确性与多样性; (6)将基模型进行集成, 在Stackin g集成框架下, 采用PLS融合局部预测输出, 最终获得 半监督集成学习软测量模型, 并对新样本进行 预测并输出 预测结果; (7)收集新的金霉素发酵 过程在线测量数据, 并进行归一 化处理; (8)将归一化处理后的测量数据直接输入到步骤(6)中建立完毕的半监督集成软测量 模型中预测输出, 并将结果反归一化后作为最终预测结果, 根据预测结果最终实现对金霉 素发酵过程的监测 和控制; 所述步骤(4)获得基于进化优化的伪标签数据的具体过程 为: 1)将无标记数据集U中的样本进行随机排序, 并将其划分为M个样本子集, 分别记为U1, U2,···UM, 利用进化优化算法对数据集U={xu,1,···,xu,K}进行伪标记 优化, 优化目标 描述如下: min[f(x)] 其中, f(x)为待优化问题的目标函数; x为待优化的决策变量; ub和lb分别为变量x的上 限约束和下限约束; 2)利用训练集Ltrain建立高斯过程回归模型GPR, 利用该模型对无标记数据集U= {xu,1,···,xu,K}进行预测进而得到对数据集U的估计输出yu={yu,1,···,yu,K}和预测 方差σ2={σ2 u,1,···, σ2 u,K}, x的上限为ub=yu+3σ, 下限为 lb=yu‑3σ; 3)将步骤(3)中建立的M个集成极限学习机 EELM模型作为初始基模型; 4)确定目标函数f(x), 所提方法中f(x)由四个部分组成, 分别为单模型精度 RMSEindividual、 集成模型精度RMSEensemble、 训练误差RMSEindividual2、 平滑度SMOOTH; 其中, 单模 型精度为有标记数据集L分别加上优化得到的伪标记样本子集U1,U2,···UM后分别训练权 利 要 求 书 1/4 页 2 CN 112989711 B 2出的EELM1,EELM2,···,EELMM各自对有标记样本的预测变量进行预测的均方根误差之 和, 集成模型精度为EELM1,EELM2,···,EELMM各自对有标记样本的预测变量进行预测后 得到的预测值再进行简单平均后对有标记样本的预测变量的均方根误差, 训练误差为仅用 优化得到的伪标记样本子集U1,U2,···UM分别训练出的EELM1,EELM2,···,EELMM各自 对有标记样本的预测变量进行预测的均方根误差之和, 平滑度为图拉普拉斯正则项, 因此 优化目标 可表示为: f(x)=RMSEindividual1+λ1*RMSEensemble+λ2*RMSEindividual2+λ3*SMOOTH    (12) 其中, 0≤ λ1, λ2, λ3≤1分别为 集成模型精度、 训练误差、 平 滑度的平衡系数; 所述单模型精度、 集成模型精度、 训练误差、 平 滑度的计算过程如下: ①单模型精度RMSEindividual1与训练误差RMSEindividual2分别是由不同训练数据, 单模型精 度RMSEindividual1为有标记数据集L分别加上优化得到的伪标记样本子集U1,U2,···UM, 训 练误差RMSEindividual2仅为优化得到的伪标记样本子集U1,U2,···UM分别训练出的EELM1, EELM2,···,EELMM各自对有标记样本的预测变量进行预测的均方根误差之和, 而集成模 型精度则是在单模型精度的基础上将每个EELM的预测值进行简单平均后对有标记样本的 预测变量的均方根 误差, 总体都是均方根 误差的计算, 其计算方式分别为: 其中, NL为有标记训练样本的数目, 为由有标记数据集L加上优化得到的伪标记样 本子集Ui共同训练出的EELMi对第j个有标记训练样本的预测值, yL,j为第j个有标记训练样 本的预测变量 的实际值, 为由有标记数据集L分别加上优化得到的伪标记样本子集U1, U2,···UM分别训练出的EELM1,EELM2,···,EELMM分别对第j个有标记训练样本的预测 值的简单平均得到的值, 为仅由优化得到的伪标记样本子集Ui训练出的EELMi对第j个 有标记训练样本的预测值; ②平滑度定义为图拉普拉斯正则项, 构造有标记样本L与无标记样本U混合之后的数据 的图模型, 用wij表示图模型中两个节点之间的连接 权重, 平滑度的具体 计算方式为: SMOOTH=fTLf    (16) 其中, f表示有标记样本与伪标记样本的输出标记部分, 表示为f=[y1,y2,···,yN, yu,1,yu,2,···,yu,K], L表示图拉普拉斯矩阵, 其计算方式为L=D ‑W, D为一个对角矩阵, 其 主对角线上的元 素为: 其中, W为一个矩阵, 其中的各 元素表示为: 权 利 要 求 书 2/4 页 3 CN 112989711 B 3

.PDF文档 专利 基于半监督集成学习的金霉素发酵过程软测量建模方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于半监督集成学习的金霉素发酵过程软测量建模方法 第 1 页 专利 基于半监督集成学习的金霉素发酵过程软测量建模方法 第 2 页 专利 基于半监督集成学习的金霉素发酵过程软测量建模方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:22:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。