说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202110539052.6 (22)申请日 2021.05.18 (71)申请人 上海交通大 学 地址 200240 上海市闵行区东川路80 0号 (72)发明人 张临骊 李德伟  (74)专利代理 机构 上海恒慧知识产权代理事务 所(特殊普通 合伙) 31317 专利代理师 张宁展 (51)Int.Cl. G06F 30/27(2020.01) G06F 16/36(2019.01) (54)发明名称 自主增量知识提取和表示方法、 终端及 介质 (57)摘要 本发明提供了一种自主增量知识提取和表 示方法, 同时提供了一种相应的终端及介质。 通 过对系统运行过程中系统操作信息数据、 传感器 设备状态数据和人主观经验数据的采集, 建立历 史经验数据库。 进一步计算系统中相似度数据向 量, 获取知识参数初始预测估计值, 并融合历史 经验从策略 ‑值学习模型中推理得到新的知 识参 数预测估计值, 以此得到新的系统操作信息向量 和新的知识信息向量。 随系统运行不断优化策 略‑值学习模 型并对数据库进行自主增量知 识提 取和表示, 以扩充历史经验数据库, 达到自主增 量知识提取和表示的目的, 提高在实际生产生活 过程中知识的高效利用。 权利要求书3页 说明书14页 附图2页 CN 115374686 A 2022.11.22 CN 115374686 A 1.一种自主增量知识提取和表示方法, 其特 征在于, 包括: S1, 获取工业生产过程中系统操作信息数据、 传感器设备状态数据以及专家先验数据 作为历史经验数据, 建立历史经验数据库; S2, 计算当前时刻系统操作信息数据与所述历史经验数据中的系统操作信息数据的相 似度, 获取知识参数初始预测估计值; S3, 根据获取的所述知识参数初始预测估计值, 从策略 ‑值学习模型中提取得到 融合历 史经验的策略向量; S4, 根据所述融合历史经验的策略向量, 得到下一时刻的系统操作信息数据; S5, 将新的同一时刻的系统操作信息数据、 传感器设备状态数据以及融合历史经验的 策略向量作为知识信息向量存 入历史经验数据库; S6, 重复S2到S5, 直到当前阶段的工业生产过程结束, 进行策略 ‑值学习模型的优化, 实 现对历史经验数据库中知识信息向量的自主增量知识提取和表示。 2.根据权利要求1所述的自主增量知识提取和表示方法, 其特征在于, 所述S1中, 建立 历史经验数据库, 包括: 获取工业生产过程中系统操作信 息数据、 传感器设备状态数据以及相应的专家先验数 据, 得到原 始数据; 对获取的所述原 始数据进行 预处理; 针对预处理后的不同数据, 分别建立相应的用于存储系统操作信 息数据的情景知识数 据集、 用于存储传感设备状态数据的价值知识数据集以及用于存储专家先验数据的策略知 识数据集; 对三个数据集中的数据进行关联操作: 根据相同时刻信 息关联情景知识数据集和价值 知识数据集中的数据, 根据相同状态信息关联价值知识数据集和策略知识数据集中的数 据, 得到关联关系; 将三个数据集及其之间的关联关系作为历史经验数据, 构成得到历史经验数据库。 3.根据权利要求2所述的自主增量知识提取和表示方法, 其特征在于, 所述历史经验数 据库表示 为: Φ(i)=[ S(i), V(i), P(j)], i =1, 2,…, N, 其中, Φ(t)表示历史经验数据库中储存的知识信息向量, S(i)表示情景知识数据集中 的系统操作信息数据, V(i)表示价值知识数据集中的传感设备状态数据, P(i)表示策略知 识数据集中的专 家先验数据。 4.根据权利要求1所述的自主增量知识提取和表示方法, 其特征在于, 所述S2中, 计算 当前时刻系统操作信息数据与所述历史经验数据的相似度, 获取知识参数初始预测估计 值, 包括: 设计相似度函数, 计算当前时刻系统操作信 息数据与 所述历史经验数据中的系统操作 信息数据的相似度; 在所述历史经验数据库中, 根据计算得出的相似度值找到距离小于阈值d的若干个包 含最为接近当前系统操作信息数据的信息向量; 根据权重选择知识参数初始预测估计值。 5.根据权利要求4所述的自主增量知识提取和表示方法, 其特征在于, 所述相似度函数权 利 要 求 书 1/3 页 2 CN 115374686 A 2为: D(S(i)S(t) )=kexp(‑d(S(i)S(t) ))+(1‑k)cos(S(i)(S(t) ), 其中, D(S(i),S(t))表示为当前时刻系统操作信息数据S(t)与历史经验数据中的历史 系统操作信息数据S(i)之间的相似度计算函数, d(S(i),S(t))为上述相似度计算函数的补 充, 右侧等式描述了系统操作信息数据中每个元素间的计算方 式, κ和 τl均为根据专家经验 设定的超参数, τl表示系统操作信息数据的信息向量中每一个元素的权重值, S(i)表示情 景知识数据集中的系统操作信息数据, S(t)表示当前时刻系统操作信息数据, l表 示系统操 作信息数据中的第l个元素, S(m)表示系统操作信息数据中第l个元素在历史经验数据中的 极值的下 标, V(i)表示 价值知识数据集中的传感设备状态数据。 6.根据权利要求4所述的自主增量知识提取和表示方法, 其特征在于, 所述根据权重选 择知识参数初始预测估计值, 包括: 其中, Zold(t)表示知识参数初始预测估计值, P(i)表示策略知识数据集中的专家先验 数据, k表示通过相似度函数 的经验选择, 得到当前系统操作信息数据的k个最相关的专家 经验数据向量; wi表示权重系数, 所述权 重系数wi为: 7.根据权利要求1所述的自主增量知识提取和表示方法, 其特征在于, 所述S3中, 根据 获取的所述知识参数初始预测估计值, 从策略 ‑值学习模型中提取得到融合历史经验的策 略向量, 包括: 构建策略 ‑值学习模型, 将得到的知识参数初始预测估计值Zold(t)和当前时刻的系统 操作信息数据S(t)作为所述策略 ‑值学习模 型的输入, 从策略 ‑值学习模型中提取得到新的 知识参数 预测估计值, 即融合历史经验的策略向量; 其中, 所述策略 ‑值学习模型为: Znew(t)= π(S(t), Zold(t)), 其中, π表示策略 ‑值学习模型, Znew(t)表示新的知识参数预测估计值, 即融合历史经验 的策略向量; 所述策略 ‑值学习模型的参数 更新优化模型包括: 权 利 要 求 书 2/3 页 3 CN 115374686 A 3

.PDF文档 专利 自主增量知识提取和表示方法、终端及介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 自主增量知识提取和表示方法、终端及介质 第 1 页 专利 自主增量知识提取和表示方法、终端及介质 第 2 页 专利 自主增量知识提取和表示方法、终端及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:24:19上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。