专利自主增量知识提取和表示方法、终端及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202110539052.6 (22)申请日 2021.05.18 (71)申请人上海交通大学地址 200240 上海市闵行区东川路80 0号 (72)发明人张临骊　李德伟　 (74)专利代理机构上海恒慧知识产权代理事务所(特殊普通合伙) 31317 专利代理师张宁展 (51)Int.Cl. G06F 30/27(2020.01) G06F 16/36(2019.01) (54)发明名称自主增量知识提取和表示方法、终端及介质 (57)摘要本发明提供了一种自主增量知识提取和表示方法，同时提供了一种相应的终端及介质。通过对系统运行过程中系统操作信息数据、传感器设备状态数据和人主观经验数据的采集，建立历史经验数据库。进一步计算系统中相似度数据向量，获取知识参数初始预测估计值，并融合历史经验从策略 ‑值学习模型中推理得到新的知识参数预测估计值，以此得到新的系统操作信息向量和新的知识信息向量。随系统运行不断优化策略‑值学习模型并对数据库进行自主增量知识提取和表示，以扩充历史经验数据库，达到自主增量知识提取和表示的目的，提高在实际生产生活过程中知识的高效利用。权利要求书3页说明书14页附图2页 CN 115374686 A 2022.11.22 CN 115374686 A 1.一种自主增量知识提取和表示方法，其特征在于，包括： S1，获取工业生产过程中系统操作信息数据、传感器设备状态数据以及专家先验数据作为历史经验数据，建立历史经验数据库； S2，计算当前时刻系统操作信息数据与所述历史经验数据中的系统操作信息数据的相似度，获取知识参数初始预测估计值； S3，根据获取的所述知识参数初始预测估计值，从策略 ‑值学习模型中提取得到融合历史经验的策略向量； S4，根据所述融合历史经验的策略向量，得到下一时刻的系统操作信息数据； S5，将新的同一时刻的系统操作信息数据、传感器设备状态数据以及融合历史经验的策略向量作为知识信息向量存入历史经验数据库； S6，重复S2到S5，直到当前阶段的工业生产过程结束，进行策略 ‑值学习模型的优化，实现对历史经验数据库中知识信息向量的自主增量知识提取和表示。 2.根据权利要求1所述的自主增量知识提取和表示方法，其特征在于，所述S1中，建立历史经验数据库，包括：获取工业生产过程中系统操作信息数据、传感器设备状态数据以及相应的专家先验数据，得到原始数据；对获取的所述原始数据进行预处理；针对预处理后的不同数据，分别建立相应的用于存储系统操作信息数据的情景知识数据集、用于存储传感设备状态数据的价值知识数据集以及用于存储专家先验数据的策略知识数据集；对三个数据集中的数据进行关联操作：根据相同时刻信息关联情景知识数据集和价值知识数据集中的数据，根据相同状态信息关联价值知识数据集和策略知识数据集中的数据，得到关联关系；将三个数据集及其之间的关联关系作为历史经验数据，构成得到历史经验数据库。 3.根据权利要求2所述的自主增量知识提取和表示方法，其特征在于，所述历史经验数据库表示为： Φ(i)＝[ S(i)， V(i)， P(j)]， i ＝1， 2，…， N，其中， Φ(t)表示历史经验数据库中储存的知识信息向量， S(i)表示情景知识数据集中的系统操作信息数据， V(i)表示价值知识数据集中的传感设备状态数据， P(i)表示策略知识数据集中的专家先验数据。 4.根据权利要求1所述的自主增量知识提取和表示方法，其特征在于，所述S2中，计算当前时刻系统操作信息数据与所述历史经验数据的相似度，获取知识参数初始预测估计值，包括：设计相似度函数，计算当前时刻系统操作信息数据与所述历史经验数据中的系统操作信息数据的相似度；在所述历史经验数据库中，根据计算得出的相似度值找到距离小于阈值d的若干个包含最为接近当前系统操作信息数据的信息向量；根据权重选择知识参数初始预测估计值。 5.根据权利要求4所述的自主增量知识提取和表示方法，其特征在于，所述相似度函数权　利　要　求　书 1/3 页 2 CN 115374686 A 2为： D(S(i)S(t) )＝kexp(‑d(S(i)S(t) ))+(1‑k)cos(S(i)(S(t) ), 其中， D(S(i),S(t))表示为当前时刻系统操作信息数据S(t)与历史经验数据中的历史系统操作信息数据S(i)之间的相似度计算函数， d(S(i),S(t))为上述相似度计算函数的补充，右侧等式描述了系统操作信息数据中每个元素间的计算方式， κ和 τl均为根据专家经验设定的超参数， τl表示系统操作信息数据的信息向量中每一个元素的权重值， S(i)表示情景知识数据集中的系统操作信息数据， S(t)表示当前时刻系统操作信息数据， l表示系统操作信息数据中的第l个元素， S(m)表示系统操作信息数据中第l个元素在历史经验数据中的极值的下标， V(i)表示价值知识数据集中的传感设备状态数据。 6.根据权利要求4所述的自主增量知识提取和表示方法，其特征在于，所述根据权重选择知识参数初始预测估计值，包括：其中， Zold(t)表示知识参数初始预测估计值， P(i)表示策略知识数据集中的专家先验数据， k表示通过相似度函数的经验选择，得到当前系统操作信息数据的k个最相关的专家经验数据向量； wi表示权重系数，所述权重系数wi为： 7.根据权利要求1所述的自主增量知识提取和表示方法，其特征在于，所述S3中，根据获取的所述知识参数初始预测估计值，从策略 ‑值学习模型中提取得到融合历史经验的策略向量，包括：构建策略 ‑值学习模型，将得到的知识参数初始预测估计值Zold(t)和当前时刻的系统操作信息数据S(t)作为所述策略 ‑值学习模型的输入，从策略 ‑值学习模型中提取得到新的知识参数预测估计值，即融合历史经验的策略向量；其中，所述策略 ‑值学习模型为： Znew(t)＝ π(S(t)， Zold(t))，其中， π表示策略 ‑值学习模型， Znew(t)表示新的知识参数预测估计值，即融合历史经验的策略向量；所述策略 ‑值学习模型的参数更新优化模型包括：权　利　要　求　书 2/3 页 3 CN 115374686 A 3

专利 自主增量知识提取和表示方法、终端及介质

专利自主增量知识提取和表示方法、终端及介质