说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211402063.0 (22)申请日 2022.11.10 (71)申请人 北京航空航天大 学 地址 100191 北京市海淀区学院路37号 (72)发明人 高庆 张可昕 吕金虎 刘昊  王振乾  (74)专利代理 机构 北京天汇航智知识产权代理 事务所(普通 合伙) 11987 专利代理师 陈陈数 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) (54)发明名称 一种基于分层优化的工业互联网资源调配 方法 (57)摘要 本发明公开了一种基于分层优化的工业互 联网资源调配方法, 包括步骤: 对实际工业互联 网资源调配网络进行建模, 获得图网络模型; 搭 建信息特征整合编码器, 进行数据预处理; 搭建 特征编码网络、 基于子图结构的特征注意力计算 网络、 动作价值分数决策网络, 依次串联获得单 层级感知决策模块, 级联若干模块, 获得工业互 联网资源调配子图感知决策网络; 进行决策, 在 每次决策轮次中, 高层次对低 层次结构进行预测 完成决策, 低层次对高层次结构进行观测完成决 策; 训练决策网络, 得到优化后的工业互联网资 源调配子图感知决策网络。 该方法能够提高工业 互联网多层次工业资源全局同步决策的最优程 度, 提升单位时间内运输效益价值, 降低运输代 价损失, 降低调配时限。 权利要求书2页 说明书7页 附图1页 CN 115456313 A 2022.12.09 CN 115456313 A 1.一种基于分层优化的工业互联网资源调配方法, 其特 征在于, 包括以下步骤: 步骤一, 对实际工业互联网资源调配网络进行建模, 获得图网络模型; 步骤二, 根据图网络模型的数据维度, 搭建对应维度的信 息特征整合编码器, 对工业资 源包特征属性数据、 图网络进行 数据预处 理; 步骤三, 搭建特征编码网络、 基于子图结构的特征注意力计算网络、 动作价值分数 决策 网络, 依次串联特征编码网络、 基于子图结构的特征注意力计算网络、 动作价值分数决策网 络, 得到单层级感知决策模块; 按照工业资源个体层级顺序以及预测过程和观测过程的先 后顺序, 级联单层级感知决策模块, 完成整个基于分层优化的工业互联网资源调配子图感 知决策网络搭建; 步骤四, 利用工业互联网资源调配子图感知决策网络进行 决策, 在每次决策轮次中, 高 层次对低层次结构进行 预测完成决策, 低层次对高层次结构进行观测完成决策; 步骤五, 利用步骤四获得的决策完成动作状态转移, 获取动作奖励, 实现工业资源包数 据属性更新, 将更新获得 数据记入元 胞数组, 并放入经验 池; 步骤六, 从经验池中提取若干元胞数组, 作为输入数据传入工业互联网资源调配子 图 感知决策网络中, 获得不同工业资源个 体动作价 值函数值计算损失函数, 完成网络训练。 2.根据权利要求1所述的方法, 其特征在于, 所述步骤一, 所述图网络模型为 , 并初始化连接关系矩阵 以及节点之间的连接权重矩阵 , 其中, 表 示运输基站集合, 简称节点集合, 表示节点之间的运输通路集合, 表示节点之间邻接关 系集合, , 表示连接关系矩阵, 表示节点之间的连接 权重矩阵。 3.根据权利要求2所述的方法, 其特征在于, 所述步骤二, 所述对工业资源包特征属性 数据、 图网络进行 数据预处 理具体为: 将属性信息、 结构信 息、 邻接信息输入信 息特征整合编码器进行统一编码, 对齐输入向 量特征维度, 形成分层级标准 化工业资源个 体状态信息矩阵, 其中,S是全局工业资源个体状态矩阵, 表示信息特征整合编码器函数, X表示工业 资源个体的特征属 性信息向量,T表示工业资源个体子图拓扑结构属 性信息向量与局部工 业资源个 体重点特 征属性信息矩阵, O表示全局工业资源个 体子图拓扑 结构连接关系矩阵。 4.根据权利要求3所述的方法, 其特征在于, 所述步骤三, 所述特征编码网络由全连接 网络组成, 对输入的整合编码特征向量获得其在隐空间的表征形式; 所述基于子图结构的 注意力计算网络通过计算同一特征向量在不同关系空间的特征投影距离, 获得不同特征向 量的注意力权重矩阵; 所述动作价值分数决策网络由两层全连接网络组成, 通过获得到的 隐空间特 征感知向量, 完成状态价 值评分, 并输出 结果, 作为下一 步决策的选择依据。 5.根据权利要求 4所述的方法, 其特 征在于, 所述 步骤四具体为: 根据重要性层次与效益损 失规则的不同将工业资源分为 i个层级结构, 每个层级结构 具有ni个工业资源 包;i越大重要性 程度越低, 越靠 近底层结构; 将最底层次 i信息矩阵输入第 i个动作价值子网络模型, 计算得出动作价值 qi, 按照贪心 策略获得 i层级工业资源包决策向量 , 更新全局决策 向量ai, 将其与i‑1层次信息矩阵一权 利 要 求 书 1/2 页 2 CN 115456313 A 2同输入第 i‑1个动作价值子网络模 型, 计算得出动作价值 qi‑1, 获得i‑1层级工业资源包决策 向量 , 更新全局决策向量 ai‑1, 以此递推, 直到完成第2层次工业 资源包决策向量 , 完 成整个分层优化中的决策 预测部分; 从顶层至底层, 第一层次工业资源包获得所有层次所预测的决策向量, 计算得出决策 , 第二层次工业资源包观测获得第 一层次工业资源数据与3到 i层次预测决策, 计算得出 决策 , 以此递推, 以相同的传递方式完成1到 i的决策更迭, 实现全局全 工业资源包单步同 步决策。 6.根据权利要求5所述的方法, 其特 征在于, 所述 步骤五, 所述元 胞数组为; 其中,S为全局工业资源个体状态矩阵, A为全局决策向量, O为全局工业资源个体子图 拓扑结构连接关系矩阵, R为全局工业资源个体动作奖励价值向量, Y为全局工业资源个体 是否完成目标转移标识符。 7.根据权利要求6所述的方法, 其特 征在于, 所述 步骤六, 所述损失函数为: 其中,n为工业资源包总个数, 为目标网络动作价值 的输出结果, 每训练一 定单位时间步长更新目标网络参数与动作价值 网络参数同步, α为目标网络学习率, ri为第 i个工业资源包在完成一次决策并实现动作转移后所获得的奖励分数, Q_value为工业资源 个体动作价 值函数值。权 利 要 求 书 2/2 页 3 CN 115456313 A 3

.PDF文档 专利 一种基于分层优化的工业互联网资源调配方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于分层优化的工业互联网资源调配方法 第 1 页 专利 一种基于分层优化的工业互联网资源调配方法 第 2 页 专利 一种基于分层优化的工业互联网资源调配方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:41:13上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。