说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210464131.X (22)申请日 2022.04.29 (71)申请人 华侨大学 地址 362000 福建省泉州市丰泽区城东城 华北路269号 (72)发明人 王华珍 刘晓聪 陈坚 何霆  (74)专利代理 机构 厦门市首创君 合专利事务所 有限公司 3 5204 专利代理师 李艾华 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于拓扑结构保持的图表示学习方法 及系统 (57)摘要 本发明公开一种基于拓扑结构保持的图表 示学习方法及系统, 能在保持图数据拓扑不变性 的前提下, 融合拓扑结构和语义特征来共同提高 图表示学习的质量; 方法包括: 针对图数据的特 性, 设计拓扑结构保持的自监督任务; 输入图数 据, 使用图卷积神经网络对其进行特征编码, 从 而学习到节 点的初始向量表示; 将学习到的节点 初始向量表示输入到TGSSL(Topology ‑ preserving  Graph Self‑Supervised   Learning)模型进行图自监督学习, 最终在结构 保持的基础上 获得高质量的节 点向量表示。 本发 明能有效解决现有图表示学习方法在学习节点 向量时无法有效融合结构信息的问题。 权利要求书2页 说明书6页 附图2页 CN 114863234 A 2022.08.05 CN 114863234 A 1.一种基于 拓扑结构保持的图表示学习方法, 其特 征在于, 包括如下步骤: 步骤1、 针对图数据的特性, 设计拓扑 结构保持的自监 督任务; 步骤2、 输入图数据, 使用图卷积神经网络对其进行特征编码, 从而学习到节点初始向 量表示; 步骤3、 将学习到的节点初始向量表示输入到TGSSL模型进行图自监督学习, 最终在结 构保持的基础上获得高质量的节点向量表示。 2.根据权利要求1所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述 步骤1具体包括: 步骤1.1、 基于图数据的结构设计图拓扑划分自监督任务, 具体为利用图数据中边的连 接密度情况对图进行分区, 再 预测节点所属分区索引; 步骤1.2、 基于图数据的结构设计mask节点自监督任务, 具体为通过随机mask部分节点 的特征, 再根据其邻居节点特 征对mask节点进行重构。 3.根据权利要求2所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述 步骤1.1具体包括: 步骤1.1.1、 利用图划分算法METIS, 将图数据划分为K∈{1,2, …,|V|}个社区, 输出具 有分区索引的节点集合{Vp_1,…,Vp_k,…,Vp_K|Vp_k∈V,k=1, …,K}; 其中, |V| 为图数据的节 点个数, 步骤1.1.2、 将节点分区索引作为图拓扑划分任务的伪标签yTP供TGSSL模型进行学习; 其中, 第n个节点的分区索引为k可形式化表达为: yTP_n=k,if vn∈Vp_k,n=1,…,|V|, 步骤1.1.3、 基于伪标签yTP定义图拓扑划分任务损失函数LTP为多分类交叉熵: 其中, N为图拓扑划分的节点总样本数, 是第n个节点 为第k个社区的预测值。 4.根据权利要求3所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述 步骤1.2具体包括: 步骤1.2.1、 在图数据中, 随机mask|Ma|个节点的特 征x; 其中, 步骤1.2.2、 将步骤1.2.1中未做mask操作之前的症状节点特征向量x作为mask节点任 务的伪标签yMN供TGSSL模型进行 学习; 步骤1.2.3、 基于伪标签yMN定义mask节点任务损失函数LMN为平均绝对误差: 其中, 为节点vi经过TGSSL模型所学习到的节点向量表示。 5.根据权利要求4所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述 步骤2具体包括: 输入图数据的节点初始向量矩阵X和归一化邻接矩阵 使用两层的图卷积神经 网络进 行图表示学习, 从而学习到图数据节点的初始向量表示H; 权 利 要 求 书 1/2 页 2 CN 114863234 A 2其中, 为正则化的 为加上自环的邻接矩阵, I为单位矩阵, 是 的度矩阵, W1是第一个卷积的训练参数矩阵。 6.根据权利要求5所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述 步骤3具体包括: 步骤3.1、 计算TGS SL模型中图拓扑划分任务的损失LTP; 步骤3.2、 计算TGS SL模型中mask节点任务的损失LMN; 步骤3.3、 计算TGS SL模型中下游任务的多分类交叉熵损失Lmain: 其中, I和C分别为节点分类下游任务的总样本数和节点类别数, 是第i个样本为第c 类的预测值。 步骤3.4、 根据总损失L更新网络参数W1直到达到最大迭代次数T, 最终可获得在结构保 持的基础上的高质量节点向量表示Z和训练好的TGS SL模型, 如下: L= λ1Lmain+λ2LTP+λ3LMN                                         (5) 其中, 分别是下游任务、 图拓扑划分任务和mask节点任务的权 重。 7.一种基于 拓扑结构保持的图表示学习 系统, 其特 征在于, 包括: 自监督任务设计模块, 用于针对图数据的特性, 设计拓扑 结构保持的自监 督任务; 节点初始向量表示学习模块, 用于输入图数据, 使用图卷积神经网络对其进行特征编 码, 从而学习到节点初始向量表示; 节点向量表示获取模块, 用于将学习到的节点初始向量表示输入到TGSSL模型进行图 自监督学习, 最终在结构保持的基础上获得高质量的节点向量表示。权 利 要 求 书 2/2 页 3 CN 114863234 A 3

.PDF文档 专利 一种基于拓扑结构保持的图表示学习方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于拓扑结构保持的图表示学习方法及系统 第 1 页 专利 一种基于拓扑结构保持的图表示学习方法及系统 第 2 页 专利 一种基于拓扑结构保持的图表示学习方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:33:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。