(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210464131.X
(22)申请日 2022.04.29
(71)申请人 华侨大学
地址 362000 福建省泉州市丰泽区城东城
华北路269号
(72)发明人 王华珍 刘晓聪 陈坚 何霆
(74)专利代理 机构 厦门市首创君 合专利事务所
有限公司 3 5204
专利代理师 李艾华
(51)Int.Cl.
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于拓扑结构保持的图表示学习方法
及系统
(57)摘要
本发明公开一种基于拓扑结构保持的图表
示学习方法及系统, 能在保持图数据拓扑不变性
的前提下, 融合拓扑结构和语义特征来共同提高
图表示学习的质量; 方法包括: 针对图数据的特
性, 设计拓扑结构保持的自监督任务; 输入图数
据, 使用图卷积神经网络对其进行特征编码, 从
而学习到节 点的初始向量表示; 将学习到的节点
初始向量表示输入到TGSSL(Topology ‑
preserving Graph Self‑Supervised
Learning)模型进行图自监督学习, 最终在结构
保持的基础上 获得高质量的节 点向量表示。 本发
明能有效解决现有图表示学习方法在学习节点
向量时无法有效融合结构信息的问题。
权利要求书2页 说明书6页 附图2页
CN 114863234 A
2022.08.05
CN 114863234 A
1.一种基于 拓扑结构保持的图表示学习方法, 其特 征在于, 包括如下步骤:
步骤1、 针对图数据的特性, 设计拓扑 结构保持的自监 督任务;
步骤2、 输入图数据, 使用图卷积神经网络对其进行特征编码, 从而学习到节点初始向
量表示;
步骤3、 将学习到的节点初始向量表示输入到TGSSL模型进行图自监督学习, 最终在结
构保持的基础上获得高质量的节点向量表示。
2.根据权利要求1所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述
步骤1具体包括:
步骤1.1、 基于图数据的结构设计图拓扑划分自监督任务, 具体为利用图数据中边的连
接密度情况对图进行分区, 再 预测节点所属分区索引;
步骤1.2、 基于图数据的结构设计mask节点自监督任务, 具体为通过随机mask部分节点
的特征, 再根据其邻居节点特 征对mask节点进行重构。
3.根据权利要求2所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述
步骤1.1具体包括:
步骤1.1.1、 利用图划分算法METIS, 将图数据划分为K∈{1,2, …,|V|}个社区, 输出具
有分区索引的节点集合{Vp_1,…,Vp_k,…,Vp_K|Vp_k∈V,k=1, …,K}; 其中, |V| 为图数据的节
点个数,
步骤1.1.2、 将节点分区索引作为图拓扑划分任务的伪标签yTP供TGSSL模型进行学习;
其中, 第n个节点的分区索引为k可形式化表达为: yTP_n=k,if vn∈Vp_k,n=1,…,|V|,
步骤1.1.3、 基于伪标签yTP定义图拓扑划分任务损失函数LTP为多分类交叉熵:
其中, N为图拓扑划分的节点总样本数,
是第n个节点 为第k个社区的预测值。
4.根据权利要求3所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述
步骤1.2具体包括:
步骤1.2.1、 在图数据中, 随机mask|Ma|个节点的特 征x; 其中,
步骤1.2.2、 将步骤1.2.1中未做mask操作之前的症状节点特征向量x作为mask节点任
务的伪标签yMN供TGSSL模型进行 学习;
步骤1.2.3、 基于伪标签yMN定义mask节点任务损失函数LMN为平均绝对误差:
其中,
为节点vi经过TGSSL模型所学习到的节点向量表示。
5.根据权利要求4所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述
步骤2具体包括:
输入图数据的节点初始向量矩阵X和归一化邻接矩阵
使用两层的图卷积神经 网络进
行图表示学习, 从而学习到图数据节点的初始向量表示H;
权 利 要 求 书 1/2 页
2
CN 114863234 A
2其中,
为正则化的
为加上自环的邻接矩阵, I为单位矩阵,
是
的度矩阵, W1是第一个卷积的训练参数矩阵。
6.根据权利要求5所述的一种基于拓扑结构保持的图表示学习方法, 其特征在于, 所述
步骤3具体包括:
步骤3.1、 计算TGS SL模型中图拓扑划分任务的损失LTP;
步骤3.2、 计算TGS SL模型中mask节点任务的损失LMN;
步骤3.3、 计算TGS SL模型中下游任务的多分类交叉熵损失Lmain:
其中, I和C分别为节点分类下游任务的总样本数和节点类别数,
是第i个样本为第c
类的预测值。
步骤3.4、 根据总损失L更新网络参数W1直到达到最大迭代次数T, 最终可获得在结构保
持的基础上的高质量节点向量表示Z和训练好的TGS SL模型, 如下:
L= λ1Lmain+λ2LTP+λ3LMN (5)
其中,
分别是下游任务、 图拓扑划分任务和mask节点任务的权 重。
7.一种基于 拓扑结构保持的图表示学习 系统, 其特 征在于, 包括:
自监督任务设计模块, 用于针对图数据的特性, 设计拓扑 结构保持的自监 督任务;
节点初始向量表示学习模块, 用于输入图数据, 使用图卷积神经网络对其进行特征编
码, 从而学习到节点初始向量表示;
节点向量表示获取模块, 用于将学习到的节点初始向量表示输入到TGSSL模型进行图
自监督学习, 最终在结构保持的基础上获得高质量的节点向量表示。权 利 要 求 书 2/2 页
3
CN 114863234 A
3
专利 一种基于拓扑结构保持的图表示学习方法及系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:33:14上传分享