说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210412198.9 (22)申请日 2022.04.19 (71)申请人 西北大学 地址 710069 陕西省西安市太白北路2 29号 (72)发明人 郭凌 张伟名 许鹏飞 朱文娟  柏恒  (74)专利代理 机构 西安恒泰知识产权代理事务 所 61216 专利代理师 李郑建 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于特征累加的图卷积网络半监督节点分 类方法 (57)摘要 本发明公开了一种基于特征累加的图卷积 网络半监督节 点分类方法, 该方法利用图卷积和 K阶邻近性来获得更大的感受野, 以获取更高层 次邻域的节 点特征, 而后将不同邻域获得的节点 信息进行融合, 保全节点特征信息, 具体包括: 提 出一个由不同层次图卷积网络组成的模型, 每个 层次提供不同的传播效率, 第K个层次包含图上 随机游走的第K步的节点特征信息; 根据概率转 移矩阵定义高次邻接矩阵, 作为不同阶层的邻接 矩阵来聚合不同邻域的节点特征信息, 将不同步 长的节点分别进行卷积操作, 得到卷积后新的输 出表示; 将不同邻域范围的节 点卷积后得到的新 的特征表 示利用融合函数进行混合, 得到混合邻 域的特征表示, 利用分类器进行分类, 得到最终 的输出。 权利要求书1页 说明书8页 附图3页 CN 114842247 A 2022.08.02 CN 114842247 A 1.一种基于特征累加的图卷积网络半监督节点分类方法, 其特征在于, 该方法利用图 卷积和K阶邻近性来获得更大的感受野, 以获取更高层次邻域的节 点特征, 而后 将不同邻域 获得的节点信息进行融合, 保全节点特 征信息, 具体包括下列步骤: S1: 构建多层次图卷积层: 每个层次表示不同步长邻域的节点信 息的聚合, 对不同步长的邻域节点的路径进行了 重新定义, 根据概率转移矩阵定义了高次邻接矩阵, 作为不同层次的传播路径来聚合邻域 节点信息; S2: 利用多层次图卷积层构建特 征累加的图卷积网络模型: 输入为图的结构信息和特征信息, 网络层包括不同层次的卷积层和隐藏层, 输出为各 个节点的预测标签; S3: 训练特 征累加的图卷积网络模型: 输入带有标签的节点的图数据, 在模型中进行特征传播, 使得图中每个节点的特征随 机地与其不同邻域的节点特征聚合在一起, 根据输出节点表示与损失函数进行多次迭代, 直到模型收敛; S4: 将待分类的原始图数据输入经过训练的特征累加图卷积网络模型中进行分类, 进 过最后一层的输出得到对应的最 终节点表示; 基于最 终节点表示进行分类得到各个节点的 预测标签, 将各个节点的预测标签作为对应的半监 督节点分类结果。权 利 要 求 书 1/1 页 2 CN 114842247 A 2基于特征累加的图卷积网 络半监督节点分类方 法 技术领域 [0001]本发明属于网络技术领域, 涉及半监督节点分类, 特别涉及一种基于特征累加的 图卷积网络半监 督节点分类方法。 背景技术 [0002]互联网的发展开启了大数据时代, 产生了巨量的图结构数据。 图数据结构复杂, 不 仅携带自身的属 性信息, 还有彼此相互作用的连接信息。 图数据具有很强的表示复杂结构 的能力, 能够 有效表达数据实体和它们之间潜在的空间关系。 近年来, 对图这种结构型数据 的研究极大地促进了它们在不同任务领域的应用, 包括社交网络、 量子化学、 交通预测等。 例如在生物学上蛋白质之间的相互作用, 通过将药物和蛋白质靶点相互作用建模为图结 构, 可以用来预测多种 药物的副作用, 在药物发现中有着重要的应用; 在交通预测中, 通过 空间相关性建模的图结构可以预测交通流量情况, 对 改善交通压力提供了技术支持。 图的 应用越来越广泛, 使得 人们迫切需要寻找更高效更准确的方式进行 数据处理。 [0003]图卷积网络(Graph  Convolutional  Network, GCN)的出现填补了图数据在处理方 面的空白, 随着技术的不断进步, 出现了各种各样的图卷积网络变体, 在处理图结构数据方 面展现出了越来越好的性能。 虽然图卷积网络在构建图结构数据方面表现出了良好的性 能, 但是由于每一层都有固定的感受野, 图卷积网络无法获得能够提高性能的多层次邻域 节点特性。 在现有的一些研究当中, 在聚合邻域节点信息的时候往往只考虑了二阶或三阶 的邻域, 对于高阶邻域来说, 往往无法有效提取。 因为大多 数现有的基于谱域的图卷积网络 通过叠加多个图卷积层来增强其特征提取能力, 但是当模型变深时, 它通常会导致特征稀 释以及过度拟合问题。 目前现有的图卷积网络模型中, 例如GCN, 它首次提出了解决图数据 的模型, 经过多种近似之后, GCN变成了一个一阶或二阶模型, 若要处理K 阶邻居, 可以采用 多层卷积来 实现, 但是这又产生了另外一个问题: 随着K的增加, 网络会变得非常 复杂, 参数 过多; 另外它利用了切比雪夫多项式近似, 层数过多会导致特征过度 平滑。 这样就无法获取 到高阶邻域的节点信息, 导致节点的信息难以保全。 对于注 意力机制来说, 它采用的是逐节 点的计算方式, 计算邻域不同节点的注意力系 数, 这样的计算方式可以很好地保全节点的 信息, 但是其特殊的计算方式导 致算法复杂度过高, 计算时间长, 内存占用大。 [0004]因此, 需要寻求一种方式, 来保全节点信息的同时还能够兼顾算法效率。 Xu等人发 表的一篇名为 《Representation  Learning  on Graphs with Jumping Knowledge   Networks》 的论文中, 曾解释过图卷积 网络中节点特征的传播方式, 节点i的信息以类似的 随机游走的方式传播到节点j, 这意味着路径是特征传输的方式, 感受野的大小由图中路径 的长度决定。 在图结构中, 长路径只存在于几个点之间, 这有利于获取全局特征, 并且无向 图中的感受野(路径)相对比较平衡。 受图像分类初始网络的启发, 一些模型拓展了它们的 层次以获得更大 的感受野并提高学习能力, 但是它们在每层中都使用固定的邻接矩阵, 这 增加了捕获不同层次节点特 征的难度。说 明 书 1/8 页 3 CN 114842247 A 3

.PDF文档 专利 基于特征累加的图卷积网络半监督节点分类方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于特征累加的图卷积网络半监督节点分类方法 第 1 页 专利 基于特征累加的图卷积网络半监督节点分类方法 第 2 页 专利 基于特征累加的图卷积网络半监督节点分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:38:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。