图变换器的再思考:谱注意力网络

 人工智能咨询培训老师叶梓 转载标明出处

图神经网络(GNNs)的传统策略是通过稀疏的消息传递过程直接编码图结构。然而,这种方法存在固有的局限性,例如过度平滑和过度压缩问题,这些限制了模型的性能和表达能力。为了克服这些限制,麦吉尔大学、米拉蒙特利尔研究所、渥太华大学等研究者们提出了一种基于谱图理论的新型可学习位置编码方法,即谱注意力网络(SAN),该模型巧妙地利用图的谱特性,通过学习位置编码(Learned Positional Encoding,简称LPE)来表征图中的节点,从而解决了传统图神经网络在表达能力上的一些限制。

表1 比较了不同的图变换器模型(GAT, GT sparse, GT full, SAN)的属性,展示了每个模型是否保留了局部结构、是否使用边特征、是否连接非邻近节点等特性。 

模型架构

图1展示了谱注意力网络(SAN)模型,该模型通过节点学习位置编码(LPE)将变换器(Transformers)泛化到图结构数据上。这个模型结合了变换器架构的强大能力和图数据结构的特性,以处理图表示学习中的问题。

  1. 输入图:模型的输入是一个图,包括节点特征和邻接矩阵。

  2. 预处理步骤:

    • 计算拉普拉斯矩阵的特征向量:首先计算图的拉普拉斯矩阵的特征向量和特征值。这些特征向量和特征值用于后续的位置编码。
    • 生成节点位置编码(LPE):使用特征向量和特征值为每个节点生成初始的位置编码。
  3. 主变换器步骤:

    • 全连接图:为了使模型能够捕捉长距离依赖,通过添加所有不直接连接的节点对之间的边,将输入图转换为全连接图。
    • 特征融合:将节点特征和从LPE得到的位置编码进行融合。
    • 应用变换器:使用变换器架构处理融合后的特征,通过自注意力机制学习节点间的复杂关系。
  4. 输出:

    • 预测层:根据任务需求(如节点分类、图分类等),将变换器的输出送入预测层,生成最终的预测结果。

SAN模型的架构设计主要围绕如何有效地利用图的谱信息。该模型通过将图的拉普拉斯特征映射到固定大小的LPE,使得网络能够利用每个图的整个拉普拉斯谱。这一过程分为两个步骤:

  1. 节点的LPE Transformer:首先,模型对每个节点应用Transformer,处理与该节点相关的拉普拉斯特征,生成每个图的LPE矩阵。
  2. 图Transformer:然后,将LPE与节点嵌入拼接,传递给图Transformer进行处理。如果任务涉及图分类或回归,最终的节点嵌入会被传递到一个最终的池化层。

在节点的LPE Transformer部分,模型首先为每个节点创建一个大小为2×m的嵌入矩阵,通过将m个最低的拉普拉斯特征值及其对应的特征向量进行拼接。这里的m是一个超参数,表示计算的最大特征向量数量。如果m大于图中的节点数N,模型会添加掩码填充。

在 图 4 中,展示了LPE架构。模型通过考虑m个特征值和特征向量,意识到了图的拉普拉斯谱。每个节点可以被视为一批中的一个元素,从而并行化计算。这里的$\phi_{i,j}$是与第i个最低特征值$\lambda_i$配对的特征向量的第j个元素。

边的LPE Transformer是另一种拉普拉斯编码的形式,它解决了节点特征中特征向量符号任意性的问题。与将绝对位置编码为节点特征不同,这种方法考虑将相对位置编码为边特征。通过计算两个节点之间的差的绝对值和乘积,可以获得与符号不变的操作符,这表明单个节点上的$\phi_{i,j1}$的符号并不重要,而节点j1和j2之间的相对符号才是重要的。

主要的图Transformer基于先前的工作,通过考虑图结构和通过边特征嵌入改进注意力估计,将原始的Transformer应用于图。模型采用了多头注意力机制,通过所有节点进行计算。

尽管SAN模型在理论上具有强大的表达能力,但它也存在一些局限性。首先,节点级别的LPE缺乏符号不变性,随机翻转特征向量的符号可能会产生不同的LPE输出。LPE的计算复杂度为O(m^2N),当考虑所有特征函数时,复杂度为O(N^3)。这限制了模型在GPU上的内存使用。

由于完全连接性,SAN模型不受其卷积/消息传递对应物在表达能力上的相同限制。模型使用完整的特征函数集,并且给定足够的参数,可以区分任何一对非同构图,并且在这方面比任何WL测试都更强大。然而,这并没有解决多项式时间内的图同构问题;它只是近似一个解决方案,所需的参数数量是未知的,可能不是多项式的。

由于全连接网络,模型不存在过度压缩问题,因为远距离节点之间存在直接路径。SAN模型使用拉普拉斯谱更有效地学习节点之间的物理交互,这与需要深层网络来捕获长距离交互的卷积方法形成对比。

SAN模型通过创新的谱注意力机制,为图神经网络的发展提供了新的方向,尤其是在处理具有复杂拓扑结构的图数据时。

想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具(限时免费)。

1小时实战课程,您将学习到如何轻松上手并有效利用 Llama Factory 来微调您的模型,以发挥其最大潜力。

CSDN教学平台录播地址:https://edu.csdn.net/course/detail/39987 

实验

谱注意力网络(SAN)在多个标准图数据集上进行了测试,包括ZINC、PATTERN、CLUSTER、MolHIV和MolPCBA。这些数据集被用于验证SAN模型在处理图数据时的有效性和性能。

首先进行了消融研究以评估全注意力和节点学习位置编码(LPE)的效果。通过调整平衡稀疏和全注意力的γ参数,研究了模型在不同数据集上的性能变化。图 5 展示了γ参数对使用节点LPE的模型性能的影响。结果表明,对于分子数据集ZINC和MolHIV,全注意力的好处有限,而对于更大的SBM数据集(PATTERN和CLUSTER),更高的γ值有助于提升性能。

在 图 6 中,展示了在稀疏和全图架构中节点LPE影响的消融研究。研究发现,对于分子任务(ZINC和MolHIV),节点级别的LPE显著提升了模型性能,这可以归因于其在检测子结构方面的能力。而对于PATTERN和CLUSTER数据集,由于任务本身较为简单,LPE的提升作用相对较小。

与当前最先进(SOTA)模型的比较中,SAN模型在所有合成数据集上的表现均优于其他模型,这突出了SAN模型的强大表达能力。在MolHIV数据集上,尽管测试集上的性能略低于SOTA,但在验证集上的性能却优于PNA和DGN模型。这一现象可能与该数据集的一个众所周知的问题有关:验证集和测试集的指标相关性较低。

图 7 展示了SAN模型与多种现有模型在不同数据集上的性能比较。这些模型包括GCN、GraphSage、GatedGCN、GIN、PNA、DGN、GAT以及GT模型。结果显示,SAN在大多数数据集上都实现了最佳的性能,尤其是在全图任务中,SAN是第一个表现出色的全连接模型。

实验证明了SAN模型在处理图数据时的有效性和优越性,为图神经网络的发展提供了新的方向,并为未来的研究和应用奠定了基础。

https://arxiv.org/pdf/2106.03893v3

GitHub - DevinKreuzer/SAN

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/938788.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

构建全面的生产监控体系:从基础设施到业务服务

在现代 IT 系统中,监控体系是确保高可用性、高性能和稳定性的核心工具。一个完善的监控体系能够及时发现系统问题、分析问题根源并快速采取应对措施,避免故障进一步扩散。本文将从基础设施层、中间件层、容器与编排层、应用与服务层逐步展开,…

Rk3588 FFmpeg 拉流 RTSP, 硬解码转RGB

RK3588 ,基于FFmpeg, 拉取RTSP,使用 h264_rkmpp 实现硬解码. ⚡️ 传送 ➡️ RK3588, FFmpeg 拉流 RTSP, mpp 硬解码转RGBRk3588 FFmpeg 拉流 RTSP, 硬解码转RGBUbuntu x64 架构, 交叉编译aarch64 FFmpeg mppRK3588 , mpp硬编码rgb, 保存MP4视频文件.</

进程通信方式---共享映射区(无血缘关系用的)

5.共享映射区&#xff08;无血缘关系用的&#xff09; 文章目录 5.共享映射区&#xff08;无血缘关系用的&#xff09;1.概述2.mmap&&munmap函数3.mmap注意事项4.mmap实现进程通信父子进程练习 无血缘关系 5.mmap匿名映射区 1.概述 原理&#xff1a;共享映射区是将文件…

【Redis篇】Set和Zset 有序集合基本使用

目录 Set 基本命令 sadd SMEMBERS SISMEMBER SCARD 返回值&#xff1a; SPOP SMOVE SREM 集合间操作 交集&#xff1a; 并集&#xff1a; 差集&#xff1a; ​编辑 内部编码 使用场景&#xff1a; Zset 有序集合 Zset基本命令 ZADD ZCARD ZCOUNT ZRANGE …

SAP自定义权限对象

一、创建域和数据元素 SE11 二、创建权限字段 SU20 关联数据元素ZAPP 三、创建权限对象 SU21 关联权限字段ZAPP 四、新建程序&#xff0c;加入权限对象 SE38 在程序中增加以下块 AUTHORITY-CHECK OBJECT Z_BC_APP ID ZAPP FIELD 01. IF sy-subrc EQ 0. ENDIF. 五、…

linux0.11源码分析第二弹——setup.s内容

&#x1f680; 前言 继上篇博客分享了boot文件的内容后&#xff0c;本篇博客进而来到第二个文件&#xff1a; setup.s &#xff0c;对应了《linux源码趣读》的第5~8回。这部分的功能主要就是做了 三件事 &#xff0c;第一件事是做代码搬运和临时变量存放&#xff0c;第二件事是…

Halcon中histo_2dim(Operator)算子原理及应用详解

在Halcon中&#xff0c;histo_2dim算子是一个用于计算双通道灰度值图像的直方图的工具。以下是对该算子的原理及应用的详细解释&#xff1a; 一、原理 histo_2dim算子的函数原型为&#xff1a;histo_2dim(Regions, ImageCol, ImageRow : Histo2Dim : : )。 输入参数&#xff…

(vue)el-table在表头添加筛选功能

(vue)el-table在表头添加筛选功能 筛选前&#xff1a; 选择条件&#xff1a; 筛选后&#xff1a; 返回数据格式: 代码: <el-tableref"filterTable":data"projectData.list"height"540":header-cell-style"{border-bottom: 1px soli…

使用 Marp 将 Markdown 导出为 PPT 后不可编辑的原因说明及解决方案

Marp 是一个流行的 Markdown 演示文稿工具&#xff0c;能够将 Markdown 文件转换为 PPTX 格式。然而&#xff0c;用户在使用 Marp 导出 PPT 时&#xff0c;可能会遇到以下问题&#xff1a; 导出 PPT 不可直接编辑的原因 根据 Marp GitHub 讨论&#xff0c;Marp 导出的 PPTX 文…

UE5安装Fab插件

今天才知道原来Fab也有类似Quixel Bridge的插件&#xff0c;于是立马就安装上了&#xff0c;这里分享一下安装方法 在Epic客户端 - 库 - Fab Library 搜索 Fab 即可安装Fab插件 然后重启引擎&#xff0c;在插件面板勾选即可 然后在窗口这就有了 引擎左下角也会多出一个Fab图标…

Gin- Cookie\Session相关

Cookie&#xff0c;Session是什么&#xff1f; Cookie直译小饼干&#xff0c;是一些数据信息&#xff0c;类似于小型文本文件&#xff0c;存储在浏览器上。Cookie是进行第一次登录之后&#xff0c;由服务器创建后返回给浏览器的。之后&#xff0c;每当浏览器再次向同一服务器发…

使用Python打造高效的PDF文件管理应用(合并以及分割)

在日常工作和学习中&#xff0c;我们经常需要处理大量PDF文件。手动合并、分割PDF不仅耗时&#xff0c;还容易出错。今天&#xff0c;我们将使用Python的wxPython和PyMuPDF库&#xff0c;开发一个强大且易用的PDF文件管理工具。 C:\pythoncode\new\mergeAndsplitPdf.py 所有代…

深度学习中自适应学习率调度器

传统观点认为&#xff0c;太大的学习率不利于优化深度神经网络&#xff0c;而相比固定的学习率而言&#xff0c;变化的学习率更能提供快速的收敛。基于此&#xff0c;本文作者基于理论基础提出了一个计算深度神经网络学习率的新方法。实验结果证明了该方法的有效性。 训练神经…

文献研读|基于像素语义层面图像重建的AI生成图像检测

前言&#xff1a;本篇文章主要对基于重建的AI生成图像检测的四篇相关工作进行介绍&#xff0c;分别为基于像素层面重建的检测方法 DIRE 和 Aeroblade&#xff0c;以及基于语义层面重建的检测方法 SimGIR 和 Zerofake&#xff1b;并对相应方法进行比较。 相关文章&#xff1a;论…

ElasticSearch06-分片节点分配

零、文章目录 ElasticSearch06-分片节点分配 1、单节点多分片多副本 &#xff08;1&#xff09;启动一个空节点 节点的配置如下 cluster.name: mycluster node.name: node-01 node.master: true node.data: true network.host: 127.0.0.1 http.port: 9201 transport.tcp.p…

信息学奥赛一本通 1438:灯泡 | 洛谷 P5931 [清华集训2015] 灯泡

【题目链接】 ybt 1438&#xff1a;灯泡 洛谷 P5931 [清华集训2015] 灯泡 【题目考点】 1. 三分 求函数极值 2. 相似三角形 3. 对钩函数 【解题思路】 首先考虑影子还没有到达对面墙壁的情况 记BM长度为x&#xff0c;影子为AM&#xff0c;长度为L。三角形ABC相似于三角…

揭开 Choerodon UI 拖拽功能的神秘面纱

01 引言 系统的交互方式主要由点击、选择等组成。为了提升 HZERO 系统的用户体验、减少部分操作步骤&#xff0c;组件库集成了卓越的拖拽功能&#xff0c;让用户可以更高效流畅的操作系统。 例如&#xff1a;表格支持多行拖拽排序、跨表数据调整、个性化调整列顺序&#xff1…

【物联网技术与应用】实验4:继电器实验

实验4 继电器实验 【实验介绍】 继电器是一种用于响应施加的输入信号而在两个或多个点或设备之间提供连接的设备。换句话说&#xff0c;继电器提供了控制器和设备之间的隔离&#xff0c;因为设备可以在AC和DC上工作。但是&#xff0c;他们从微控制器接收信号&#xff0c;因此…

fpga系列 HDL:Quartus II 时序约束 静态时序分析 (STA) test.out.sdc的文件结构

test.out.sdc的文件结构 ## Generated SDC file "test.out.sdc"## Copyright (C) 1991-2013 Altera Corporation ## Your use of Altera Corporations design tools, logic functions ## and other software and tools, and its AMPP partner logic ## functions,…

Windows安全中心(病毒和威胁防护)的注册

文章目录 Windows安全中心&#xff08;病毒和威胁防护&#xff09;的注册1. 简介2. WSC注册初探3. WSC注册原理分析4. 关于AMPPL5. 参考 Windows安全中心&#xff08;病毒和威胁防护&#xff09;的注册 本文我们来分析一下Windows安全中心&#xff08;Windows Security Center…