ICLR25初审稿按照自己喜好整理自己需要的(逐渐更新)
光谱GNN合集(10.29初筛)
数据集
大类 | 数据集名称 |
---|---|
pyg | cora ,citeseer ,pubmed,cornell,texas,wisconsin',flickr,reddit,actor,photo,computers,cs physics |
yandex | chameleon_filtered, squirrel_filtered, roman_empire, amazon_ratings, minesweeper, tolokers, questions |
linkx | 'arxiv-year', 'genius', 'pokec', 'snap-patents', 'twitch-gamer', 'wiki', 'penn94', 'amherst41', 'cornell5', 'johns_hopkins55', 'reed98 |
OGB | 'ogbn-products', 'ogbn-arxiv', 'ogbn-mag', 'ogbn-papers100M' |
给分标准:基本上用pyg大部分数据集我心中就给两分了。如果用上yandex就更加分。估计只会稍微读二颗星中感兴趣的文章
方法名 | 面向方法 | 使用数据集 | 精读指数)(me) |
---|---|---|---|
SSGNN | 图节点分类 | pyg,yandex,部分linkx | ⭐⭐ |
S2GNN | 时间光谱GNN | 时间数据集 | ⭐(时序图感觉数据集太少了) |
SPECRAGE | 图像分类? | InfiniteMNIST,handwritten等 | ⭐ |
SPECTRAL GRAPH COARSENING USING INNER PRODUCT PRESERVATION AND THE GRASSMANN MANIFOLD | 图节点分类 | pyg中部分同配图 | ⭐ |
RETHINKINGDEGREE-CORRECTEDSPECTRALCLUS TERING:APURESPECTRALANALYSIS&EXTENSION | 图节点聚类 | Airport Wiki BlogCatalog ogbn-Protein等 | ⭐(一星与二星之间)(主要是主流数据集没有用) |
JDR | 图节点分类 | pyg大部分数据集 | ⭐⭐ |
SPECTRALHIGHWAYS: INJECTINGHOMOPHILYINTO HETEROPHILICGRAPHS | 图节点分类 | pyg大部分数据集和ChamF,SquiF | ⭐⭐ |
G-SPARC | 图节点分类,冷启动 | Cora Citeseer Pubmed Reddit | ⭐(用的数据集也太少了,虽然reddit也算大图了) |
ARE SPECTRAL AUGMENTATIONS NECESSARY IN CONTRAST-BASEDGRAPHSELF-SUPERVISEDLEARN ING? | 探讨谱增强 | pyg同配数据集和图分类数据集 | ⭐⭐ |
SSGNN: Simple Yet Effective Spectral Graph Neural Network
这篇论文介绍了一种名为 SSGNN(Simple Yet Effective Spectral Graph Neural Network)的新型图神经网络,它是一种基于谱的图神经网络,旨在通过利用图的谱特性来改善图表示。SSGNN 通过简化的集合到集合的方法来适应性地过滤关键的谱特征,并且引入了一个新颖的、无需参数的相对高斯放大器(ReGA)模块,以适应性地学习谱过滤,同时保持对结构扰动的鲁棒性。
主要贡献包括:
- 提出了一个简单的架构,包括谱编码和解码器,以及一个无需参数的 ReGA 模块,用于动态谱过滤。
- 提供了理论和实证分析,证明了 SSGNN 对结构变化的鲁棒性。
- 在合成数据集上的实验表明,SSGNN 能够学习复杂的过滤器,并与其他谱 GNN 和图变换器相比提供了更准确的谱过滤器近似。
- 在 20 个真实世界的图数据集上进行的广泛实验表明,SSGNN 在节点和图分类任务上达到了与最新技术水平(SOTA)相当的性能,同时显著减少了参数数量和计算复杂度。
SSGNN 在同质图和异质图数据集上表现出色,与现有的 SOTA 图变换器和谱 GNN 相比,在参数和 GFLOPs 上有显著减少。例如,在 WikiCS 数据集上,SSGNN 的性能与当前的 SOTA 图变换器模型 Polynormer 相当,但参数平均减少了 55 倍,GFLOPs 减少了 100 倍。
论文还详细讨论了 SSGNN 的方法论,包括谱编码器、解码器、ReGA 模块和图卷积的定义,并对计算复杂度进行了分析。此外,还包括了在合成数据集上的学习谱过滤器实验,以及在各种真实世界数据集上的节点分类、图分类和回归任务的实验结果。最后,论文探讨了超参数 b 和 ϵ 对学习过滤器的影响,并提供了一些关于 SSGNN 学习到的过滤器及其对图傅里叶变换(GFT)和卷积结果影响的可视化。
总体而言,SSGNN 以其高效的谱图神经网络设计,展示了在各种图学习任务中的潜力和有效性。
UNIFYING LONG AND SHORT SPATIO-TEMPORAL FORECASTINGWITHSPECTRALGRAPHNEURALNET WORKS
这篇文章是关于一种新型的图神经网络(S2GNN,即Spectral Spatio-Temporal Graph Neural Network)的研究,它旨在统一短期和长期的时空预测任务。文章的主要贡献和结论如下:
-
研究背景:多变量时间序列(MTS)预测在许多实际应用中非常重要。当前的研究主要分为两个领域:空间-时间预测(STF)和长期时间序列预测(LTSF)。STF专注于捕捉空间和时间依赖性,而LTSF则侧重于学习长期序列中的模式,如季节性或趋势。现有的方法和基准在这两个任务中差异显著。
-
S2GNN模型:文章提出了S2GNN模型,它利用谱图神经网络(spectral GNNs)进行全局特征提取,并通过自适应图结构处理不同长度的序列。S2GNN还采用了解耦框架来提高可扩展性,并引入了尺度自适应节点嵌入和交叉相关嵌入,以更好地区分相似的时间模式。
-
实验结果:在八个公共数据集上的广泛实验表明,S2GNN在多样化的预测任务中一致性地超越了现有的最先进模型。
-
主要贡献:
- 提出了S2GNN,该模型能够自适应地捕捉和处理短序列和长序列特征,增强了模型的表达能力和通用性。
- 引入了尺度自适应节点嵌入方法,利用稀疏性适应不同的节点规模,并引入了交叉相关嵌入方法,自适应地从输入序列中区分特征。
- 实验结果显示,在使用自适应图的可学习滤波器时,必须同时考虑低通和高通信息。同时,S2GNN模型在训练效率和性能之间取得了平衡。
-
方法论:文章详细描述了S2GNN的架构和预测模块,包括如何从输入序列中提取可区分特征,如何在自适应图上传播这些特征,并学习适合自适应图的滤波器。
-
实验设置:实验使用了五个交通流量数据集和三个长期时间序列预测任务的基准数据集。与多个现有的时空模型和长期时间序列预测模型进行了比较。
-
效率研究:S2GNN在不同任务中的参数数量和每次训练所需的浮点运算次数(FLOPs)方面表现出稳定的性能,有效地平衡了预测准确性和训练效率。
-
可视化:文章还提供了S2GNN在某些数据集上的预测结果的可视化,以及与现有模型的比较,从而识别了现有模型在特定场景中失败的一些原因。
总的来说,这篇文章提出了一个创新的模型S2GNN,它能够处理短序列和长序列的时空预测任务,并且在多个公共数据集上取得了优异的性能。
SPECRAGE:ROBUSTANDGENERALIZABLEMULTI VIEWSPECTRALREPRESENTATIONLEARNING
这篇论文介绍了一个名为SpecRaGE的新型多视图谱表示学习框架,它结合了图拉普拉斯方法和深度学习技术。SpecRaGE通过学习一个参数化映射来近似多视图图拉普拉斯的联合对角化,解决了泛化性和可扩展性问题,使其能够处理大型数据集并对新样本进行泛化。此外,SpecRaGE还采用了动态融合技术,提高了对受污染多视图数据中的异常值和噪声的鲁棒性。通过广泛的实验,验证了SpecRaGE在标准多视图基准测试中的性能,并在处理异常值和不完整视图时显著优于现有方法。
主要贡献包括:
- 提出了一个可泛化和可扩展的基于图拉普拉斯的多视图表示学习框架,将谱方法扩展到大规模多视图数据。
- 提出了一个元学习融合模块,动态加权不同视图,提供对数据污染的鲁棒性能。
- 提供了广泛的实验结果,证明了SpecRaGE在各种基准测试中的优越性能,特别是在涉及异常值和噪声视图的场景中。
论文还详细讨论了相关工作,包括基于图拉普拉斯的方法和基于深度学习的方法。在预备知识部分,介绍了图拉普拉斯和SpectralNet的概念,以及联合对角化的定义和近似联合对角化拉普拉斯的问题。SpecRaGE框架的动机是避免视图之间的对齐需求,并通过动态调整视图权重来增强鲁棒性。该框架有效地近似了多视图图拉普拉斯的主要联合特征向量,并且可以扩展到大型数据集。此外,SpecRaGE还包含了一个灵活的融合技术,克服了传统对齐方法在处理受污染多视图数据时的局限性。
在实验部分,作者使用了五个多视图数据集来评估SpecRaGE的性能,并与其他七种多视图表示学习方法进行了比较。评估指标包括聚类和分类任务中的标准化互信息(NMI)、准确度(ACC)和调整兰德指数(ARI)。实验结果表明,SpecRaGE在大多数数据集和评估指标上都取得了最佳性能。
最后,论文还讨论了SpecRaGE的鲁棒性,通过设计实验来评估其对异常值和高斯噪声的鲁棒性。结果表明,SpecRaGE在各种污染水平下都能保持稳定的性能,并且在处理极端污染时显著优于其他方法。
论文的结论部分强调了SpecRaGE在实际应用中的潜力,尤其是在数据质量常常受损的情况下。作者还提供了可复现性的声明,并详细描述了SpecRaGE的逻辑和关键细节,包括训练方法、网络架构、超参数和硬件规格。
SPECTRAL GRAPH COARSENING USING INNER PRODUCT PRESERVATION AND THE GRASSMANN MANIFOLD
这篇论文提出了一种新的图粗化方法,该方法专注于在粗化过程中保持图信号之间的内积。现有的图粗化方法往往忽视了节点特征之间的相互关系,主要关注图结构。本文将节点特征视为定义在图上的函数,并在粗化过程中保持它们的内积,以确保粗化图保留了结构和特征关系,这对于下游任务非常有益。作者提出了内积误差(Inner Product Error, IPE)来量化节点特征之间内积的保持程度,并利用Grassmann流形的几何特性,构建了一个优化目标来最小化IPE,即使是对于未见过的平滑函数也是如此。实验结果表明,最小化IPE也能改善其他标准的粗化指标。
主要贡献包括:
- 提出了一种新的图粗化方法,从函子的角度出发,保持图上不同函数之间的关系。
- 引入了内积误差(IPE)作为新的粗化指标,衡量在粗化过程中图信号之间内积的保持程度。
- 利用Grassmann流形的特性,将IPE最小化问题扩展到满足平滑性假设的未观测节点特征。
- 通过梯度下降法计算粗化算子,并理论上证明了最小化IPE可以改善常见的图粗化指标。
论文还提供了视觉示例和实验结果,展示了该方法在聚类能力和图粗化基准测试中的有效性,并在多个图粗化和节点分类基准测试中证明了其优越性能。此外,论文还讨论了未来的工作方向,包括将粗化方法应用于图池化(graph pooling)并评估其对GNN性能的影响。最后,论文强调了研究的伦理性和可复现性,并提供了详细的算法步骤、评估程序和超参数设置。
RETHINKINGDEGREE-CORRECTEDSPECTRALCLUS TERING:APURESPECTRALANALYSIS&EXTENSION
这篇文章是关于图聚类技术的研究,特别是针对度校正谱聚类(Degree-Corrected Spectral Clustering, DCSC)的重新思考。文章首先介绍了谱聚类作为一种具有强解释性和理论保证的代表性图聚类技术。最近,DCSC作为这项技术的最先进形式出现了。尽管先前的研究为DCSC提供了一些理论结果,但这些分析依赖于一些随机图模型(例如,随机块模型)。在本研究中,作者从纯谱的角度探索了DCSC的替代分析方法,不使用随机图模型。这种方法为误分类体积与最优解之间的关系提供了严格的界限,同时涉及表明DCSC处理高度数异质性和弱聚类结构能力的数量。
文章受到图神经网络(Graph Neural Networks, GNNs)的最新进展和相关的过平滑问题的启发,提出了一种名为ASCENT(Adaptive Spectral ClustEring with Nodewise correcTion)的简单但有效的DCSC扩展。与大多数DCSC方法对所有节点使用恒定的度校正不同,ASCENT遵循节点-wise校正方案,通过GNNs的均值聚合为节点分配不同的校正。文章进一步证明,ASCENT在遇到均值聚合的过平滑问题时会简化为传统的DCSC方法,而在过平滑之前的某些早期阶段可能会获得更好的聚类质量。
文章还提供了对DCSC的纯谱分析的理论结果,包括与聚类成本和最优解相关的界限。通过在多个数据集上的实验,作者验证了ASCENT在处理高度数异质性和弱聚类结构方面比其他基线方法更有效。文章最后讨论了未来的研究方向,包括将ASCENT扩展到具有可学习节点校正的更高级设置,并结合GNNs的最新进展提供理论分析,以及分析DCSC在属性图上的性能,同时考虑图拓扑和属性之间可能的不一致性。
JOINTGRAPHREWIRINGANDFEATUREDENOISING VIASPECTRALRESONANCE
这篇论文标题为《JOINT GRAPH REWIRING AND FEATURE DENOISING VIA SPECTRAL RESONANCE》,作者提出了一种名为联合去噪和重连(JDR)的算法,用于改善图神经网络(GNNs)在节点分类任务中的性能。该算法通过联合重连图结构和去噪节点特征来提高性能,其核心思想是提高图和特征矩阵的主要特征空间之间的对齐度。这种方法在理论上和实验上都得到了验证,实验结果表明,JDR在合成数据和真实世界图数据集上都优于现有的重连方法。
以下是论文的主要内容概述:
-
引言:介绍了图神经网络(GNNs)在处理图结构数据时的应用,并指出了图数据和节点特征中存在的噪声问题。提出了联合重连和去噪(JDR)算法,旨在通过改善图结构和特征的对齐度来提升GNNs的性能。
-
相关工作:讨论了图重连和特征去噪的相关研究,包括预处理方法和端到端方法,以及它们在优化图结构以提高GNNs性能方面的局限性。
-
联合去噪和重连(JDR)算法:
- 预备知识:介绍了图和特征谱的基本概念,包括图拉普拉斯矩阵、特征分解和奇异值分解(SVD)。
- 动机:通过上下文随机块模型(cSBM)解释了图重连和特征去噪的动机。
- 算法:详细介绍了JDR算法的步骤,包括分解、插值和图合成,以及如何迭代这些步骤以提高图和特征的对齐度。
-
实验:
- 在合成数据(cSBM)和真实世界数据集上评估了JDR算法。
- 使用不同的图神经网络(GCN和GPRGNN)作为下游模型,并与现有的重连方法(DIGL、FoSR和BORF)进行了比较。
- 实验结果表明,JDR在多种设置下都能提高GNNs的性能。
-
结论和局限性:总结了JDR算法的主要贡献,并讨论了其局限性,包括JDR仅适用于节点分类任务,以及如何将cSBM思想扩展到图级问题。
-
附录:提供了JDR算法的伪代码、关于对齐度的讨论、计算复杂度分析、cSBM的讨论、主要命题的证明、数据集描述、额外实验结果和超参数设置。
整体而言,这篇论文提出了一种新的图预处理方法,通过联合优化图结构和节点特征来提高GNNs在节点分类任务中的性能,并通过理论分析和广泛的实验验证了其有效性。
SPECTRALHIGHWAYS: INJECTINGHOMOPHILYINTO HETEROPHILICGRAPHS
这篇论文标题为《SPECTRAL HIGHWAYS: INJECTING HOMOPHILY INTO HETEROPHILIC GRAPHS》,将在2025年的ICLR会议上进行评审。论文的主要贡献在于提出了一种名为“Spectral Highways”的数据工程技术,旨在增强图神经网络(GNN)在异质图(heterophilic graphs)上的性能。异质图是指图中边连接的节点倾向于属于不同的类别,与此相对的是同质图(homophilic graphs),其中节点更倾向于与相同类别的节点相连。
主要贡献:
- 提出了Spectral Highways技术,通过在异质图中添加超节点(supernodes)来创建连接谱聚类(spectral clusters)的高速公路网络,从而减少同类节点间的平均最短路径长度,提高GNN性能。
- 通过实验,将Spectral Highways的性能与同质性和异质性数据集的同质性水平联系起来。
- 发现多种近期提出的GNN对数据分割的随机种子非常敏感,强调了这一常被忽视的因素在GNN评估中的重要性。
- 首次将GNN性能与图中同类和异类节点间的平均最短路径长度联系起来。
- 直观讨论并实证展示了图的同质性水平变化与同类和异类平均最短路径长度相对下降之间的一般相关性。
方法论:
- Spectral Highways基于谱聚类对图进行分割,创建一个包含额外节点和连接的网络层,这些连接形成了高速公路,促进了图的不同区域之间的信息交换。
- 通过PageRank或DivRank算法确定节点的重要性,并根据百分比连接参数(pcon)和最小连接数参数(mincon)将谱节点(spectral nodes)连接到原始图中的节点。
实验:
- 在七个异质数据集上使用多种GNN架构进行了广泛的实验,并与数据中心技术进行了比较,展示了在节点分类性能上的显著提升。
结论:
- Spectral Highways通过注入同质性来增强异质图上GNN的性能,为理解和丰富数据提供了新的视角,而不仅仅是设计专门的算法。
限制和未来方向:
- 论文指出,计算平均最短路径长度(ASPL)是一个昂贵的操作,限制了对大型图的分析。
- 未来的工作可能包括联合模型同类ASPL和异类ASPL与同质性,以评估GNN在拟合图时的难度,而无需任何增强。
这篇论文为异质图上的GNN性能提供了新的视角,并提出了一种有效的方法来提高其性能。
G-SPARC: SPECTRAL ARCHITECTURES TACKLING THECOLD-STARTPROBLEMINGRAPHLEARNING
这篇论文介绍了一个名为G-SPARC的新型框架,旨在解决图学习中的冷启动问题。冷启动问题指的是如何处理图中没有已知连接的新节点。G-SPARC利用一般化的谱嵌入,将图表示从邻接矩阵转换为拉普拉斯矩阵的特征向量,从而捕获图的全局结构而不依赖于邻接数据。这种方法不仅适用于冷启动节点,还可以扩展到现有的最先进方法,使它们适用于实际应用。通过实验,作者证明了G-SPARC在处理冷启动节点的多种任务(如节点分类、节点聚类和链接预测)上优于现有模型。
主要贡献包括:
- 提出了一个基于谱的框架,利用一般化的谱嵌入来处理冷启动节点预测。
- 展示了该框架在节点分类、节点聚类和链接预测等关键应用中的有效性。
- 提供了一个内置的解决方案,可以集成到现有的和未来的图学习模型中,以支持冷启动节点。
论文还讨论了相关工作,包括在图机器学习中处理冷启动节点的方法,以及谱方法在图数据上的应用。作者详细介绍了G-SPARC的预备知识,包括图的定义、SpectralNet和谱图卷积网络(GCNs)。此外,论文还提出了G-SPARC框架的细节,包括一般化嵌入(SPARC)、SPARC-GCN和SPARCphormer,以及如何将这些方法应用于其他图下游任务,如聚类和迷你批次处理。
在实验部分,作者展示了在不同数据集上的性能,并讨论了特征相似性的限制。最后,论文总结了G-SPARC的优势,并指出了其局限性,即对有意义的节点特征的依赖。作者还计划将研究扩展到异质图,并继续改进方法以适应更广泛的应用场景。
ARE SPECTRAL AUGMENTATIONS NECESSARY IN CONTRAST-BASEDGRAPHSELF-SUPERVISEDLEARNING?
这篇文章是关于图自监督学习(Graph Self-Supervised Learning, Graph SSL)中的对比学习方法(Contrast-based Graph SSL, CG-SSL)的研究,特别是探讨了在这类方法中是否有必要使用谱增强(spectral augmentations)。文章的主要观点和发现如下:
- 研究背景:图自监督学习在处理复杂数据关系方面显示出巨大潜力,尤其是在数据挖掘、计算机视觉、网络分析和生物信息学等领域。然而,由于标签数据有限,图学习在现实世界的应用中面临挑战。对比图自监督学习(CG-SSL)通过最大化同一对象的不同增强实例之间的互信息(mutual information, MI)来解决这一问题。
- 谱增强的质疑:尽管谱信息(如图的拉普拉斯算子的特征值和特征向量)被认为在增强CG-SSL的效能方面发挥着关键作用,但不同方法对于谱域的假设或启发式方法存在冲突,这引发了关于谱增强必要性的质疑。
- 研究目的:文章旨在批判性地评估谱增强在CG-SSL框架中的有效性和重要性,并提出简单的边扰动(edge perturbation)策略,如随机边丢弃(DROPEDGE)和随机边添加(ADDEDGE),可能比现有的谱增强方法更有效,同时需要更少的计算资源。
- 实验结果:通过一系列实验,文章发现谱增强并没有显著提升学习效能,而简单的边扰动在节点和图级别的分类任务中表现更好。此外,图神经网络(GNN)编码器很难从增强图中学习到谱信息,而且改变增强图的谱特征以影响模型性能的效果并不明显。
- 理论分析:文章还探讨了谱方法的理论基础与图学习实际应用之间的差距,指出许多谱增强方法依赖于可能在现实世界场景中不成立的简化假设。
- 结论:文章得出结论,谱增强在CG-SSL中并不是必要的,简单的边扰动技术不仅足够好,而且在某些情况下比谱增强更优。这些发现挑战了当前对谱增强的重视,提倡在CG-SSL中使用更简单有效的边扰动技术,可能会重塑图自监督学习的理解。
文章还包含了对实验设置、数据集、训练配置、图谱和SPAN的初步知识、GCL框架的目标函数、谱增强在图学习中的理论差距以及额外实验的详细描述。