GDC 笔记

1 Title

        Diffusion Improves Graph Learning(Johannes Gasteiger, Stefan Weißenberger, Stephan Günnemann)【NeurIPS 2019】

2 Conclusion

        This study removes the restriction of using only the direct neighbors by introducing a
powerful, yet spatially localized graph convolution: Graph diffusion convolution(GDC). GDC leverages generalized graph diffusion, examples of which are the heat kernel and personalized PageRank. It alleviates the problem of noisy and often arbitrarily defined edges in real graphs.  GDC is also closely related to spectral-based models and thus combines the strengths of both spatial (message passing) and spectral methods. 

3 Good Sentences

        1、Message Passing Neural Networks (MPNNs) are the prevalent approach in this field but they only pass messages between neighboring nodes in each layer. These messages are then aggregated at each node to form the embedding for the next layer. While MPNNs do leverage higher-order neighborhoods in deeper layers, limiting each layer’s messages to one-hop neighbors seems arbitrary.(The shortcomings of previous GNNs method)
        2、To reconcile these two separate approaches and combine their strengths we propose
a novel technique of performing message passing inspired by spectral methods: Graph diffusion
convolution (GDC). Instead of aggregating information only from the first-hop neighbors, GDC
aggregates information from a larger neighborhood. This neighborhood is constructed via a new
graph generated by sparsifying a generalized form of graph diffusion.since GDC generates a new
sparse graph it is not limited to MPNNs and can trivially be combined with any existing graph-based model or algorithm in a plug-and-play manner(The motivation and advantages of GDC)
        3、While there are tight connections between GDC and spectralbased models, GDC is actually spatial-based and therefore does not share their limitations. Similar to polynomial filters, GDC does not compute an expensive eigenvalue decomposition, preserves locality on the graph and is not limited to a single graph after training(The improvement of GDC when compared with spatial-based works)


GDC说白了就是个预处理步骤,通过扩散步骤,把原图生成出一个稠密图,然后用PPR或者热核等方法中的某一个把图在稀疏化,最后把稀疏图投入一种图算法。但是GDC利用了图的节点同质性,所以适用度有限。

通过引入一个强大的、空间局部化的图形卷积:图形扩散卷积(GDC ),消除了只使用直接邻居的限制。用图扩散卷积代替消息传递,在监督和非监督任务以及各种数据集上,在广泛的模型中有显著的性能改进。此外,GDC不限于GNNs,而是可以与任何基于图的模型或算法(例如谱聚类)相结合,而不需要对后者进行任何改变或也不影响其计算复杂度。

GDC利用了广义图扩散。

广义图扩散:

        假设有无向图G =(V,E),其节点集为V,边集为E .用 N = |V|表示节点数,A∈R^{N \times N}表示邻接矩阵,那么这个图的图扩散就定义为:,其中\theta _k是加权系数,T是广义转移矩阵,T^k\theta ^k的选择必须保证上面的公式收敛,在本文中,其限制为:,T的特征值\lambda _i被限制在区间 [0, 1],这样就能保证矩阵收敛,常规图扩散通常要求T是列随机或行随机的。

转移矩阵(Transition matrix)

转移矩阵包括随机行走转移矩阵和对称转移矩阵,其中度矩阵D是节点度的对角矩阵,在本文的定义中,T_{rw}是列随机的,并且还通过向原始邻接矩阵添加(加权)自循环来调整随机游走,在这个公式中,w_{loop}是用来调整的自循环参数。这相当于以概率P执行一种称为“懒惰随机游走”的操作,其中P是指在节点i处保持不动的概率。

图扩散的两个流行的例子是个性化页面排名(PPR)和热度核,

PPR对应于,传送概率为\alpha \in(0,1)

热度核对应于,t为扩散diffusion time

Graph diffusion convolution:

        GDC的图示。通过图扩散和稀疏化将图A转换成新的图S,并在该图上运行给定的模型。本质上,图扩散卷积(GDC)就是用广义图扩散矩阵S的稀疏版本\tilde{S}替换了正常的邻接矩阵A。该矩阵定义了一个加权有向图,本文旨在增强模型应用于该图,加权边有助于GDC的应用,但GDC也可以用于仅支持未加权边的模型,如度校正随机块模型(DCSBM),也可以通过把图变成无向图(当想用谱聚类的时候),这样GDC基本可以适用于任何基于图的模型或算法

Intuition:

GDC背后的一般直觉是,图形扩散平滑了图形上的邻域,充当了一种类似于图像上的高斯滤波器的去噪滤波器。真实图像的特征和边往往都带有噪声,基于图扩散的平滑确实从噪声图中恢复了有意义的领域。

稀疏化(Sparsification):

        大多数图形扩散会产生一个密集矩阵S,即使在这个公式,不把k相加,也会发生这种情况,这是因为现实生活中的“four/six degrees of separation”,即大部分节点之间存在着较短的路径,这通常导致S中的值的影响高度局部化。

而空间局部性允许我们截断S中的小值,从而恢复稀疏性,最终得到一个稀疏矩阵\tilde{S}

        本文考虑两种稀疏化方案:1、top-k:使用每列质量最大的k个元素    2、阈值\epsilon:设T^k置低于\epsilon的项为零。

        虽然稀疏化需要计算密集矩阵S,但许多图扩散方法都有高效准确的近似算法,使得整个处理过程具有较低的时间和空间复杂度(通常是O(N))。此外,稀疏化还可以通过生成正则图来适用于批处理方法(甚至有助于提高预测准确度)

限制:GDC基于同质性假设,节点之间的扩散过程更多地考虑了节点之间的相似性,从而更准确地捕捉了网络中的局部结构和特征。如果想扩展到异质性,可以考虑给边负权重

GDC:

        GDC总共包括四个步骤:1、计算转移矩阵T ;2、通过这个公式得到S;3、通过截断S的小值来稀疏化矩阵;4、最终得到计算转移矩阵T_{\tilde{S}}。 

第一步:过渡矩阵 T 的计算影响了使用哪种拉普拉斯矩阵来分析图的谱结构。具体来说,可以使用对称归一化拉普拉斯矩阵 L_{sym}​ 或随机游走归一化拉普拉斯矩阵 L_{rw}​,而不是未归一化的拉普拉斯矩阵L_{un}。(添加自循环会缩小图的特征值)

第二步:对T^k求和,求和不影响原始矩阵的特征向量

对于特征向量v_i以及对应的特征值\lambda _i,特征值被公式改变。
对于PPR,
对于热核,

PPR和热核都作为低通滤波器,低特征值会被放大,更好地突出和捕捉图中的大规模结构,高特征值会被抑制,从而减少对图中细节或噪声的影响。

第三步:稀疏化改变了特征值和特征向量,这意味着S\tilde{S}的特征值之间没有直接对应关系,但是可以使用特征值扰动理论(eigenvalue perturbation theory)来得到一个上界。

,其中E=\tilde{S}-S是扰动矩阵,\epsilon是阈值。使用扰动矩阵E和阈值ϵ推导出的上界明显高估了扰动的大小。这是因为在实际情况中,基于PPR和热核的方法在真实世界的图上都表现出很强的局部化特性,因此特征值的变化经验上不会随着节点数N而扩大。典型的稀疏化阈值几乎不会对特征值产生影响。

如图所示,基本没有影响,引起的微小变化也主要影响最高和最低的特征值。最高的特征值对应于非常大的集群和长距离的相互作用,这些对于局部图平滑来说不理想。最低的特征值则对应于虚假的振荡,这些对于图学习也没有帮助,可能是由于在阈值ϵ 处的突然截断而受到影响。

第四步\tilde{S}的转移矩阵:最后计算结果图\tilde{S}上的转移矩阵。此步骤不仅仅改变我们考虑的拉普拉斯算子,因为我们已经在步骤 1 中切换到使用转移矩阵。此外,它不保留特征向量,因此最好通过对特征值进行排序来进行实证研究

使用转移矩阵的主要目的是确保稀疏化不会因丢失不同数量的相邻边而导致节点被区别对待。滤波只是side-effect

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/564256.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

OpenLayers6实战,OpenLayers实现鼠标拖拽方式绘制环形(四分之一圆环),OpenLayers特殊图形绘制

专栏目录: OpenLayers6实战进阶专栏目录 前言 本章讲解如何使用OpenLayers在地图上实现鼠标拖拽方式绘制环形(四分之一圆环)的功能。 环形是一种由两个弧线和连接线组成的特殊图形,实现起来是有一定难度的。 二、依赖和使用 "ol": "^6.15.1"使用npm…

Canal1--搭建Canal监听数据库变化

1.安装mysql 默认安装了mysql(版本8.0.x); 新创建用户 -- 创建用户 用户名:canal 密码:Canal123456 create user canal% identified by Canal123456;授权 grant SELECT, REPLICATION SLAVE, REPLICATION CLIENT on…

算法库应用-有序单链表插入节点

学习源头: 模仿贺利坚老师单链表排序文章浏览阅读5.9k次。  本文针对数据结构基础系列网络课程(2):线性表中第11课时单链表应用举例。例:拆分单链表 (linklist.h是单链表“算法库”中的头文件,详情单击链接…)//本程…

前端通过http请求访问本地图片

1、前端直接引用本地图片,图片加载失败 具体报错信息如下: Not allowed to load local resource不允许加载本地资源 2、针对以上问题,只需要利用拦截器将本机地址映射成url路径就行 具体代码如下 Configuration public class FileConfig i…

Android Studio实现内容丰富的安卓校园超市

获取源码请点击文章末尾QQ名片联系,源码不免费,尊重创作,尊重劳动 项目代号168 1.开发环境 后端用springboot框架,安卓的用android studio开发 android stuido3.6 jdk1.8 idea mysql tomcat 2.功能介绍 安卓端: 1.注册…

区块链 | OpenSea:Toward Achieving Anonymous NFT Trading 一文的改进方案

🥑原文: Toward Achieving Anonymous NFT Trading 🥑吐槽: 这论文怎么老有描述不清、前后不一致的地方😇 正文 在本节中,我们将具体展示我们方案的构建。我们将基于一个示例来描述我们方案的工作流程&…

如何快速完成手头工作 待办工作的处理技巧

作为忙碌的上班族,我们每天都要处理大量的工作任务。面对堆积如山的工作,稍有不慎,就可能导致任务的延误甚至遗忘。想象一下,在紧张而忙碌的一天结束时,突然发现一个重要的报告还未完成,或者忘记了一个关键…

Python从0到100(十五):函数的高级应用

前言: 零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Pyth…

【ARFoundation自学01】搭建AR框架+检测平面+点击克隆立方体到地面=自信入门!

介绍 AR 的功能其实是个大手机系统厂商和眼镜设备厂商开发的功能,并不是Unity的功能,毕竟Unity没有自己的手机设备!比如谷歌公司的安卓开发了ARcore,让所有安卓8.0版本以上的用户能够在手机上体验AR功能!苹果推出了AR…

token逆向和简单的字体解密

一、token加密部分 网址:aHR0cHM6Ly9qenNjLmpzdC56ai5nb3YuY24vUHVibGljV2ViL2luZGV4Lmh0bWwjLw 点开查询的xhr的包,发现headers中含有token这一加密参数。 直接跟栈,很容发现在第三个栈加密。 s Object(L.b)(l).toString(),由…

VASA-1:一键生成高质量视频,颠覆你的想象!

VASA-1:语音生成AI视频 前言 最近,微软公司公布了一项图生视频的 VASA-1 框架,该 AI 框架只需使用一张真人肖像照片和一段个人语音音频,就能够生成精确逼真的相对应文本的视频,而且可以使表情和面部动作表现的十分自然…

Dubbo应用可观测性升级指南与踩坑记录

应用从dubbo-3.1.*升级到dubbo-*:3.2.*最新稳定版本,提升应用的可观测性和度量数据准确性。 1. dubbo版本发布说明(可不关注) dubbo版本发布 https://github.com/apache/dubbo/releases 【升级兼容性】3.1 升级到 3.2 2. 应用修改点 应用一般只需要升级dubbo-s…

Windows 的常用命令(不分大小写)

Net user (查看当前系统所有的账户) net user yourname password /add 添加新用户 net localgroup administrators yourname /add 添加管理员权限 net user yourname /delete 删除用户 net user 命令 [colorred]说明:以下命令仅限持管理员…

CentOS 7安装、卸载MySQL数据库(一)

说明:本文介绍如何在CentOS 7操作系统下使用yum方式安装MySQL数据库,及卸载; 安装 Step1:卸载mariadb 敲下面的命令,查看系统mariadb软件包 rpm -qa|grep mariadb跳出mariadb软件包信息后,敲下面的命令…

振弦采集仪在岩土工程施工控制中的作用与效果

振弦采集仪在岩土工程施工控制中的作用与效果 河北稳控科技振弦采集仪在岩土工程施工中是一种常见的测量仪器,它通过对地表地震波的传播和振动特性进行监测,可以提供关键的信息,用于控制施工质量和安全。振弦采集仪具有精度高、反应快的特点…

ADOP带您了解光模块发射光功率的四种测试方法

🤲🤲品质优良的光模块在发货前一般经过了严格的硬件测试和光学测试,光学测试主要检测光模块的兼容性,硬件测试主要是参数测试,其中包含发射光功率、接收灵敏度、工作温度、偏置电流等等。 🌐🌐…

07 文件-IO流字节流

File File类的使用 File对象既可以代表文件、也可以代表文件夹。它封装的对象仅仅是一个路径名,这个路径可以存在,也可以不存在 创建File类的对象 构造器说明public File(String pathname)根据文件路径创建文件对象public File(String parent, Strin…

(精)3款好用的企业防泄密软件推荐 | 好用电脑文件防泄密软件推荐

企业防泄密是指通过一系列的技术手段和管理措施,防止企业的敏感信息、核心技术、商业机密等被未经授权的第三方获取或泄露。 这不仅是保护企业资产和知识产权的重要手段,也是维护企业声誉、保持市场竞争力的关键因素。 而企业防泄密软件则是专门用于实…

JavaScript之模块化规范详解

文章的更新路线:JavaScript基础知识-Vue2基础知识-Vue3基础知识-TypeScript基础知识-网络基础知识-浏览器基础知识-项目优化知识-项目实战经验-前端温习题(HTML基础知识和CSS基础知识已经更新完毕) 正文 CommonJS、UMD、CMD和ES6是不同的模块…

2024/4/21周报

文章目录 摘要Abstract文献阅读题目问题贡献方法卷积及池化层LSTM层CNN-LSTM模型 数据集参数设置评估指标实验结果 深度学习使用GRU和LSTM进行时间预测1.库的导入&数据集2.数据预处理3.模型定义4.训练过程5.模型训练 总结 摘要 本周阅读了一篇基于CNN-LSTM黄金价格时间序列…