NeurIPS 2023 | RGIB:对抗双边图噪声的鲁棒图学习

▐ 摘要

链接预测[1,2]是图学习的一种基础任务,用于判断图中的两个节点是否可能相连,被广泛应用于药物发现、知识图谱补全和在线问答等实际场景。尽管图神经网络(Graph Neural Network,GNN)在该问题的性能上取得了显著进步,但在图结构噪声下的差强人意的鲁棒性仍是当前深度图模型的实际瓶颈。

在鲁棒图学习方面,早期工作探索了通过邻近节点的平滑效果来提高GNN在节点标签噪声下的鲁棒性,其他方法通过随机移除边或主动选择有信息量的节点或边来达到类似的效果。然而,当将这些抗噪声方法应用于带有噪声的链接预测时,只能取得非常有限的增益。其原因在于,不同于标签噪声,这里的图结构噪声是双向的:它会自然地同时扰动输入图的拓扑结构和输出端目标边的标签,即同时存在noisy inputs和noisy labels(如下图1所示),且这种双向噪声在现实世界的图数据中是常见的[3],如点击率预测、商品推荐等场景。

于是,我们提出一个新的挑战:如何处理双边噪声以实现鲁棒的链接预测?

206b48e20aeb12e92475cd2a2e663dfe.png
图1. 双边图噪声下的链接预测问题.

首先,我们进行了一个实证研究,揭示了图结构噪声如何双向干扰输入拓扑结构和目标标签,导致性能严重下降和表征坍缩。为此,我们提出了一个信息论指导原则,即鲁棒图信息瓶颈(Robust Graph Information Bottleneck,RGIB),以提取可靠的监督信号并避免表征坍缩。与基本的信息瓶颈GIB[4,5]不同的是,RGIB进一步解耦并平衡了图拓扑、图标签和图表征之间的相互依赖性,为抵抗双边噪声的鲁棒表征构建了新的学习目标。此外,我们探索了两种实例,RGIB-SSL和RGIB-REP,利用自监督学习和数据重参数化方法的优势,分别进行隐式和显式的去噪学习。

35f2bce18901052731d8af0b2656f223.png
图2. 基本GIB和本文提出的RGIB (其中A是图结构,Y是边标签,H是图表征,I为互信息).

简言之,在本项工作中:

  • 我们发现双边噪声会导致严重的表征坍缩和性能下降,并且这种负面影响对常见数据集和图神经网络来说是普遍存在的。据我们所知,我们是最早研究在双边噪声下链接预测鲁棒性问题的。

  • 我们提出了一个通用学习框架RGIB,设计了新的表征学习目标以提高图神经网络的鲁棒性。我们基于不同的方法论提出了两种实现方式,即RGIB-SSL和RGIB-REP,并提出了适应性的设计和理论的分析。

  • RGIB在不修改GNN架构的情况下,在3种常用GNN和6个常见数据集上达到了最有效果,各种噪声场景下的AUC提升了高达12.9%,模型学到的表征分布显著恢复,并且对双边噪声更加鲁棒。

接下来,将简要地向大家分享我们近期发表在 NeurIPS 2023 上的有关双边噪声下链接预测鲁棒性的研究结果。

本项研究结果是淘天集团阿里妈妈展示外投团队与香港浸会大学韩波老师研究团队自2022年8月开始通过阿里巴巴创新研究计划(AIR),共同参与“针对大规模在线广告的可信赖深度学习” 项目的研究工作。

论文标题: Combating Bilateral Edge Noise for Robust Link Prediction

论文下载: https://openreview.net/pdf?id=ePkLqJh5kw

代码链接: https://github.com/tmlr-group/RGIB

🔍 本期话题:如何从优化的角度来解决数据噪声呢?欢迎评论区留言讨论~

1. 问题定义

为了定量研究双边图结构噪声的影响,我们在一系列GNN基准数据集上合理地模拟不同程度的扰动,详细说明见如下定义3.1。需要注意的是,目前最常采用的数据划分方式是随机地将部分边分为观测部分和预测目标部分,因此在训练集中,噪声边会被划分到输入和标签中。

双边噪声的生成(定义3.1):假设存在一组干净的训练数据,即观察到的图,以及查询边的标签 。通过向原始邻接矩阵添加边噪声,同时保持节点特征不变,生成了噪声邻接矩阵。类似地,通过向标签添加边噪声生成了噪声标签。具体而言,给定噪声比例,噪声边 () 通过将 A 中的零元素以概率翻转为一来生成。满足和。类似地,可生成噪声标签并添加到原始标签中,其中 。

基于此定义,我们进行实验并发现,双边图结构噪声导致GNN的性能显著下降(见图4),而更大的噪声比率通常导致更严重的性能退化。这意味着,经过标准训练的GNN容易受到双边图结构噪声的影响,表现出严重的鲁棒性问题。此外,双边噪声带来的性能下降远远大于单边输入噪声或标签噪声的影响。

e41482f0b6be80397e3e448f62156dc8.png
图3. 双边噪声导致显著的性能下降.

接着,我们检查GNN学习得到的表征。从图5的uniformity分布可以看出,表征在双边噪声的作用下严重坍缩,由原本较为均匀的环状分布逐步退化成了几个单点,且更高的噪声率会导致更严重的坍缩程度,这反映了噪声对于图学习的负面影响,也是最终性能下降的重要原因。

52581645d2046e9e936db1f04d10d18f.png
图4. 双边噪声造成严重的表征坍缩.

2. 解决方案

2.1 GIB的固有缺陷

为了增强图表征的鲁棒性并避免严重的表征坍缩,我们可以利用图信息瓶颈(Graph Information Bottleneck,GIB)[4,5] 的信息约束作为图表征优化的目标,即:

其中,超参数用于限制互信息项,以避免表征过多捕获来自的与任务无关的信息。基本的GIB可以有效地防御输入扰动,然而,它在本质上容易受到标签噪声的影响,因为它完全地保留了标签噪声的监督,所以基本的GIB不能够解决双边噪声问题。

2.2 RGIB优化目标设计

在本工作中,我们尝试对GIB进行分析和改进。注意到,基本的GIB通过直接约束来降低,以处理输入噪声。同样地,标签噪声可以隐藏在中,但是简单地约束来正则化并不理想,因为它与GIB原始方程冲突,并且也无法处理内的噪声。因此,进一步解耦、和之间的依赖关系至关重要。

注意到,噪声可以存在于、和这几个区域。分析上,我们知道:

其中是一个常数,冗余可以被最小化。因此,可以近似拆解为,和,这三个信息项的平衡可以构成双边图结构噪声问题的解决方案。

基于上述分析,我们提出了RGIB(Robust Graph Information Bottleneck),一个新的表征学习目标来平衡、两方面的监督信息,即:

其中对的约束鼓励更有信息量的表征以防止坍缩(),并限制其容量()以避免过拟合。另外两个互信息项和,相互约束后验信息以减轻双边噪声对的负面影响。

需要注意的是,互信息项如通常是难以精确计算的。因此,我们基于不同的方法论,来给出两种实际的RGIB实现,即RGIB-SSL和RGIB-REP。其中,RGIB-SSL通过自监督正则化显式地优化表征,而RGIB-REP通过重参数化隐式地优化表征,详细设计如下。

2.3 RGIB实例化

b0922503721ea7454786d5a02dac2dd0.png
图5. RGIB及其实例RGIB-SSL、RGIB-REP的示意.

RGIB-SSL: 图表征在监督学习范式下已经退化,自然地,我们将其修改为自监督学习的范式,通过uniformity项鼓励表征提高信息量来缓解坍缩,并配合alignment项隐式地捕捉含噪变量之间的可靠关系(见图6b),即:

其中用于平衡一个监督和两个自监督正则化项,当时,RGIB-SSL可退化为基本的GIB。和是两个增强图和的表征。

RGIB-REP: 另一种实现方式是,通过重新参数化拓扑空间和标签空间的信息,保留干净的信息并丢弃噪声部分。为此,我们通过构建隐变量,显式地建模和的可靠性,以学习一个抗噪声的(见图6c),即:

其中,隐变量和是从含噪的和中提取的干净信号。它们的补充部分和 被视为噪声,满足和。当和时,RGIB-REP可退化为基本的GIB。此外,测量了选择样本的监督信号,其中分类器以作为输入而不是原始的,即。

更多技术细节请见正文。

3. 实验结果

我们提供了多维度的实验结果,以验证和理解所提的RGIB方法。

3.1 主要性能对比

如表1所示,RGIB在所有6个数据集上,在不同噪声比例下,都取得了最佳结果,特别是在Cora和Citeseer数据集上,与次佳方法相比,RGIB带来的AUC提升达12.9%。

36e34a26b7ee1359afaa69f41ce28c5e.png
表1. 双边噪声下实验结果展示.

表2中展示了单边噪声的实验结果。无论是针对单边输入噪声还是标签噪声,RGIB仍然超越了所有的基准方法。实验表明,双边图结构噪声可以通过统一的学习框架来建模和解决,而此前的去噪方法只能用于特定的噪声模式。

d7928de72dd0615218dba3ec8d824f02.png
表2. 单边噪声下实验结果展示.

3.2 多方面的消融实验及深入讨论

我们进一步进行了诸多消融实验,深入探讨了所提方法在不同角度下的表现。

c1f75c711c5b28a0204dd772e1074519.png
图6. RGIB能显著改善表征分布,降低坍缩程度.
879d141c134febe040d3622395ddaa68.png
表3. RGIB在不同超参schedule下的表现.
d33106ffb80f8d2867bdfbf2aab6dc0a.png
图7. RGIB的超参数搜索结果热力图.
b903161087c5887f5fa5dc08ea6f482e.png
表4. RGIB在对抗扰动下的实验结果.
b4d133529b9db131b9f9b53d8e49212e.png
表5. RGIB的消融实验.

除此以外,我们提供了更多的可视化及相关实验结果,感兴趣的读者请移步原文与附录部分。

4. 算法落地

本文提出的RGIB-SSL方法,在展示外投业务中进行了算法落地。在该业务中,商家广告被投放于全域互联网媒体流量上。本技术通过在预训练上对用户广告行为特征构图并约束RGIB,增强了对点击行为的预估鲁棒性,从而提升精排阶段点击率预估的准确性,提升投放广告的精准度与质量与在媒体流量出价上的准确度,使得大盘营收获得约5%的提升。该技术全面应用于展示外投的几乎所有媒体流量,覆盖数十家媒体、近百个流量资源位和数亿用户。

5. 总结及展望

本文研究了带有双边图结构噪声的链接预测问题,并发现在这种双边噪声下,GNN学习得到的表征严重坍缩。基于这一观察,我们引入了鲁棒图信息瓶颈原则RGIB,旨在通过解耦和平衡输入、标签和表征之间的互信息来提取可靠信号,以增强表征鲁棒性并避免坍缩。展望未来,可将RGIB拓展至节点预测(Node Classification)、整图预测(Graph Classification)即知识图谱推理(Knowledge Graph Reasoning)等任务上。此外,正交于本文研究的结构噪声(Structural Noise),图节点特征上的噪声(Feature Noise)同样值得关注。

▐ 参考文献

[1] D. Liben-Nowell and J. Kleinberg. The link-prediction problem for social networks. Journal of the American society for information science and technology, 2007.

[2] M. Zhang and Y. Chen. Link prediction based on graph neural networks. In NeurIPS, 2018.

[3] B. Wu, J. Li, C. Hou, G. Fu, Y. Bian, L. Chen, and J. Huang. Recent advances in reliable deep graph learning: Adversarial attack, inherent noise, and distribution shift. arXiv, 2022.

[4] T. Wu, H. Ren, P. Li, and J. Leskovec. Graph information bottleneck. In NeurIPS, 2020.

[5]  J. Yu, T. Xu, Y. Rong, Y. Bian, J. Huang, and R. He. Graph information bottleneck for subgraph recognition. arXiv, 2020

▐ 团队介绍

🏷 阿里妈妈展示外投团队

阿里妈妈展示外投团队是阿里妈妈核心广告技术团队之一,也是阿里妈妈业务增长最快的团队。依托于集团庞大而真实的营销场景,以AI技术驱动实现客户商品营销, 并承担集团App用户增长等业务需求。我们持续探索人工智能,联邦学习,深度学习,强化学习,知识图谱,图学习等前沿技术在外投广告和用增方面的落地应用。在创造业务价值的同时,团队近几年在ICML、NIPS、WWW、CIKM、SIGIR、KDD、NAACL等领域知名会议上发表过多篇论文。真诚欢迎对广告算法、推荐系统、NLP等方向感兴趣的同学加入我们, 一起成长!

✉️ 简历投递邮箱:alimama_tech@service.alibaba.com

// 点击↓阅读原文,了解JD详细详情

🏷 香港浸会大学可信机器学习和推理组

香港浸会大学可信机器学习和推理课题组 (TMLR Group) 由多名青年教授、博士后研究员、博士生、访问博士生和研究助理共同组成,课题组隶属于理学院计算机系。课题组专攻可信表征学习、基于因果推理的可信学习、可信基础模型等相关的算法,理论和系统设计以及在自然科学上的应用,具体研究方向和相关成果详见本组Github (https://github.com/tmlr-group)。课题组由政府科研基金以及工业界科研基金资助,如香港研究资助局杰出青年学者计划,国家自然科学基金面上项目和青年项目,以及国内外企业的科研基金。青年教授和资深研究员手把手带,GPU计算资源充足,长期招收多名博士后研究员、博士生、研究助理和研究实习生。感兴趣的同学请发送个人简历和初步研究计划到邮箱 :bhanml@comp.hkbu.edu.hk。

🔍 本期话题:如何从优化的角度来解决数据噪声呢?欢迎评论区留言讨论~

END

da206d585eb6ada99f6e9f5f5203c0ac.gif

也许你还想看

Memorization Discrepancy:利用模型动态信息发现累积性注毒攻击

CBRL:面向ROI约束竞价问题的课程引导贝叶斯强化学习框架

基于对抗梯度的探索模型及其在点击预估中的应用

一种用于在线广告自动竞价的协作竞争多智能体框架

NAACL22 & SIGIR22 | 面向 CTR 的外投广告动态创意优化实践

基于图的电商语义相关性弱监督学习框架

关注「阿里妈妈技术」,了解更多~

9b5a80dd29d121652bcbaee0b9b32eb7.gif

喜欢要“分享”,好看要“点赞”哦ღ~

↓欢迎留言参与讨论↓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/183082.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

我做了一个世界杯数据可视化网站······

感兴趣的小伙伴可以进去看看:主页https://messimeimei.github.io/world-cup-visualization.github.io/,可能会比较卡 经过2个月的工作,我完成了80%的工作量,并成功将静态网站进行了部署。并对页面进行了更新。不过当前虽然完成了…

ESP32之避障

ESP32之避障 图片 程序 int Led27;//定义LED 接口 int buttonpin4; //定义光遮断传感器接口 int val;//定义数字变量val void setup() { pinMode(Led,OUTPUT);//定义LED 为输出接口 pinMode(buttonpin,INPUT);//定义避障传感器为输出接口 } void loop() {Serial.begin(9600);…

性能相关的闪存特性

一、多Plane操作 上章提到若干个Plane组成Die或者叫LUN,即一个Die上有多个Plane 每次进行写操作时,控制器先将数据写入页缓存中,等同一个Die上另一个Plane也写数据的时候,再同时写入,原来单独操作一个Plane的时间变成了可以同时做…

UDP客户端使用connect与UDP服务器使用send函数和recv函数收发数据

服务器代码编译运行 服务器udpconnectToServer.c的代码如下&#xff1a; #include<stdio.h> #include<stdlib.h> #include<string.h> #include<unistd.h> #include<arpa/inet.h> #include<sys/socket.h> #include<errno.h> #inclu…

【Spring进阶系列丨第四篇】学习Spring中的Bean管理(基于xml配置)

前言 在之前的学习中我们知道&#xff0c;容器是一个空间的概念&#xff0c;一般理解为可盛放物体的地方。在Spring容器通常理解为BeanFactory或者ApplicationContext。我们知道spring的IOC容器能够帮我们创建对象&#xff0c;对象交给spring管理之后我们就不用手动去new对象。…

操作系统发展过程--单道批处理系统、多道批处理系统、分时系统、实时系统

一、单道批处理系统 计算机早期&#xff0c;为了能提高利用率&#xff0c;需要尽量保持系统的连续运行&#xff0c;即在处理完一个作业之后&#xff0c;紧接着处理下一个作业&#xff0c;以减少机器的空闲等待时间 1.单道批处理系统的处理过程 为了实现对作业的连续处理&…

EPT-Net:用于3D医学图像分割的边缘感知转换器

EPT-Net: Edge Perception Transformer for 3D Medical Image Segmentation EPT-Net&#xff1a;用于3D医学图像分割的边缘感知转换器背景贡献实验方法Dual Positional Transformer&#xff08;双位置Transformer&#xff09;Learnable Patch EmbeddingVoxel Spacial Positiona…

OpenCV实现图像噪声、去噪基本方法

一、噪声分类 1、高斯噪声 指服从高斯分布&#xff08;正态分布&#xff09;的一类噪声&#xff0c;其产生的主要原因是由于相机在拍摄时视场较暗且亮度不均匀造成的&#xff0c;同时相机长时间工作使得温度过高也会引起高斯噪声&#xff0c;另外电路元器件白身噪声和互相影响…

土地利用数据技术服务

一、背景介绍 土地是人类赖以生存与发展的重要资源和物质保障&#xff0c;在“人口&#xff0d;资源&#xff0d;环境&#xff0d;发展&#xff08;PRED&#xff09;”复合系统 中&#xff0c;土地资源处于基础地位。随着现代社会人口的不断增长以及工业化、城市化进程的加速&a…

nvm切换版本之后npm用不了

原因是 nvm只给你安了对应的node没给你安装对应的node版本的npm 解决办法如下 1找到你安装的node版本号 然后去官网下载对应的版本包 这个网址就是node官网的版本列表 Index of /download/release/ 2下载后解压 把根目录这俩复制到自己的nvm安装目录下 还有那个node_modul…

Vue学习之路------指令

Vue指令 vue会根据不同的指令&#xff0c;针对标签实现不同的功能 指令:带有v-前缀的特殊标签属性 1&#xff1a;v-html&#xff1a;指令 <div v-html"msg"></div> 2&#xff1a;v-show 作用&#xff1a;控制元素显示隐藏 语法&#xff1a;v-show&quo…

解决:javax.websocket.server.ServerContainer not available 报错问题

原因&#xff1a; 用于扫描带有 ServerEndpoint 的注解成为 websocket&#xff0c;该方法是 服务器端点出口&#xff0c;当进行 SpringBoot 单元测试时&#xff0c;并没有启动服务器&#xff0c;所以当加载到这个bean时会报错。 解决方法&#xff1a; 加上这个注解内容 Spr…

顺序表基本操作全面解析

文章目录 1.线性表2.顺序表分类2.1 静态顺序表2.2 动态顺序表 3. 顺序表各接口实现1. 定义结构体(Seqlist)2. 结构体初始化(SLInit)3.检查容量 (SLCheckCapacity)4.打印数据 (SLPrintf)5.插入操作5.1 从数据头部插入(SLPushFront)5.2 从数据尾部插入(SLPushBack)5.3 从任意下标…

ELK企业级日志分析平台——kibana数据可视化

部署 新建虚拟机server5&#xff0c;部署kibana [rootelk5 ~]# rpm -ivh kibana-7.6.1-x86_64.rpm [rootelk5 ~]# cd /etc/kibana/[rootelk5 kibana]# vim kibana.ymlserver.host: "0.0.0.0"elasticsearch.hosts: ["http://192.168.56.11:9200"]i18n.local…

项目管理套路:看这一篇绝对够用❤️

写论文必不可少的&#xff0c;就是创建代码并进行实验。好的项目管理可以让实验进行得更加顺利。本篇博客以一次项目实践为例&#xff0c;介绍项目管理的方法&#xff0c;以及可能遇到的问题&#xff0c;并提供一些可行的解决方案。 目录 项目管理工具开始第一步版本管理十分关…

ATFX汇市:11月美联储会议纪要提振美指,但中期跌势或将延续

ATFX汇市&#xff1a;11月21日公布的11月美联储利率决议会议纪要提到&#xff1a;过去一年通胀有所缓和&#xff0c;但目前通胀仍然高得令人无法接受&#xff0c;远高于委员会 2% 的长期目标&#xff1b;在消费者支出激增的推动下&#xff0c;第三季度实际 GDP 出人意料地强劲增…

【C++干货铺】适配器 | stack | queue

个人主页点击直达&#xff1a;小白不是程序媛 C系列学习专栏&#xff1a;C干货铺 代码仓库&#xff1a;Gitee 目录 stack的介绍和使用 stack的介绍 stack的使用 queue的介绍和使用 queue的介绍 queue的使用 容器适配器 什么是适配器 STL中stack和queue的底层结构 d…

Python 使用XlsxWriter操作Excel

在数据处理和报告生成的领域中&#xff0c;Excel 文件一直是广泛使用的标准格式。为了让 Python 开发者能够轻松创建和修改 Excel 文件&#xff0c;XlsxWriter 库应运而生。XlsxWriter 是一个功能强大的 Python 模块&#xff0c;专门用于生成 Microsoft Excel 2007及以上版本&a…

外部中断为什么会误触发?

今天在写外部中断的程序的时候&#xff0c;发现中断特别容易受到干扰&#xff0c;我把手放在对应的中断引脚上&#xff0c;中断就一直触发&#xff0c;没有停过。经过一天的学习&#xff0c;找到了几个解决方法&#xff0c;所以写了这篇笔记。如果你的中断也时不时会误触发&…

人工智能教程(一):基础知识

目录 前言 什么是人工智能&#xff1f; 教学环境搭建 向量和矩阵 前言 如果你是关注计算机领域最新趋势的学生或从业者&#xff0c;你应该听说过人工智能、数据科学、机器学习、深度学习等术语。作为人工智能系列文章的第一篇&#xff0c;本文将解释这些术语&#xff0c;并搭…