【IJCAI‘23】港大提出社会推荐中的去噪自增强学习

在这里插入图片描述

论文标题:

Denoised Self-Augmented Learning for Social Recommendation

收录会议:

IJCAI 2023

论文链接:
https://arxiv.org/abs/2305.12685

代码链接(欢迎 ✨):

https://github.com/HKUDS/DSL

港大数据智能实验室(指导老师:黄超)

https://sites.google.com/view/chaoh

研究背景

社交推荐通过将社交信息注入用户偏好学习来提高推荐系统的质量,人们开发了各种神经网络技术来对具有社交意识的用户偏好进行编码从而进行推荐。 目前,最先进的社交推荐方法是使用图神经网络(GNN)进行递归消息传递来构建的,从而捕获高阶关系。

有监督的 GNN 增强模型需要大量的有监督标签来生成准确的用户表示,这在实际的社交推荐场景中很难实现。基于自监督学习(SSL)的增强会受到嘈杂的社会关系的严重阻碍。 例如,人们可能与同事、同学或家庭成员建立社会联系,但他们彼此之间可能没有很多共同兴趣。并且,嘈杂的社会影响可能与现实生活推荐场景中的用户偏好不一致。

为了解决这些局限性,我们提出了名为 DSL 的去噪自增强学习范式。该模型利用社交信息,通过抗噪声的自监督学习更好地表征用户偏好,追求跨视图对齐。 我们开发了一个双视图图神经网络来编码用户社交和交互图上的隐层表示。为减轻社会关系对推荐的偏差,我们设计了一个去噪模块来增强集成的社会意识自监督学习任务。

我们的研究成果主要包含以下几点:

  • 我们研究了用于社会推荐的去噪自增强学习,有效减少了嘈杂的社会关系对社会意识协作信号表示的影响。
  • 我们提出 DSL,实现社交视图和交互视图的编码嵌入之间的去噪跨视图对齐。
  • 我们通过在三个真实数据集上的实验,展示了 DSL 相较于现有先进方法的显著性能提升。

模型介绍

请添加图片描述

2.1 双视图图神经关系学习

通过初始化的 id 嵌入,DSL 首先采用双视图图神经网络来捕获用户-商品交互和用户-用户社交关系的高阶协作关系。 受到轻量级 GCN 增强的协同过滤范式的启发,DSL 配置了一个简化的图神经网络。

我们的 GCN 在用户-商品交互图上的迭代信息传播方案:

E r ( l ) = ( L r + I ) ⋅ E r ( l − 1 ) \textbf{E}^{(l)}_r = (\mathcal{L}_r+\textbf{I})\cdot \textbf{E}^{(l-1)}_r Er(l)=(Lr+I)Er(l1)

这里 E r ( l ) , E r ( l − 1 ) ∈ R ( I + J ) × d \textbf{E}^{(l)}_r,\textbf{E}_r^{(l-1)}\in\mathbb{R}^{(I+J)\times d} Er(l),Er(l1)R(I+J)×d 分别表示 l l l 次用户-商品关系建模迭代后的用户和商品嵌入。 I ∈ R ( I + J ) × ( I + J ) \textbf{I}\in\mathbb{R}^{(I+J)\times (I+J)} IR(I+J)×(I+J) 表示用于自环的单位矩阵。 L r ∈ R ( I + J ) × ( I + J ) \mathcal{L}_r\in\mathbb{R}^{(I+J)\times (I+J)} LrR(I+J)×(I+J) 表示用户-商品交互图的拉普拉斯矩阵。

L r = D r − 1 2 A r D r − 1 2 ,      A r = [ 0 R R ⊤ 0 ] \mathcal{L}_r=\textbf{D}_r^{-\frac{1}{2}}\textbf{A}_r\textbf{D}_r^{-\frac{1}{2}},~~~~ \textbf{A}_r=\left[\begin{array}{cc}\textbf{0} & \textbf{R} \\\textbf{R}^{\top} &\textbf{0}\end{array}\right] Lr=Dr21ArDr21,    Ar=[0RR0]

R ∈ R I × J \textbf{R}\in\mathbb{R}^{I\times J} RRI×J 表示用户-商品交互矩阵, 0 \textbf{0} 0 表示全 0 矩阵。用户-商品交互视图的双向相邻矩阵 A r \textbf{A}_r Ar 乘以其对应的对角度矩阵 D r \textbf{D}_r Dr 进行归一化。

对用户的社交关系进行编码,将轻量级 GCN 应用于用户社交图 G s \mathcal{G}_{s} Gs。 具体来说,我们的社交视图 GNN 通过设置 E s ( 0 ) = E u \textbf{E}^{(0)}_s=\textbf{E}_u Es(0)=Eu 将初始用户的 id 对应嵌入作为输入。

E s ( l ) = ( L s + I ) ⋅ E s ( l − 1 ) ,      L s = D s − 1 2 S   D s − 1 2 \textbf{E}^{(l)}_s=(\mathcal{L}_s+\textbf{I})\cdot\textbf{E}_s^{(l-1)},~~~~\mathcal{L}_s=\textbf{D}_s^{-\frac{1}{2}}\textbf{S}~\textbf{D}_s^{-\frac{1}{2}} Es(l)=(Ls+I)Es(l1),    Ls=Ds21S Ds21

这里 S ∈ R I × I \textbf{S}\in\mathbb{R}^{I\times I} SRI×I 对用户的社交关系进行编码, D s , L s ∈ R I × I \textbf{D}_s, \mathcal{L}_s\in\mathbb{R}^{I\times I} Ds,LsRI×I 分别表示社交视图对应的对角度矩阵和归一化的拉普拉斯矩阵。 E s ( l ) , E s ( l − 1 ) ∈ R I × d \textbf{E}_s^{(l)},\textbf{E}_s^{(l-1)}\in\mathbb{R}^{I\times d} Es(l),Es(l1)RI×d 分别是第 l l l 次和第 ( l − 1 ) (l-1) (l1) 次图神经迭代中用户的社交嵌入。

采用均值池化聚合不同阶的嵌入:

E ˉ r = ∑ l = 0 L E r ( l ) ,      E ˉ s = ∑ l = 0 L E s ( l ) \bar{\textbf{E}}_r = \sum_{l=0}^L\textbf{E}_r^{(l)},~~~~\bar{\textbf{E}}_s = \sum_{l=0}^L\textbf{E}_s^{(l)} Eˉr=l=0LEr(l),    Eˉs=l=0LEs(l)

这里 L L L 为图迭代的最大值。

2.2 跨视图去噪自监督

在现实生活场景中,被动建立的社交关系,例如同事或同学,由于其不同的购物兴趣,可能不会对用户交互偏好带来太大影响。 盲目依赖这种不相关的社交关系来推断用户的兴趣可能会损害社交推荐模型的性能。 为了解决这个问题,我们过滤掉不同用户之间关于他们的交互偏好的嘈杂的社会影响,以进行无偏移的自监督。

在我们的 DSL 中,我们结合了跨视图去噪任务,用辅助自监督信号来补充主要学习任务。 学习到的用户交互模式指导社交关系去噪模块根据观察到的社交关系过滤掉误导性的嵌入传播。

给定从交互 GNN 学习到的用户嵌入 ( e ˉ i ( r ) , e ˉ i ′ ( r ) ) (\bar{\textbf{e}}^{(r)}_i, \bar{\textbf{e}}^{(r)}_{i'}) (eˉi(r),eˉi(r)),用户对 ( i , i ′ ) (i, i') (i,i) 间交互相似度定义为 z i , i ′ = [ e ˉ i ( r ) ; e ˉ i ′ ( r ) ] z_{i,i'} = [\bar{\textbf{e}}^{(r)}_i;\bar{\textbf{e}}^{(r)}_{i'}] zi,i=[eˉi(r);eˉi(r)]。同样,基于社交 GNN 编码得到的用户表示 ( e ˉ i ( s ) , e ˉ i ′ ( s ) ) (\bar{\textbf{e}}^{(s)}_i, \bar{\textbf{e}}^{(s)}_{i'}) (eˉi(s),eˉi(s)),用户社交相似度定义为 z ^ i , i ′ = [ e ˉ i ( s ) ; e ˉ i ′ ( s ) ] \hat{z}_{i,i'}=[\bar{\textbf{e}}_i^{(s)};\bar{\textbf{e}}_{i'}^{(s)}] z^i,i=[eˉi(s);eˉi(s)]。为消除交互视图和社交视图的语义差异,我们设计相似度投影函数,将交互语义映射到隐层空间用来跨视图对齐:

z i , i ′ = sigm ( d ⊤ ⋅ σ ( T ⋅ [ e ˉ i ( r ) ; e ˉ i ′ ( r ) ] + e ˉ i ( r ) + e ˉ i ′ ( r ) + c ) ) z_{i,i'} = \text{sigm}(\textbf{d}^\top\cdot\sigma(\textbf{T}\cdot[\bar{\textbf{e}}^{(r)}_i;\bar{\textbf{e}}^{(r)}_{i'}]+\bar{\textbf{e}}^{(r)}_i+\bar{\textbf{e}}^{(r)}_{i'}+\textbf{c})) zi,i=sigm(dσ(T[eˉi(r);eˉi(r)]+eˉi(r)+eˉi(r)+c))

这里 sigm ( ⋅ ) \text{sigm}(\cdot) sigm() σ ( ⋅ ) \sigma(\cdot) σ() 分别表示 Sigmoid 和 LeakyReLU 激活函数。 d ∈ R d , T ∈ R d × 2 d , c ∈ R d \textbf{d}\in\mathbb{R}^d, \textbf{T}\in\mathbb{R}^{d\times 2d}, \textbf{c}\in\mathbb{R}^d dRd,TRd×2d,cRd 为可学习的参数。

为了注入去噪的社会影响来提高推荐质量,我们设计了一个自监督学习任务,用于通过增强嵌入正则化进行跨视图对齐,损失函数为:

L s s l = ∑ ( u i , u i ′ ) max ⁡ ( 0 , 1 − z i , i ′ z ^ i , i ′ ) L_{ssl} = \sum_{(u_i,u_{i'})} \max (0, 1-z_{i,i'}\hat{z}_{i,i'}) Lssl=(ui,ui)max(0,1zi,iz^i,i)

用户对 ( u i , u i ′ u_i, u_{i'} ui,ui) 是从用户集合 U \mathcal{U} U 中单独采样的。有了上述的自监督学习目标,综合用户关系预测任务将基于自监督信号进行社会影响去噪的指导。 这样做,具有不同偏好的用户之间的嘈杂的社会联系将导致可区分的用户表示,以增强推荐。

2.3 多任务模型优化

我们的 DSL 的学习过程涉及模型优化的多任务训练。 增强的自监督学习任务与主要推荐优化损失相结合,以对去噪的社交感知用户偏好进行建模。给定用户和商品嵌入,我们预测用户-商品 ( y ^ u i , v j ( r ) ) (\hat{y}_{u_i,v_j}^{(r)}) (y^ui,vj(r)) 和用户-用户 ( y ^ u i , u i ′ ( s ) ) (\hat{y}_{u_i, u_{i'}}^{(s)}) (y^ui,ui(s)) 关系为:

y ^ u i , v j ( r ) = e ˉ i ( r ) ⊤ e ˉ j ( r ) ;      y ^ u i , u i ′ ( s ) = e ˉ i ( s ) ⊤ e ˉ i ′ ( s ) \hat{y}_{u_i,v_j}^{(r)} = \bar{\textbf{e}}_i^{(r)\top} \bar{\textbf{e}}_j^{(r)};~~~~ \hat{y}_{u_i, u_{i'}}^{(s)} = \bar{\textbf{e}}_i^{(s)\top} \bar{\textbf{e}}_{i'}^{(s)} y^ui,vj(r)=eˉi(r)eˉj(r);    y^ui,ui(s)=eˉi(s)eˉi(s)

这里 y ^ u i , v j ( r ) ∈ R \hat{y}_{u_i,v_j}^{(r)} \in \mathbb{R} y^ui,vj(r)R 表示在交互视图中用户 u i u_i ui 与商品 v j v_j vj 交互的可能性, y ^ u i , u i ′ ( s ) \hat{y}_{u_i, u_{i'}}^{(s)} y^ui,ui(s) 表示 u i u_i ui u i ′ u_{i'} ui 拥有社交关联的概率。

通过最小化 BPR 损失函数进行优化:

L r e c = ∑ ( u i , v j + , v j − ) − ln ⁡ sigm ( y ^ u i , v j + ( r ) − y ^ u i , v j − ( r ) ) {L}_{rec} = \sum_{(u_i,v_{j^+}, v_{j^-})} - \ln \text{sigm}(\hat{y}_{u_i,v_{j^+}}^{(r)} - \hat{y}_{u_i,v_{j^-}}^{(r)})\nonumber Lrec=(ui,vj+,vj)lnsigm(y^ui,vj+(r)y^ui,vj(r))

L s o c = ∑ ( u i , u i + , u i − ) − ln ⁡ sigm ( y ^ u i , u i + ( s ) − y ^ u i , u i − ( s ) ) {L}_{soc} = \sum_{(u_i,u_{i^+}, u_{i^-})} - \ln \text{sigm}(\hat{y}_{u_i,u_{i^+}}^{(s)} - \hat{y}_{u_i,u_{i^-}}^{(s)}) Lsoc=(ui,ui+,ui)lnsigm(y^ui,ui+(s)y^ui,ui(s))

这里 v j + v_{j^+} vj+ v j − v_{j^-} vj 表示对用户 u i u_i ui 采样的正负例。 u i + u_{i^+} ui+ u i − u_{i^-} ui 分别从 u i u_i ui 的社交关联和未关联用户中采样。通过将自监督学习目标与权重参数 λ 1 \lambda_1 λ1 λ 2 \lambda_2 λ2 λ 3 \lambda_3 λ3 相结合,联合优化损失为:

L = L r e c + λ 1 L s o c + λ 2 L s s l + λ 3 ( ∥ E u ∥ F 2 + ∥ E v ∥ F 2 ) L = L_{rec} + \lambda_1 L_{soc} + \lambda_2 L_{ssl} + \lambda_3 (\|\textbf{E}_u\|_F^2 + \|\textbf{E}_v\|_F^2) L=Lrec+λ1Lsoc+λ2Lssl+λ3(EuF2+EvF2)

实验结果

我们进行了大量的实验评估 DSL 的有效性。

我们对从 Ciao、Epinions 和 Yelp 在线平台收集的三个基准数据集进行了实验,除了观察到的对不同商品的隐式反馈(例如评分、点击)之外,还可以在用户之间建立社交联系。表 1 列出了实验数据集的详细统计信息。

请添加图片描述

表 2 表明,我们的 DSL 框架始终优于各种数据集上的所有基线,提供了其有效性的证据。

请添加图片描述

为了研究我们的去噪自监督学习范式在提高性能方面的重要作用,我们对关键模型组件进行了消融研究。结果如表 3 所示。从我们的结果来看,我们观察到我们的 DSL 在大多数评估案例中都优于其他变体。

请添加图片描述

我们还探索关键超参数对 DSL 性能的影响,包括 SSL 损失权重、批量大小和图传播层的数量。 结果如图 2 所示,其中 y 轴表示与默认参数设置相比的性能变化率。

请添加图片描述

我们研究了 DSL 针对数据稀疏性和噪声的鲁棒性以进行推荐。结果如图 3 所示。

请添加图片描述

我们在 NVIDIA GeForce RTX 3090 上测量了不同方法的计算成本(运行时间),并在表 5 中列出了每个模型的训练时间。DSL 的训练成本明显低于大多数比较基准,展示了其在现实生活推荐场景中处理大规模数据集的可扩展性。

请添加图片描述

总结

在这项工作中,我们提出了一种通用的去噪自增强学习框架,该框架不仅结合了社会影响力来帮助理解用户偏好,而且还通过识别社会关系偏差和去噪跨视图自监督来减轻噪音影响。 为了消除社交和交互语义视图之间的差距,该框架引入了可学习的跨视图对齐,以实现自适应自监督增强。 实验结果表明,与现有基线相比,我们的新 DSL 显着提高了推荐准确性和鲁棒性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/489182.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

密码学及其应用1 —— 密码学概述

1 密码学的基本概念 1.1 网络安全的定义 网络安全是网络领域的一个专业领域,它涵盖了在基础计算机网络基础设施中所采取的措施、网络管理员为保护网络及网络可访问资源免受未授权访问而采纳的政策,以及对其有效性(或无效性)的持续…

Capture One Pro 23中文---颠覆性的图像编辑与色彩配置

Capture One Pro 23是一款功能强大且专业的RAW图像编辑处理软件。它拥有全球领先的色彩管理技术和精细的图像编辑工具,可以对图片进行多种精细调整,包括曝光、色温、对比度、锐度等,以满足用户特定的后期处理需求。此外,Capture O…

Linux离线安装mysql,node,forever

PS:本文是基于centos7实现的,要求系统能够查看ifconfig和unzip解压命令, 实现无网络可安装运行 首先现在百度网盘的离线文件包****安装Xftp 和 Xshell 把机房压缩包传到 home目录下****解压unzip 包名.zip 获取IP先获取到 linux 主机的ip ifconfig Xftp 连接输入IP,然后按照…

CentOS使用Docker部署Halo并结合内网穿透实现公网访问本地博客

文章目录 1. Docker部署Halo1.1 检查Docker版本如果未安装Docker可参考已安装Docker步骤:1.2 在Docker中部署Halo 2. Linux安装Cpolar2.1 打开服务器防火墙2.2 安装cpolar内网穿透 3. 配置Halo个人博客公网地址4. 固定Halo公网地址 本文主要介绍如何在CentOS 7系统使…

【Monero】Wallet RPC | Wallet CLI | 门罗币命令行查询余额、种子、地址等命令方法教程

ubuntu22.04 首先在运行daemon,详细安装运行教程可参考:The Monero daemon (monerod) ./monerodWallet CLI run ./monero-wallet-cli如果还没有钱包就根据提示创建钱包即可 输入密码 查询余额 balance查询种子 seed其他可执行命令操作&#xff1…

Spring Cloud - Openfeign 实现原理分析

OpenFeign简介 OpenFeign 是一个声明式 RESTful 网络请求客户端。OpenFeign 会根据带有注解的函数信息构建出网络请求的模板,在发送网络请求之前,OpenFeign 会将函数的参数值设置到这些请求模板中。虽然 OpenFeign 只能支持基于文本的网络请求,但是它可以极大简化网络请求的…

QT(3/22)

1>使用手动连接,将登录框中的取消按钮使用qt4版本的连接到自定义的槽函数中,在自定义的槽函数中调用关闭函数,将登录按钮使用qt5版本的连接到自定义的槽函数中,在槽函数中判断ui界面上输入的账号是否为"admin"&#…

【笔记】MJ Prompt

参数 --chaos 10 or --c 10, 0-10, defalut 0 --quality 1 or --q, 0.25-1, defalut 1 --iw 2, 0.5-2, --stylize 100 or --s 100, 0-1000, defalut 100 --cref URL --cw 100, 0-100stylize 风格化,MJ不同的出图模式,有默认的艺术风格,该值…

企业微信主体变更的公证书怎么办?

企业微信变更主体有什么作用? 企业微信推出到现在已经很多年了,但是之前一直不支持主体变更。于是很多公司好不容易积累的客户,因为换了营业执照经营,原来的客户就都只能流失了。近期企业微信终于放开了变更主体的功能&#xff0c…

C++细节

背景知识: 面向对象的编程中,类(Class)是创建对象的蓝图或模板,它包含了数据(通常称为属性或变量)和行为(通常称为方法或函数)。将数据封装为私有(private&am…

babel起手式

Babel7 以下是各个 ECMAScript 版本引入的一些主要新语法和功能的汇总 ES5 / ECMAScript 5(2009年) 严格模式 "use strict"。JSON 对象。Array.prototype.forEach()、Array.prototype.map()、Array.prototype.filter()、Array.prototype.redu…

畅捷通T+ Ufida.T.DI.UIP.RRA.RRATableController 远程命令执行漏洞

一、漏洞信息 漏洞名称:畅捷通T+ Ufida.T.DI.UIP.RRA.RRATableController 远程命令执行漏洞 漏洞类别:远程命令执行漏洞 风险等级:高危 二、漏洞描述 畅捷通TPlus适用于异地多组织、多机构对企业财务汇总的管理需求;全面支持企业对远程仓库、异地办事处的管理需求;全…

2015年认证杯SPSSPRO杯数学建模A题(第二阶段)绳结全过程文档及程序

2015年认证杯SPSSPRO杯数学建模 A题 绳结 原题再现: 给绳索打结是人们在日常生活中常用的技能。对登山、航海、垂钓、野外生存等专门用途,结绳更是必不可少的技能之一。针对不同用途,有多种绳结的编制方法。最简单的绳结,有时称…

【手把手教学】如何可视化YOLOv8深度学习的网络结构并保存

《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ 👍感谢小伙伴们点赞、关注! 《------往期经典推…

Vue.js 3.4的新特性

Vue.js 3.4的新特性 目前,Vue.js的版本已经更新到3.4,这次更新不仅带来了性能上的飞跃,还引入了许多新特性,进一步优化了开发效率。 1. 性能提升 在性能方面,Vue.js 3.4 全新重写了模板解析器。与之前基于正则表达式…

如何将视频存储云端扫码调取?扫码看视频的在线制作方法

视频二维码是现在常用的一种分享视频的方法,其他人只需要扫描二维码就可以在手机上播放视频内容。采用这种方式可以获得更快的传播速度,而且视频存储在云端也不回占用扫码者的内容,通过点击消耗流量就可以查看视频内容,有效的提升…

对HW 钓鱼简单样本分析以及制作

记录某个对某个钓鱼事件中获取的钓鱼样本进行分析,以及简单的制作学习 样本行为分析 首先看到是 qq 邮箱发来的某个压缩包大概本身是带密码的,反手就丢到虚拟机先看下大概文件,解压后是这样的一个快捷方式 然后打开属性查看快捷方式&#x…

智能楼宇3D可视化解决方案

什么是智能楼宇? 智能楼宇是为提高楼宇的使用合理性与效率,配置合适的建筑环境系统与楼宇自动化系统、办公自动化与管理信息系统以及先进的通信系统,并通过结构化综合布线系统集成为智能化系统的大楼。 面临的问题 信息孤岛,无法统一管理 各个子系统独立工作、独立管理,…

JD Edwards 怎么编写和测试BSSV

BSSV对象发布到本地服务器 提示:只针对BSSV 程序名J开头的程序本地编写和发布测试 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 BSSV对象发布到本地服务器前言一、J程序有什么作用?二、1…

智慧型一体化污水处理设备有哪些

智慧型一体化污水处理设备是目前污水处理行业中的一项创新技术,它能够以更高效、更环保的方式处理污水,实现对水资源的节约和保护。下面将详细介绍智慧型一体化污水处理设备的几个主要方面。 首先,智慧型一体化污水处理设备采用了先进的处理工…