Knowledge-refined Denoising Network for Robust Recommendation(Sigir23)
摘要
知识图(KG)包含丰富的边信息,是提高推荐性能和可解释性的重要组成部分。然而,现有的知识感知推荐方法直接在KG和用户-项目二部图上进行信息传播,忽略了任务无关知识传播的影响和易受交互噪声的影响,限制了其性能。针对上述问题,本文提出了一种鲁棒的知识感知推荐框架-知识细化去噪网络(KRDN),该框架能够同时修剪与任务无关的知识关联和有噪声的隐式反馈。KRDN包括自适应知识精炼策略和对比去噪机制,分别能够自动提取高质量的KG三元组进行聚合和修剪含噪隐式反馈。
引言
目前基于传播的方法通常有以下两个限制:
- 无效的知识传播
- 容易受到噪声的干扰
本文贡献:
3. 从一个新的角度来处理知识感知的推荐,同时细化知识关联和去噪隐式交互,以细粒度的方式开发了KG中的知识关联,它不仅可以学习根据下游监控信号修剪不相关的三元组,而且可以组合地聚合多方面的事实,以获得高质量的知识表示。
4. 提出了一种对比去噪策略,利用协同和知识两个方面的语义差异来更好地表达和传播用户真实偏好,从而大大增强了推荐的鲁棒性。
问题定义
模型框架
(1)自适应知识精炼,其使用参数化的二进制掩码来学习以无偏梯度估计器去除不相关的事实,同时设计了组合知识聚合器以有效地集成不同种类的知识关联用于上下文传播
(2)对比去噪学习,其关注协作信号和知识信号的差异以对比方式识别噪声交互,并且迭代地执行关系感知图自增强以增强用户表示。
一. 自适应知识精炼
与之前直接将KG中的各种信息集成到项目表示中的基于传播的方法不同,我们的目标是捕获最相关的知识关联,这有利于学习用户偏好。具体来说,我们设计了一个自适应修剪机制,学习修剪无关的事实与可训练的随机二进制掩码,并设计了一个梯度估计器,以共同优化它们与模型。同时,我们认为,现有的方法是无法正确地表征项目,因为他们不区分项目相关的信息,只在一个粗粒度上聚集KG信息。KG中的不同实体对于推荐场景具有不同的语义,并且它们在分析项中扮演不同的角色。这促使我们执行上下文感知的组合聚合机制,根据项目的相关性收集不同的语义。
1. 无关事件修剪
KG包含大量噪声和与任务无关的信息,这些信息是无用的,甚至会降低性能。一个简单的解决方案是手动构建一个K近邻子图来约束节点的感受野[10,33],或者随机丢弃一些边来构建用于对比学习的多视图图结构[53,58]。然而,这些方法高度依赖于图构造的质量,并且不能根据推荐任务自适应地丢弃不必要的边。因此,我们转向一个参数化的方法来共同学习最佳修剪策略与下游的合作信号。从技术上讲,我们首先将T中的每个三元组与二进制掩码∈{0,1}连接起来,以指示是否应该丢弃该三元组,因此修剪后的事实可以表示为:
2.组合知识聚合
将图谱划分为三种集合: T = {T1, T2, T3}
T1 = {(ℎ, 𝑟, 𝑡)|ℎ, 𝑡 ∈ I}as “item-item” facts, as both entities in these triplets are aligned
with items.
T2 = {(ℎ, 𝑟, 𝑡)|ℎ ∈ Ior 𝑡 ∈ I} stands for“item-attribute” facts, which means that one ofthe entities is relatedto item while the other acts as the attribute of it.
The rest tripletsT3 = {(ℎ, 𝑟, 𝑡)|ℎ, 𝑡 ∉ I} are “attribute-attribute” facts,where both entities are represented as attributes
我们用多方面的事实重组KG三元组,可以明确地收集不同的知识关联。为了对消息传递进行去噪,我们提出了一种新的聚合机制,包括噪声消息修剪和组合知识聚合。具体来说,我们使用N = {(𝑟,𝑡)|(G,𝑟,𝑡)∈ G𝑘}来表示KG中的邻域实体和项间的一阶关系,并提出将邻域实体的多面关系上下文进行整合,生成实体间的知识表示:
其中在聚合图谱信息时,不同的视图的聚合方式不同
堆叠多层的嵌入,将多层嵌入求均值,获得最终的实体嵌入
二.对比去噪学习
对比去噪学习主要用于识别用户-项目二分图中的噪声交互,并传播高阶区分协作信号以呈现用户的真实偏好。现有方法忽略了交互中的噪声,并直接聚合来自相邻用户/项目的所有信息,这将使模型难以区分噪声和用户真实偏好,并导致次优的用户/项目表示。最近,一些工作专注于构建不同的图视图,并利用对比学习来增强推荐模型的鲁棒性。不幸的是,这种方法将不可避免地丢失结构信息,并且无法显式地识别假交互。因此,我们的目标是利用协作信号和知识关联之间的分歧,以端到端的方式过滤噪声交互。
1.去噪协作聚合
上个模块生成的的项目表示包含精炼的知识关联,这些知识关联被认为具有高置信度。通过直接从交互图中聚合这些项目信息,我们可以获得用户和项目的知识表示。然而,基于隐式反馈构建的用户-项目图不可避免地包含噪声。因此,我们初始化额外的项目表示,以单独捕获纯合作信号作为比较。为了修剪嘈杂的互动,我们专注于协作和知识信号之间的差异。
KRDN保持了原始的图结构而不是随机扰动[53],因此我们能够使用相对距离来评估作为去噪基础的相对于噪声重要性的噪声稳定性:
2. 图感知自我增强
因为噪声的存在,上述的噪过程不足以降低噪声边缘的权重,并且存在误分类的机会。受邻居路由机制[28]的启发,我们设计了一种关系感知的自增强机制,用于生成上述两种信号中用户和项目之间的增强表示和相关度:
噪声交互将逐渐被疏远,并且用户表示将被递归地调整到用户偏好的原型[47]。
预测层
**