2022年第15届国际网络搜索与数据挖掘会议WSDM在2022年2月21日到25日于线上举行,共收到了786份有效投稿,最终录取篇数为159篇,录取率为20.23%。作为主流的搜索与数据挖掘会议,论文的话题主要侧重于搜索、推荐以及数据挖掘领域,因此该会议大部分的接收论文的主题是围绕着信息检索与推荐系统,下文列举了部分推荐系统方向论文的标题以及摘要,论文地址:
https://www.wsdm-conference.org/2022/accepted-papers/
1 Long Short-Term Temporal Meta-learning in Online Recommendation【在线推荐中的长短期时间元学习,腾讯】
一个有效的在线推荐系统应该能够同时捕捉用户在内部行为(来自目标推荐任务)和外部行为(来自其他任务)中的长期和短期偏好。然而,由于实时训练效率和外部行为获取的现实限制,在充分利用大型系统中所有历史行为的同时快速适应实时新趋势极具挑战性。为了解决这些实际挑战,我们提出了一种用于在线推荐的新型长短期时间元学习框架 (LSTTM)。它将用户多源行为排列在全局长期图和内部短期图中,并进行不同的基于 GAT 的聚合器和训练策略,分别学习用户的短期和长期偏好。为了及时捕捉用户的实时兴趣,我们提出了一种基于 MAML 的时间元学习方法,在异步优化策略下进行快速适应,将不同时间段的推荐视为不同的任务。在实验中,LSTTM 在离线和在线评估中都取得了显着的改进。它目前已部署在广泛使用的微信热门故事在线推荐系统上,影响了数百万用户。
2 It Is Different When Items Are Older: Debiasing Recommendations When Selection Bias and User Preferences are Dynamic【选择偏差和偏好偏差动态变化时的纠偏推荐系统,阿姆斯特丹大学】
用户与推荐系统 (RS) 的交互会受到用户选择偏差的影响,例如,用户更有可能对热门商品(热门偏差)或他们预期会预先喜欢的商品(积极偏差)进行评分。存在一些方法可以减轻用户评分中的选择偏差对 RS 评估和优化的影响。然而,这些方法将选择偏差视为静态的,尽管商品的受欢迎程度可能会随着时间的推移而发生巨大变化,并且用户偏好也可能随着时间的推移而变化。我们关注商品的年龄及其对选择偏差和用户偏好的影响。我们的实验分析表明,考虑商品年龄对偏差和偏好的影响的方法可以更好地捕捉用户在 MovieLens 数据集上的评分行为。我们从理论上表明,在选择偏差和用户偏好都是动态的动态场景中,现有的去偏差方法不再是无偏的。为了解决这一限制,我们在动态场景中引入了去偏算法 (DANCER),这是一种新颖的去偏方法,它扩展了逆倾向评分去偏方法,以考虑动态选择偏差和用户偏好。我们的实验结果表明,与错误地假设选择偏差在动态场景中是静态的去偏方法相比,DANCER 提高了评分预测性能。据我们所知,DANCER 是第一个在 RS 中考虑动态选择偏差和用户偏好的去偏方法。
3 Multi-Sparse-Domain Collaborative Recommendation via Enhanced Comprehensive Aspect Preference Learning【通过增强的综合方面偏好学习的多稀疏域协作推荐,川大】
跨域推荐 (CDR) 因其能够缓解推荐系统中的数据稀疏性问题而受到研究人员越来越多的关注。然而,现有的单目标或双目标 CDR 方法通常存在两个缺点:假设至少有一个富域以及严重依赖域不变偏好,这在稀疏性普遍存在的现实世界中是不切实际的,并且可能会降低用户偏好学习的效果。为了克服这些问题,我们提出了一种用于多目标跨域推荐的多稀疏域协作推荐 (MSDCR) 模型。与传统的 CDR 方法不同,MSDCR 将多个相关域视为所有稀疏域,并且可以同时提高每个域的推荐性能。我们为 MSDCR 提出了一个多域分离网络 (MDSN) 和一个门控方面偏好增强 (GAPE) 模块,通过迁移其他域中的互补方面偏好来增强用户在一个域中的领域特定方面偏好,在此期间,通过 MDSN 提供的对抗性训练可以保留领域特定偏好的唯一性,而互补性可以由 GAPE 自适应地确定。同时,我们为 MSDCR 提出了一个多域自适应网络 (MDAN) 来捕获用户的领域不变方面偏好。通过整合增强的领域特定方面偏好和领域不变方面偏好,MSDCR 可以全面了解用户在每个稀疏域中的偏好。最后,在真实数据集上进行的大量实验证明了 MSDCR 相对于最先进的单域推荐模型和 CDR 模型的显著优势。
4 RecGURU: Adversarial Learning of Generalized User Representations for Cross-Domain Recommendation【用于跨域推荐的广义用户表示的对抗性学习,阿尔伯塔大学,腾讯】
跨域推荐有助于缓解传统顺序推荐系统中的数据稀疏问题。在本文中,我们提出了 RecGURU 算法框架,用于生成一个广义用户表示 (GUR),该表示在顺序推荐中结合了跨域用户信息,即使两个域中只有极少或没有共同用户。我们提出了一个自注意自动编码器来推导潜在用户表示,以及一个域鉴别器,旨在预测生成的潜在表示的原始域。我们提出了一种新颖的对抗性学习方法来训练这两个模块,将不同域生成的用户嵌入统一为每个用户的单个全局 GUR。学习到的 GUR 捕获了用户的整体偏好和特征,因此可用于增强行为数据并改进用户所涉及的任何单个域中的推荐。在两个公共跨域推荐数据集以及从实际应用中收集的大型数据集上进行了广泛的实验。结果表明,RecGURU 提高了性能,并且优于各种最先进的顺序推荐和跨域推荐方法。所收集的数据将会发布以方便未来的研究。
5 Personalized Transfer of User Preferences for Cross-domain Recommendation【跨域推荐用户偏好的个性化传输,中国科学院计算技术研究所,微信团队】
冷启动问题在推荐系统中仍然是一个非常具有挑战性的问题。幸运的是,辅助源域中冷启动用户的交互可以帮助目标域中的冷启动推荐。如何将用户的偏好从源域转移到目标域,是跨域推荐(CDR)的关键问题,而跨域推荐是解决冷启动问题的一个有前途的解决方案。大多数现有方法都建模一个通用的偏好桥来为所有用户转移偏好。直观地说,由于每个用户的偏好各不相同,不同用户的偏好桥应该不同。沿着这个思路,我们提出了一个新颖的框架,称为跨域推荐的个性化用户偏好转移(PTUPCDR)。具体而言,学习一个以用户特征嵌入为输入的元网络来生成个性化的桥接函数,从而为每个用户实现个性化的偏好转移。为了稳定地学习元网络,我们采用了面向任务的优化程序。利用元生成的个性化桥接函数,可以将源域中用户的偏好嵌入转换到目标域中,并将转换后的用户偏好嵌入用作目标域中冷启动用户的初始嵌入。我们使用大量真实数据集进行了广泛的实验,以评估 PTUPCDR 在冷启动和热启动阶段的有效性。代码已提供:
https://github.com/easezyc/WSD
6 An Adaptive Unified Allocation Framework for Guaranteed Display Advertising【一种用于保证展示广告的自适应统一分配框架,阿里】
保证展示 (GD) 广泛应用于电子商务营销,广告主可通过这种方式获得与目标受众商定的展示次数。在合同约束下,最大化合同投放率是主要目标,用户兴趣(如点击率和转化率)对于提高广告主和电子商务平台的长期投资回报率也至关重要。在本文中,我们设计了一个自适应统一分配框架 (AUAF),不仅考虑请求级别的受众展示供应,还避免受众展示的过度分配。具体而言,我们的分配模型同时优化了合同投放以及广告与用户兴趣之间的匹配,并带有明确的约束,以防止不必要的分配。面对每天处理十亿级请求的挑战,我们还开发了一种基于参数服务器的并行优化算法,使所提出的分配模型能够在几分钟内高效优化并逐步更新。因此,离线优化结果和在线决策可以同步以进行实时服务。换句话说,我们的方法可以实现与最佳分配解决方案一致的自适应节奏。我们大量的实验结果表明,所提出的 AUAF 框架可以提高合同投放率和平均点击率 (CTR),本文中我们使用 CTR 来衡量用户兴趣。与现有方法相比,CTR 的改进具有统计意义。此外,自 2020 年 3 月以来,AUAF 已部署在阿里巴巴的保证展示广告系统中,在不损失合同投放率的情况下将 CTR 提高了 10% 以上,为业务创造了巨大的价值。
7 Joint Learning of E-commerce Search and Recommendation with A Unified Graph Neural Network【电子商务搜索和推荐与统一图神经网络的联合学习,阿里推荐】
点击率 (CTR) 预测在搜索和推荐中起着重要作用,而搜索和推荐是电子商务中两个最突出的场景。已经提出了许多模型来通过挖掘用户行为(尤其是用户与商品的交互)来预测 CTR。但用户行为的稀疏性是 CTR 预测改进的障碍。以前的研究只关注一个场景,要么是搜索,要么是推荐。然而,在实际的电子商务平台上,搜索和推荐共享同一组用户和商品,这意味着两种场景的联合学习可以缓解用户行为的稀疏性。在本文中,我们提出了一种新颖的搜索和推荐联合图 (SRJGraph) 神经网络,以联合学习两种场景的更好 CTR 模型。联合学习的一个关键问题是如何在搜索和推荐之间存在差异的情况下有效地共享信息。搜索和推荐之间的一个显着区别是搜索中有明确的查询,而推荐中没有查询。我们通过构建统一的图来解决这一差异,以在搜索和推荐之间共享用户和商品的表示,并统一表示用户-商品交互。在此图中,用户和项目是异构节点,搜索查询作为属性纳入用户-项目交互边。对于不存在查询的推荐,在用户-项目交互边上附加一个特殊属性。我们进一步提出了一个意图和上游感知聚合器,以从用户和项目之间的高阶连接中探索有用的信息。我们对从中国最大的电子商务平台淘宝网收集的大规模数据集进行了广泛的实验。实证结果表明,SRJGraph 在搜索和推荐任务中的表现都明显优于最先进的 CTR 预测方法。
8 Modeling Scale-free Graphs with Hyperbolic Geometry for Knowledge-aware Recommendation【使用双曲几何建模无标度图以进行知识感知推荐,香港中文大学】
为了缓解传统推荐系统的数据稀疏和冷启动问题,加入知识图谱(KG)来补充辅助信息的研究近来引起了广泛关注。通过将包含用户-物品交互的 KG 统一为三部图,近期的研究探索了图的拓扑结构,以学习具有丰富语义的用户和物品的低维表示。这些现实世界的三部图通常是无标度的,然而,现有研究并未强调其内在的层次化图结构,因此导致推荐性能不佳。为了解决这个问题并提供更准确的推荐,我们提出了一种基于双曲几何的 Lorentz 模型的知识感知推荐方法,即用于推荐的 Lorentzian 知识增强图卷积网络(LKGR)。数据统一后,LKGR 有助于更好地建模无标度三部图。具体而言,我们在双曲空间中采用不同的信息传播策略来显式编码来自历史交互和 KG 的异构信息。此外,我们提出的知识感知注意机制使模型能够自动测量信息贡献,从而在双曲空间中产生连贯的信息聚合。在三个真实世界基准上进行的大量实验表明,LKGR 在 Top-K 推荐中的 Recall@20 比最先进的方法高出 3.6-15.3%。
9 Enumerating Fair Packages for Group Recommendations【枚举组推荐的公平包,京都大学】
枚举组推荐系统向一群人推荐一组统一的项目。与传统设置不同,由于涉及多个用户,因此很难衡量组推荐的效用。特别是,公平性在组推荐中至关重要。即使组中的某些成员对推荐基本满意,也不希望忽略其他成员来提高总效用。文献中提出了许多评估和应用组推荐公平性的方法。然而,所有这些方法都最大化了分数并只输出一个包。这与传统的推荐系统形成了对比,后者输出多个(例如,前 K 个)候选包。这可能会有问题,因为即使分数很高,一个组也可能由于一些未观察到的原因对推荐的包不满意。为了解决这个问题,我们提出了一种有效枚举公平包的方法。我们的方法还支持过滤查询,例如前 K 个和交集,以便在列表很长时选择最喜欢的包。我们确认我们的算法可以扩展到大型数据集,并且可以平衡包效用的几个方面。
10 Contrastive Learning for Representation Degeneration Problem in Sequential Recommendation【序列推荐中表征退化问题的对比学习,昆士兰大学】
Transformer 和 BERT 等序列深度学习模型的最新进展极大地促进了序列推荐。然而,根据我们的研究,这些模型生成的项目嵌入的分布倾向于退化为各向异性形状,这可能导致嵌入之间的语义相似性很高。本文首先对这种表示退化问题进行了经验和理论研究,并在此基础上提出了一种新的推荐模型 DuoRec 来改善项目嵌入分布。具体而言,考虑到对比学习的均匀性,为 DuoRec 设计了一个对比正则化来重塑序列表示的分布。鉴于推荐任务是通过点积来测量同一空间中序列表示和项目嵌入之间的相似性来执行的惯例,正则化可以隐式地应用于项目嵌入分布。现有的对比学习方法主要依赖于通过项目裁剪、屏蔽或重新排序对用户-项目交互序列进行数据级增强,并且很难提供语义一致的增强样本。DuoRec 提出了一种基于 Dropout 的模型级增强方法,以实现更好的语义保留。此外,还开发了一种新颖的采样策略,其中具有相同目标项的序列被选为硬正样本。在五个数据集上进行的大量实验证明了所提出的 DuoRec 模型与基线方法相比具有优越的性能。学习到的表示的可视化结果验证了 DuoRec 可以大大缓解表示退化问题。
11 Sequential Modeling with Multiple Attributes for Watchlist Recommendation in E-Commerce【电子商务中观察列表推荐的多属性序列建模【IBM,eBay】
在电子商务中,关注列表使用户能够随时间跟踪商品,并已成为主要功能,在用户的购物旅程中发挥着重要作用。关注列表项目通常具有多个属性,这些属性的值可能会随时间而变化(例如价格、数量)。由于许多用户在他们的关注列表中积累了数十个项目,并且购物意图会随时间而变化,因此在给定上下文中推荐顶级关注列表项目可能很有价值。在这项工作中,我们研究了电子商务中的关注列表功能,并介绍了一种新颖的关注列表推荐任务。我们的目标是通过预测用户将点击的下一个项目来确定用户接下来应该关注哪些关注列表项目的优先级。我们将此任务视为专门的顺序推荐任务并讨论其特征。我们提出的推荐模型 Trans2D 建立在 Transformer 架构之上,我们进一步提出了一种新颖的扩展注意力机制 (Attention2D),允许从具有多个项目属性的顺序数据中学习复杂的项目-项目、属性-属性和项目-属性模式。使用来自 eBay 的大规模关注列表数据集,我们评估了我们提出的模型,并证明了它与多个最先进的基线相比的优越性,其中许多基线都适用于此任务。
12 Show Me the Whole World: Towards Entire Item Space Exploration for Interactive Personalized Recommendations【面向交互式个性化推荐的整个商品空间探索,华中科技大学】
用户兴趣探索是推荐系统中一个重要且具有挑战性的课题,它可以缓解推荐模型和用户-项目交互之间的闭环效应。上下文老虎机(CB)算法力求在探索和开发之间取得良好的平衡,以便用户的潜在兴趣有机会暴露出来。然而,经典的CB算法只能应用于一个小的采样项目集(通常数百个),这使得推荐系统中的典型应用仅限于候选帖子排名、主页热门项目排名、广告创意选择或在线模型选择(A / B测试),在本文中,我们介绍了两种简单但有效的分层CB算法,使经典的CB模型(如LinUCB和Thompson Sampling)能够探索用户在整个项目空间中的兴趣,而不局限于一个小的项目集。我们首先通过自下而上的聚类算法构建层次项目树,以由粗到细的方式组织项目。然后我们提出了一种分层CB(HCB)算法来探索层次树中的用户兴趣。HCB 将探索问题视为一系列决策过程,其目标是找到从根到叶节点的路径,并将反馈反向传播到路径上的所有节点。我们进一步提出了一种渐进式分层 CB (pHCB) 算法,该算法逐步扩展达到置信度水平的可见节点进行探索,以避免在顺序决策过程中对上层节点采取误导性行动。在两个公共推荐数据集上进行的大量实验证明了我们方法的有效性和灵活性。