多模态推荐系统综述:五、挑战

五、挑战

1、Multimodal Recommender Systems: A Survey 2023

•通用解决方案。 值得注意的是,尽管针对模型中的不同阶段提出了一些方法[24],但没有提供这些技术组合的最新通用解决方案。

•模型可解释性。 多模态模型的复杂性会使系统生成的建议难以理解和解释,从而限制系统的信任和透明度。虽然很少有先驱者提到它,但它仍然需要探索。

•计算复杂性。 MRS需要大量数据和计算资源,因此难以扩展到大型数据集和总体。多模态数据和模型的复杂性会增加生成推荐所需的计算成本和时间,这给实时应用带来了挑战。

•通用MRS数据集。 目前,MRS的数据集仍然有限,涉及的模式不够广泛。此外,不同模式的数据质量和可用性可能会有所不同,这会影响建议的准确性和可靠性。

2、A Comprehensive Survey on Multimodal Recommender Systems: Taxonomy, Evaluation, and Future Directions 2023

2.1 如何有效融合多模态信息?

(1)找出有效的模态融合方法,能够捕获单一模态无法包含的互补信息。 每种模态可能捕获项目的不同方面,我们应该找到一种方法将它们融合在一起,同时保留特定于模态的信息,以学习包含单一模态表示无法包含的补充信息的多模态表示。但对于某些模型,单一模态也能取得比同时利用多模态信息更好的性能。如果模型能够有效地融合多模态特征,推荐精度应该比利用单一模态特征更高。
(2)如何解决模态缺失问题并重构有意义的表示。 模态缺失问题在现实世界中很常见。然而,一些模型假设所有模态信息在训练和推理过程中都是可用的,这在面对不完整和缺失模态时将不起作用。LRMM通过利用生成模型来重建特定于模态的嵌入并估算缺失的模态,从而减轻了模态缺失和冷启动问题。
LRMM: Learning to Recommend with Missing Modalities 2018
在这里插入图片描述

LRMM概述。采用CNN进行可视化嵌入(粉红色部分),采用三个LSTM分别对用户评论文本(红色部分)、项目评论文本(绿色部分)和项目元数据(蓝色部分)进行文本嵌入。生成(自动编码)模型用于重建模态特定嵌入和填充缺失模态。缺少user和item review文本分别导致基于user和item的冷启动。

2.2 如何规范数据分割策略和使用的通用数据集?

找到具有合适提取技术和合适分割策略的最佳预处理方法,以标准化实验的训练/测试集。
(1)正如前面的实验所示,即使使用相同的数据集和评估指标,模型使用不同的数据分割策略也会得到不同的性能数据,模型性能的排名也会受到不同分割策略的影响。
(2)虽然最常用的是随机分割,但基于时间的分割更接近现实场景。鲁棒的多模态推荐模型无论是随机分割还是时间分割都应该表现良好。
(3)用于多模态推荐的数据集并不标准化,而且审稿论文中使用的大多数数据集都不像快手、抖音和大众点评那样公开。
(4)特征提取技术也会影响学习到的最终表示,每篇论文都使用不同的技术。

2.3 评估指标

推荐模型的评价是一个重要的研究课题。 推荐系统不仅要考虑准确性,还要考虑其他推荐质量,如推荐列表的多样性和独特项的存在,这可能会对推荐系统的整体质量产生重大影响。
文献[11]指出,通用推荐的评价指标可能不完全适用于多模态推荐。

2.4 研究与应用差距

(1)在面对大数据集时如何平衡模型的复杂度和可扩展性。
(2)高维张量和多模态信息的计算效率。

2.5 多模态顺序推荐

序贯推荐系统不同于使用协同过滤和基于内容过滤的推荐系统,因为它试图理解和建模用户随时间变化的序贯行为。多模态信息会极大地影响用户的偏好,然而现有的序贯推荐模型大多忽略了这些有用信息。MML结合了项目的多模态边信息,以改进和稳定元学习过程,并帮助解决冷启动问题。因此,在序贯推荐系统中利用多模态信息将是今后工作的一个重要方向。

2.6 跨域推荐

跨域推荐系统利用来自其他域或平台的行为信息来提高目标域的性能。常用的技术依赖于显式重叠数据(例如,公共用户和项目)跨域传输数据。最近,一些工作学习了用户和项目的通用表示,可以应用于跨域推荐。UniSRec利用文本信息学习通用项目表示,而不需要公共用户和项目,这可能适用于不同的领域。在未来,利用多模态信息可能有助于模型学习通用表示。

UniSRec: Towards Universal Sequence Representation Learning for Recommender Systems. 2022
为了开发有效的序列推荐器,提出了一系列序列表示学习(SRL)方法来对历史用户行为进行建模。大多数现有的SRL方法都依赖于显式项目ID来开发序列模型,以更好地捕获用户偏好。尽管这些方法在一定程度上是有效的,但由于显式建模项目ID的局限性,很难推广到新的推荐场景。
为了解决这个问题,我们提出了一种新的通用序列表示学习方法UniSRec。该方法利用项目的相关描述文本学习不同推荐场景下的可转换表示。为了学习通用项目表示,设计了一种基于参数白化和专家混合增强适配器的轻量级项目编码体系结构。为了学习通用序列表示,我们引入了两个对比的预训练任务,通过采样多域否定。利用预先训练好的通用序列表示模型,我们的方法可以在归纳和直推两种情况下以参数有效的方式有效地转移到新的推荐域或推荐平台。
在这里插入图片描述

参考论文

Multimodal Recommender Systems: A Survey

A Comprehensive Survey on Multimodal Recommender Systems: Taxonomy, Evaluation, and Future Directions

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/302310.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构篇】数据结构中的 R 树和 B 树

数据结构中的 R 树和 B 树 ✔️关于R树(RTree)✔️什么是B树(B-tree)✔️B树和B树的区别✔️B树和B树在数据存储方面的具体差异 ✔️拓展知识仓✔️R树和B树的区别✔️ 那在内存消耗上有什么区别?✔️ R树有哪些优点和…

【数据库】mysql事务

一、事务的基本概念 1、事务的定义 事务可由一条非常简单的SQL语句组成,也可以由一组复杂的SQL语句组成。。 在 MySQL 中只有使用了 Innodb 数据库引擎的数据库或表才支持事务。事务处理可以用来维护数据库的完整性,保证成批的 SQL 语句要么全部执行&…

海外代理IP在游戏中有什么作用?

随着科技的飞速发展,手机和电脑等电子产品已成为互联网连接万物的重要工具,深度融入我们的日常生活,我们借助互联网完成工作、休闲和购物等任务,以求提升生活质量。 不仅如此,网络游戏也是人们心中最爱,它…

2024.1.8每日一题

LeetCode 回旋镖的数量 447. 回旋镖的数量 - 力扣(LeetCode) 题目描述 给定平面上 n 对 互不相同 的点 points ,其中 points[i] [xi, yi] 。回旋镖 是由点 (i, j, k) 表示的元组 ,其中 i 和 j 之间的距离和 i 和 k 之间的欧式…

Prometheus Blackbox_exporter笔记

一、安装Promtheus 在 Prometheus 官网 Download | Prometheus 获取适用于 Linux 的 Prometheus 安 装包,这里我选择最新的 2.46.0 版本,我是 Linux 系统,选择下载 prometheus-2.46.0.linux-amd64.tar.gz 下载安装包: wget htt…

UI自动化测试神器:RunnerGo

UI自动化测试已经成为现代软件开发过程中不可或缺的一部分。它能够提供诸多优势,包括提高测试效率、减少人力成本、提升软件质量等。同时,可视化工具为UI自动化测试带来了更多便利和灵活性。然而,可视化工具也存在一些潜在的劣势。本文将探讨…

读元宇宙改变一切笔记01_起源

1. 元宇宙是我们下一个生存之地 1.1. 1968年,只有不到10%的美国家庭拥有彩色电视,但当年票房排名第二位的电影《2001:太空漫游》(2001: A Space Odyssey)设想了这样的未来 1.1.1. 斯坦利库布里克(Stanley Kubrick) …

二 数据查询

1、实验目的 理解SQL成熟设计基本规范,熟练运用SQL语言实现数据基本查询,包括但表查询、分组统计查询和连接查询。 2、实验内容及要求 针对数据库设计各种单表查询SQL语句、分组统计查询语句;设计单个表针对自身的连接查询,设计…

lc 140. 单词拆分 II

回溯算法查询匹配单词 class Solution { public:unordered_map<string, int> word_map;void mapping(vector<string>& wordDict){for(auto &a : wordDict)word_map[a];}vector<string> ret;// s: 原始字符串// tmp: 已查询到的单词// …

【Flutter 开发实战】Dart 基础篇:最基本的语法内容

在深入了解 Dart 这门编程语言之前&#xff0c;我们需要了解一些关于 Dart 的最基本的知识&#xff0c;像是常量、变量、函数等等&#xff0c;这样才能够让我们的开发效率更上一层楼。在本节&#xff0c;我们将探讨一些基础语法&#xff0c;包括入口方法 main、变量、常量以及命…

光伏组件QUV紫外加速老化试验箱

一、产品特点 QUV紫外加速老化试验箱能模拟阳光中 UV340波段光谱的荧光紫外灯&#xff0c;并结合控温、供湿等装置来模拟对材料造成变色、亮度、强度下降&#xff1b;开裂、剥落、粉化、氧化等损害的阳光&#xff0c;以及高温、高湿、凝露、黑暗周期等因素&#xff0c;同时通过…

Linux文件系统与日志分析管理

目录 一、文件系统 1. inode表 2. 查看inode号 3. 文件目录 4. 三种时间戳 5. 删除文件空间不释放 6. 文件恢复extundelete 7. xfs类型备份和恢复 二、日志分析 1. 日志的种类 2. 内核和公共日志 3. 用户日志 3.1 查询当前登录的用户情况 3.2 查询用户登录的历史记…

Linux-添加虚拟内存,不添加硬盘方式操作

在linux中&#xff0c;当物理内存mem不足时&#xff0c;就会使用虚拟内存(swap分区) 例如增加2G虚拟内存&#xff0c;操作如下: 1.查看内存大小 [rootlocalhost ~]# free -m 2.创建要作为swap分区的文件:增加1GB大小的交换分区&#xff0c;则命令写法如下&#xff0c;其中的cou…

免费的开源低代码平台推荐

1.JNPF 最后&#xff0c;推荐一个近期用的不错的低代码。 应用地址&#xff1a;https://www.jnpfsoft.com?csdn 开发语言&#xff1a;Java/.net 这是一个基于 Java Boot/.Net Core 构建的简单、跨平台快速开发框架。前后端封装了上千个常用类&#xff0c;方便扩展&#xf…

Redis分布式锁(二)基于Redis的分布式锁

一、redis锁 1、思路 利用set nx ex获取锁&#xff0c;并设置过期时间&#xff0c;保存线程标识释放锁时先判断线程标识是否与自己一致&#xff0c;一致则删除 2、特性 利用set nx满足互斥性利用set ex保证故障时锁依然能释放&#xff0c;避免死锁&#xff0c;提高安全性利…

普冉32位单片机 PY32C642,M0+内核,1.7 V ~ 5.5 V宽工作电压

PY32C642 单片机采用高性能的 32 位 ARM Cortex-M0内核&#xff0c;宽电压工作范围。嵌入 24Kbytes Flash 和 3 Kbytes SRAM 存储器&#xff0c;最高工作频率 24 MHz。包含多种不同封装类型产品。工作温度范围为-40C ~ 85C&#xff0c;工作电压范围 1.7 V ~ 5.5 V。1 路 12 位A…

影响代理IP稳定性的因素有哪些?

代理IP作为一种网络服务&#xff0c;在生活中扮演着各种各样的角色。它们可以用于保护隐私、突破访问限制、提高网络安全性等。代理IP的稳定性受到多种因素的影响&#xff0c;下面和大家探讨一下影响代理IP稳定性的因素。 1、网络环境&#xff1a;代理IP所处的网络环境对它的稳…

【一】达梦数据库安装和使用-Windows

达梦数据库安装和使用-Windows 简介&#xff1a; 新能源行业关系到国计民生&#xff0c;保障能源安全的意识不容懈怠&#xff0c;近些年各行各业都在推进数字化进程&#xff0c;能源行业在国家3060双碳目标提出之后更是进行的如火如荼&#xff0c;能源互联网方面在数字化的同时…

【设计模式】访问者模式

一起学习设计模式 目录 前言 一、概述 二、结构 三、案例实现 四、优缺点 五、使用场景 六、扩展 总结 前言 【设计模式】访问者模式——行为型模式。 一、概述 定义&#xff1a; 封装一些作用于某种数据结构中的各元素的操作&#xff0c;它可以在不改变这个数据结构…

URL编码揭秘:为什么要进行URL编码?

URL&#xff08;Uniform Resource Locator&#xff0c;统一资源定位符&#xff09;是互联网上资源地址的唯一标识符。在网络请求和数据传输过程中&#xff0c;URL编码起着至关重要的作用。 URL编码解码 | 一个覆盖广泛主题工具的高效在线平台(amd794.com) https://amd794.com…