推荐系统研究综述 - 中国知网
传统推荐方法主要分类:
1)基于内容推荐方法
主要依据用户与项目之间的特征信息,用户之间的联系不会影响推荐结果,所以不存在冷启动和稀疏问题,但是基于内容推荐的结果新颖程度低并且面临特征提取的问题。
基于内容的推荐方法的思想非常简单,就是向用户推荐与他们过去兴趣相似的项目。
2)协同过滤推荐方法
是目前应用最为广泛的一种方法, 不需要有关用户或项目的信息,只基于用户和诸如点击、浏览和评级等项目的交互信息做出准确的推荐。虽然该方法简单有效但是会存在稀疏矩阵和冷启动的问题。
基于用户的协同过滤:
首先根据用户偏好计算用户之间的相似度,找出与目标用户相似度高的用户,然后预测出目标用户对相似用户感兴趣物品的评分,最后将评分最高的若干个物品推荐给用户。
换句话说,假设我们相似度很高,都喜欢篮球明星,你喜欢库里和汤普森,我喜欢库里,那么系统可以将汤普森推荐给我。
基于项目的协同过滤:
项目的协同过滤是物品和物品之间的相似度,找到了目标用户对某些物品的评分,那么我们就可以对相似度高的类似物品进行预测,将评分最高的若干个相似物品推荐给用户。
换句话说,你同时购买了两个牌子的洗面奶,你对他们的评分很相近,我购买了其中的一个牌子的洗面奶,那么系统可以将另外一个牌子的洗面奶推荐给我。
3)混合推荐方法
融合了前2种传统推荐方法的特点,能取得很好的推荐效果,但在处理文本、图像等多 源异构辅助信息时仍面临一些挑战与困难。
依据神经网络基于深度学习的推荐方法主要分为4类:
1)基于深度神经网络(DNN)的推荐方法
深度神经网络(
Deep Neural Network
,
DNN
)是深度学习模型中的一种
也可以叫作多层神经网络或多层感知机 (Multi
-
Layer Perceptron
,
MLP
)。目前,在个性化推荐问题中 引入深度神经网络技术的趋势越来越明显。
首次将深度神经网络模型融入到视频推荐领域,并在 YouTube
视频网站进行了仿真实验
推荐过程分为候选集生成和视频排序两个阶段。
候选集生成阶段可以视为一个视频筛选的过程,即根据用户的观看记录从已有的视频中选择和用户观看历史记录相似的视频集合作为下次推荐的候选视频。
排序阶段则是从不同特征维度对视频进行分析,通过加权的逻辑回归输出层获得用户点击某类视频的概率预测。预测值与用户感兴趣的视频类型越相似,其得分就越高,最终选取得分最高的几十个视频作为推荐结果。
- 特点:DNN是一种包含多个隐藏层的前馈神经网络,每一层都对输入数据进行非线性变换。
- 应用:广泛应用于图像和语音识别、分类和回归任务。
- 挑战:不具有处理时间序列数据的内在能力,且可能需要大量的参数调整和训练数据。
2)卷积神经网络(CNN)的推荐方法
卷积神经网络(
Convolutional Neural Network
,
CNN)
的最大特点是具有表征学习能力,是包含深度卷积计算的前馈神经网络,它的核心是隐含层和卷积层的相互连接,常见的三 种 性 能 较 好 的 CNN
模 型 有
VGGNet
、
GoogLeNet
和 ResNet。
- 特点:CNN是一种特殊类型的DNN,它通过卷积层来提取局部特征,并通过池化层来降低特征的空间维度。
- 应用:主要用于图像和视频处理,如图像分类、目标检测和图像分割。
- 优势:能够有效地处理具有网格结构的数据,减少参数数量并提高计算效率。
3)基于循环神经网络(RNN)的推荐方法
循环神经网络(
Recurrent Neural Network
,
RNN)
包括双向循环神经网络和长短期记忆(Long Short Term Memory
, LSTM)网络。在深度神经网络中,模型训练好之后在输入层给定一个 x
,在输出层就能得到特定的
y
,但只适合于前后输 入完全没有关系的序列。在推荐方面通常使用 LSTM
和门控循环单元(Gated Recurrent Unit
,GRU)处理推荐问题中的长序列信息。
LSTM
和
GRU
属于
RNN
的改进版本,它们的关键是可以捕捉到序列比较长的 n
元信息序列,最大优势是能够为前后有关联的序列信息建模,已经在新闻推荐
、文字翻译、语音识别
等领域得到了广泛的应用。
- 特点:RNN具有处理序列数据的能力,通过在网络中引入循环连接来传递和记忆之前的状态信息。
- 应用:主要用于处理时间序列数据,如自然语言处理、语音识别和视频处理中的时序分析。
- 挑战:容易受到梯度消失或梯度爆炸的影响,需要特殊结构(如LSTM和GRU)来缓解这些问题。
4)基于图神经网络(GNN)的推荐方法
图神经网络(
Graph Neural Network
,
GNN
)借鉴
RNN
和 CNN的思想,是一种重新定义和设计的用于处理非欧氏空间 。数据的深度学习算法。在实际的生活中,电子商务、推荐系统、动作识别等领域的数据抽象出来都是节点之间链接不固 定的图谱,这些图谱不具备规则的空间结构,而 GNN
模型可以对该类数据进行高效的建模,精确地捕获到数据之间潜在的联系。
- 特点:GNN是一类用于处理图结构数据的神经网络,它能够捕捉节点之间的复杂关系和图的全局结构。
- 应用:适用于社交网络分析、推荐系统、知识图谱和分子结构分析等领域。
- 挑战:需要有效地定义和计算图结构数据的表示,以及处理大规模和动态变化的图