08 模型演化根本 深度学习推荐算法的五大范式

易经》“九三:君于终日乾乾;夕惕若,厉无咎”。九三是指阳爻在卦中处于第三位,已经到达中位,惕龙指这个阶段逐渐理性,德才已经显现,会引人注目;但要反思自己的不足,努力不懈,日夜警惕戒备,即使处于危境,也可无咎。

模块三我们将讲解深度学习推荐算法,这部分近年来发展迅速,我们将学习和掌握最有影响力的深度学习推荐算法及其发展脉络。

上一课时《07 | 物以类聚,基于特征的七种算法模型》,我们讲到传统机器学习组合 GDBT+LR 模型开启了特征工程化和端到端学习的开端,而深度学习的发展将继续延续了这一趋势。

神经网络的结构更加复杂和灵活多变,所以复杂的网络结构就需要更多、更丰富的样本去拟合参数,这样对算力的要求也就高了很多。但是深度学习能够全自动从原有数据中提取到有用特征,而对于处理文本、图像、语音等非结构化数据,人工筛选是基本不可能完成,所以我们说深度学习具有传统机器学习无法比拟的优势。

因此,从这一讲开始我们进入激动人心的深度学习算法部分。

进入深度学习时代后,推荐模型主要有以下两个方面的进展:

  • 与传统模型相比,深度学习模型的表达能力更强,且能够从数据中挖掘出更多隐藏的模式;

  • 深度学习模型结构非常灵活,它能够根据业务场景和数据特点灵活调整模型结构,使得模型与应用场景实现完美契合。

《道德经》中“道之在天下,犹川谷之于江海;为天下谷,常德乃足,复归于朴。朴散则为器,圣人用之,则为官长,故大制不割。”这句话主要阐述了“见素抱朴”的思想。

在光怪陆离、纷繁芜杂的世界,我们只有剥离事物的表面现象,找到事物的本质,才能把握一切事物的变化规律,并据此预测事物的发展趋势,也就是所谓的“降维”思想。

而机器学习的过程就是对世界降维理解的过程,其中用户的隐向量是对用户的降维理解,物品的隐向量是对物品的降维理解,这就是我们说的“朴”。

那么,我们应该如何找到“朴”呢?也就是如何找到事物的本质呢?

在深度学习中,通过找到一些范式方法,并将这些范式方法应用到范式模型中,我们就可以得到“朴”。

所谓的范式模型,是指其他模型基于此范式演化的基础模型。

得到的“朴”如果不够精确,我们则可以通过改进范式与范式的组合方式,来拟合反馈更加精确的“朴”,这就形成了推荐系统的深度学习体系。

这也是这一讲的重点内容,下面我们着重介绍一下。在推荐系统中,深度学习的范式模型分为多层感知器(MLP)、自编码器(AE)、受限玻尔兹曼机(RBM)、卷积神经网络(CNN)、循环神经网络(RNN)这五种,下面我们逐一说明一下。

多层感知器(MLP)—— 最通用组件

目前多层感知器(Muti-Layer Perception)在推荐领域应用甚为广泛,它是一种简单、原汁原味的神经网络,能有效地建模高阶特征之间的交互,属于深度推荐算法中最通用的组件,并且其他的各种范式都是由此演变而来。

最典型的 MLP 包括三层:输入层、一个或多个隐藏层和输出层。MLP 神经网络的不同层之间是全连接的;每个神经元上面都有一个输入权重、偏置量和激活函数。

MLP 已被证明是一种通用的函数近似方法,可以拟合复杂的函数或解决分类问题。

自编码器(AE)—— 学习隐向量表征

自编码器(AutoEncoder)是最常见的神经网络无监督模型,主要用于特征降维或特征提取。

AE 一般由编码器(Encoder)和解码器(Decoder)组成,

  • 这里可以理解为学习到输入数据的隐向量表征称为编码;

  • 用隐向量表征重构出原始输入数据称为解码。

模型目的在于,使输入和输出无限逼近。学习数据的隐向量表征由最中间层计算输出。

自编码器在推荐领域,主要用于学习用户或物品的隐向量表征,然后基于表征预测用户对物品的偏好。需要说明的是,自编码器的适用场景与其训练数据强相关,且因为属于无监督模型,无需标注,可以自动进行样本学习。

受限玻尔兹曼机(RBM)—— 评分预测

受限玻尔兹曼机(Restricted Boltzmann Machine)是一个由可见层和隐藏层组成的双层神经网络无监督模型,两层内部不存在连接,两层之间进行全连接。

RBM 与玻尔兹曼机(Boltzmann Machine)的差别在于:RBM 不存在两层内部连接,而 BM 存在两层内部连接,因为去除了同层之间的连接,从而提高了训练效率。

RBM 在推荐领域,主要用于评分预测,通过学习用户对物品的评分数据进行预测。

卷积神经网络(CNN)—— 提取隐向量表征

卷积神经网络(Convolutional Neural Network)是一种特殊的前馈神经网络,基本结构上包含以下三层:

  • 卷积层,捕捉局部特征;

  • 池化层,可大幅降低模型参数量级,并有效避免过拟合;

  • 全连接层,根据不同的场景和任务输出模型的结果。

可以看出,CNN 把大量参数降维成少量参数再做处理,简化问题域的同时,又不会影响结果。

CNN 在推荐领域,主要用于从图像、文本、音频中提取物品的隐向量表征,并结合用户的隐向量表征进行推荐。

循环神经网络(RNN)—— 序列数据建模

循环神经网络(Recurrent Neural Network)是一种含有反馈结构的神经网络,模型输出不但与当前输入相关,与之前的输入也相关,适用于对序列数据建模。

RNN 在网络各隐层之间的节点是具有连接的,可根据输入层的输出和前一时刻的隐层状态来计算当前时刻的隐层输出,从而具备对过去信息的记忆。

RNN 本身存在梯度消失和梯度爆炸的问题,经过改进网络结构后,如长短时记忆网络(LSTM)和门控循环单元(GRU)等采用了特殊的隐层结构,使得模型具备有效建模长程依赖关系的能力。

RNN 在推荐领域,主要用于对用户行为序列的建模,以及对用户或物品相关文本信息序列的建模等。

【其他范式还有哪些?】

除了上述 5 种常用范式之外,还包括神经自回归分布估计(Neural Autoregressive Distribution Estimation)、对抗网络(Adversarial Networks)等范式。

由于它们在推荐领域的应用比较有限,这一讲中我们就不一一介绍了。

此外,目前注意力机制、深度强化学习等在深度学习领域中发展迅速,在推荐领域深度模型中也有普遍化的趋势,这类模型我们将在“10 | 更深、更专注的 7 种深度推荐范式组合算法”中介绍。

【从 深度网络范式 到 深度学习推荐模型】

利用以上深度网络范式来构成深度学习推荐模型主要有以下两种方法。

1、利用深度网络范式进行用户和物品的表征或者高阶交互特征提取(双塔模型),再将隐向量表征集成到推荐系统模型当中,这里集成方式又分为以下两种。

松耦合:信息呈单向流动,将隐向量表征作为推荐模型的输入。

紧耦合:将深度学习部分作为单独的组件接入模型,再加上其他传统或者深度模型组件,同时进行学习和预测。这种情况下,隐向量表征是跟随模型学习而变化的。

2、利用深度网络范式直接拟合效用函数,这种方式直接利用一个或多个深度网络范式,产出预测结果。

以上方法我们将在后续的课程中逐步讲解。

本节小结

道德经中“道生一,一生二,二生三,三生万物”,说的是“道”的诞生,从无到有产生阴阳二气,阴阳二气相交而形成了“三”,“三”即是万物的范式,通过范式的循环往复地叠加组合产生了万物。

本节介绍了深度推荐方法中的范式,下一节开始我们将逐个介绍基于这些范式方法的深度学习模型。那么关于深度推荐算法,你了解哪些?它们的关系是什么?欢迎与我讨论。

另外,如果你觉得本专栏有价值,欢迎分享给更多好友~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/802016.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu上模拟串口通信

前言 有时候写了一些串口相关的程序,需要调试的时候,又没有硬件,或者需要等其他模块完成才能一起联调。这样搭建环境费时费力,很多问题等到最后联调才发现就已经很晚了。 本文提供一种在ubuntu环境下模拟串口,直接就可…

django报错(一):python manage.py makemigrations,显示“No changes detected”

执行python manage.py makemigrations命令无任何文件生成,结果显示“No changes detected”。 解决方案一: 1、执行命令:python manage.py makemigrations –empty appname 2、删除其中的0001_initial.py文件(因为这个文件内容是…

vue2+antd实现表格合并;excel效果

效果图 一、html <template><div><a-table :columns"columns" :dataSource"dataSource" rowKey"id" :pagination"false" bordered><template slot"content1" slot-scope"text">{{text}}…

单臂路由组网实验,单臂路由的定义、适用情况、作用

一、定义 单臂路由是指通过在路由器的一个接口上配置许多子接口,从而实现原来相互隔离的不同VLAN之间的互通。 子接口:把路由器上的实际的物理接口划分为多个逻辑上的接口,这些被划分的逻辑接口就是子接口。 二、适用情况 用在没有三层交换机,却要实现不同VLAN之间的互…

element ui中el-form-item的属性rules的用法

目录 el-form-item的属性rules的用法 栗子 总结 实践应用 一、 定义静态的校验规则 二、定义动态的校验规则 el-form-item的属性rules的用法 在学习element ui 的Form表单组件时&#xff0c;学到el-form-item也有rules属性&#xff0c;但是对应这个属性如何使用&#x…

【linux】服务器安装及卸载pycharm社区版教程

【linux】服务器安装及卸载pycharm社区版教程 【创作不易&#xff0c;求点赞关注收藏】 文章目录 【linux】服务器安装及卸载pycharm社区版教程1、到官网下载安装包2、通过终端wget下载安装包3、解压4、安装5、设置环境变量6、运行pycharm7、删除pycharm安装包、卸载pycharm …

前端JS特效第34集:jQuery俩张图片局部放大预览插件

jQuery俩张图片局部放大预览插件&#xff0c;先来看看效果&#xff1a; 部分核心的代码如下(全部代码在文章末尾)&#xff1a; <!DOCTYPE html> <html lang"zh"> <head> <meta charset"UTF-8"> <meta http-equiv"X-UA-Co…

大数据环境下的房地产数据分析与预测研究的设计与实现

1绪论 1.1研究背景及意义 随着经济的快速发展和城市化进程的推进&#xff0c;房地产市场成为了国民经济的重要组成部分。在中国&#xff0c;房地产行业对经济增长、就业创造和资本投资起到了重要的支撑作用。作为中国西南地区的重要城市&#xff0c;昆明的房地产市场也备受关…

新版本 idea 创建不了 spring boot 2 【没有jkd8选项】

创建新项目 将地址换成如下 https://start.aliyun.com/

VmWare虚拟机开启wordpress服务并通过服务器内网穿透访问

目录 Ubuntu安装LAMP环境Ubuntu安装wordpress内网穿透服务端客户端 部分问题记录浏览器访问8000端口始终重定向到80端口修改站点url后wordpress无法登陆 曾经在阿里云的服务器上开了个wordpress服务作为个人博客&#xff0c;后来因为域名和服务器续费变贵没有继续续费&#xff…

【螺旋矩阵 II】python刷题记录

本来想着根据上一篇文章中大佬的思路来顺时针转转来改代码&#xff0c;想了一天没搞出来 http://t.csdnimg.cn/7sM8g 于是看了代码随想录的视频 一入循环深似海 | LeetCode&#xff1a;59.螺旋矩阵II_哔哩哔哩_bilibili 总结一下&#xff1a; 模拟的思路&#xff0c;每一圈…

解读|http和https的区别,谁更好用

在日常我们浏览网页时&#xff0c;有些网站会看到www前面是http&#xff0c;有些是https&#xff0c;这两种有什么区别呢&#xff1f;为什么单单多了“s”&#xff0c;会有人说这个网页会更安全些&#xff1f; HTTP&#xff08;超文本传输协议&#xff09;和HTTPS&#xff08;…

筑牢安全防线,促进企业稳定成长

注重技术创新与产业升级&#xff0c;还要高度重视安全管理与可持续发展&#xff0c;才能确保产业园区内企业能够在安全、稳定的环境中持续成长&#xff0c;并为社会和环境做出贡献。 强化安全管理 1、智能化安保系统&#xff1a; 园区采用智能化管理系统&#xff0c;实现对物…

顶顶通呼叫中心中间件-被叫路由、目的地绑定(mod_cti基于FreeSWITCH)

顶顶通呼叫中心中间件-被叫路由、目的地绑定(mod_cti基于FreeSWITCH) 1、配置分机 点击分机 -> 找到你需要设置的分机 ->呼叫路由设置为external&#xff0c;这里需要设置的分机是呼叫的并不是坐席的分机呼叫路由 2、配置拨号方案 点击拨号方案 -> 输入目的地绑定 …

(02)Unity使用在线AI大模型(调用Python)

目录 一、概要 二、改造Python代码 三、制作Unity场景 一、概要 查看本文需完成&#xff08;01&#xff09;Unity使用在线AI大模型&#xff08;使用百度千帆服务&#xff09;的阅读和实操&#xff0c;本文档接入指南的基础上使用Unity C#调用百度千帆大模型&#xff0c;需要…

部署指南

部署指南 https://support.huawei.com/enterprise/zh/doc/EDOC1100368575/e64f745b 总体原则 园区网络作为网络基础设施&#xff0c;为用户提供网络通信服务和访问资源权限&#xff0c;其复杂多样的访问关系以及多种多样的业务类型必然要求园区网的设计要有良好的 设计原则。…

Ubuntu22 Qt6.6 ROS 环境搭建

Ubuntu22.04; Qt6.6; Qt Creator 13.01; ROS2 1. 安装 Qt ROS 插件 1.下载地址&#xff1a; https://github.com/ros-industrial/ros_qtc_plugin/releases 选择对应 Qt Creator 版本的安装包。 2. Qt Creator中&#xff0c;“Help - 关于插件”–>“install Plugin…

Docker容器——初识Docker,安装以及了解操作命令

一、Docker是什么? 是一个开源的应用容器引擎&#xff0c;基于go语言开发并遵循了apache2.0协议开源&#xff0c;用来管理容器和镜像的工具是在Linux容器里驱动运行应用的开源工具是一种轻量级的“虚拟机” 基于linux内核运行Docker的容器技术可以在一台主机上轻松为任何应用…

Win10+Docker配置TensorRT环境

1.Docker下载和安装 Docker下载:Install Docker Desktop on Windows Docker安装: 勾选直接下一步就行,安装完成后需要电脑重启。 重启后,选择Accept—>Continue without signing in—>skip survey. 可以进入下面页面,并且左下角是绿色的,显示e…

可视化作品集(14)智慧旅游和智慧景区,洞悉一切。

智慧旅游和智慧景区的可视化大屏可以带来以下几个方面的好处&#xff1a; 1. 提升游客体验&#xff1a; 通过可视化大屏&#xff0c;游客可以方便地获取到景区地图、交通信息、景点介绍、活动安排等信息&#xff0c;帮助游客更好地规划行程&#xff0c;提升游览体验。 2. 提供…