【深度学习】日常笔记

    一开始感觉学习方向有点飘忽不定,后面查找资料和思考,发现其实图神经网络异构图推荐系统这三者的概念其实是相通,紧密联系的。推荐系统是指根据用户历史行为和偏好,为用户提供个性化的商品或服务推荐。而在推荐系统中,通常需要用到大规模的图数据,比如用户-商品交互网络、用户-用户社交网络等,并且这些图数据往往是异构的,即节点和边具有不同的类型和属性。在基础1---Neural Collaborative Filtering中,提到了协同过滤的概念:个性化推荐系统的关键是根据用户过去的互动(例如,评分和点击)对商品的偏好进行建模,这被称为协同过滤。所以在推荐系统中,图神经网络GNN开源被用来对用户-商品的交互网络进行建模,从而做出预测。

    在读李沐老师d2l-zh-pytorch.pdf时,知道了推荐系统是包含在机器学习下的监督学习中的,监督学习是需要向模型提供庞大的数据集的。

基础1---2017---Neural Collaborative Filtering

    这篇论文在2017年提出了使用神经网络的协同过滤(collaborative filtering,CF)的推荐算法,使用DNN建模用户user和物品item的交互关系,从而完成个性化的推荐。

    一开始较详细地描述了矩阵分解MF的概念及算法来作为引子。后面将MF和深度神经网络相结合,提高了推荐算法的表现。

    接着提出了一种协同过滤的损失函数,可以使得推荐系统对用户历史行为和隐含反馈进行更加准确的建模。

    后面通过实验验证的各种图表,证明了该算法在多个推荐场景下都具有很好的性能,并且相较于其他传统的协同过滤算法和深度学习算法,取得了更好的结果。

    我认为这篇论文是推荐系统领域非常重要的一篇研究成果,尤其是对于深度学习和协同过滤结合的研究具有很大的启示和借鉴意义,而且看着上面的文字描述,应该是开创了将DNN应用到推荐系统的先河。不过后面跟学长聊了下,发现貌似NCF是比较老的技术了,貌似最重要的意义是首次将神经网络尝试替代MF…?

可以通过矩阵乘法的原理分解成User和Item矩阵

如上面,隐向量是三维的,隐向量一般难以理解,我觉得是在还原后才有其具体含义,且往往隐向量的长度k是作为参数来调整的。

可以先优化User和Item两个小表,然后还原为有意义的大表即可,不一定要100%准确,近似即可。

在学自动微分时,发现对计算图的概念有点模糊。

通过自动微分进行反向计算↑

为什么AI框架都用计算图?什么是计算图?到底计算图有什么用?【计算图】系列第二篇_哔哩哔哩_bilibili

学到自动微分还是不太明白,尤其是反向传播计算。下面的代码注释也不知道我写没写对。

学到了一个名叫范数的概念。简单来说我觉得就是输入是一个向量,但是输出是一个数值。

感觉这里教程里说的不太对。这个公式的话,我觉得是y是真实值,然后X是将原始的输入矩阵X扩展为一个新的矩阵,其中第一列是1,然后将偏置b作为w中的第一项,即:

新的输入矩阵:

[1 x_11 ... x_1n]
[1 x_21 ... x_2n] ...
[1 x_m1 ... x_mn]

对应的权重向量: [w0 w1 ... wn]Tw0为偏置b

↑遇到了类似对向量的求导的问题。

这里是线性回归的解析解推导过程:

我们的目标是最小化损失函数 L(w) = y - Xw^2,其中 y n 维数据列向量,X n * p 的特征矩阵,w p 维权重列向量。

将损失函数展开,得到 L(w) = (y - Xw)(y - Xw) = (y + (-Xw))(y - Xw) = yy - 2wXy + wXXwvu = uv,其中 v u 都是向量)

w 求导数,得到梯度 g(w) = -2Xy + 2XXw

令梯度为零,即 2XXw = 2Xy,解出 w 使得上式成立,得到:

w* = (XX)^-1 Xy

其中 (XX)^-1 表示 XX 的逆矩阵。所以,最小化损失函数时,权重向量的解析解就是 w* = (XX)^-1 Xy

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/27304.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

用GANs来做数据增强

适用于只有很少样本的情况。 即使是不完美的合成数据也可以提高分类器的性能。 生成对抗网络(Generative adversarial networks,简称GANs)由Ian Goodfellow于2014年推出,近年来成为机器学习研究中非常活跃的话题。GAN是一种无监督生成模型,它…

基于word文档,使用Python输出关键词和词频,并将关键词的词性也标注出来

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 移船相近邀相见,添酒回灯重开宴。 大家好,我是Python进阶者。 一、前言 前几天在有个粉丝问了个问题,大概意思是这样…

一阶电路和二阶电路的时域分析(1)——“电路分析”

小雅兰期末加油冲冲冲!!! 动态电路的方程及其初始条件 动态电路,物理学名词,是指含有储能元件L、C的电路,动态电路方程的阶数通常等于电路中动态元件的个数。 动态电路是指含有储能元件的电路。当动态电路状…

【Java】Java核心要点总结:58

文章目录 1. java中 怎么确保一个集合不能被修改2. 队列和栈是什么 有什么区别3. Java8开始的ConcurrentHashMap为什么舍弃了分段锁4. ConcurrentHashMap 和 Hashtable有什么区别5. ReadWriteLock和StampeLock 1. java中 怎么确保一个集合不能被修改 Java 中可以使用 Collectio…

计算机网络(数据链路层,复习自用)

数据链路层 数据链路层功能概述封装成帧与透明传输差错编码(检错编码)差错编码(纠错编码)流量控制与可靠传输机制停止-等待协议后退N帧协议(GBN)选择重传协议(Selective Repeat) 信道…

并行事务会引发的三个问题

并行事务是指同时运行多个事务,每个事务独立地执行,并且不会相互影响。在数据库管理系统中,当多个用户同时对同一个数据集进行读取或者写入的时候,使用并行事务可以提高系统的吞吐量和响应时间。同时,由于并行事务可以…

【MySQL 数据库】7、SQL 优化

目录 一、插入数据优化(1) insert 语句① 批量插入数据② 手动控制事务③ 主键顺序插入,性能要高于乱序插入 (2) load 大批量插入数据【☆❀ 二、主键优化(1) 数据组织形式(2) 页分裂(3) 页合并(4) 主键设计原则 三、orber by 优化四、group by 优化五、limit 优化&…

基于前推回代法的连续潮流计算研究【IEEE33节点】(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

基于Java+Springboot+Vue的二次元商城网站设计与实现

博主介绍:✌擅长Java、微信小程序、Python、Android等,专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇🏻 不然下次找不到哟 Java项目精品实战案…

YOLO系列理论合集(YOLOv1~v3SPP)

前言:学习自霹雳吧啦Wz YOLOV1 论文思想 1、将一幅图像分成SxS个网格(grid cell),如果某个object的中心落在这个网格中,则这个网格就负责预测这个object。 2、每个网格要预测B个bounding box,每个bounding box除了要预测位置(…

基于NE555芯片的简单延时电路和方波信号发生器

简单延时电路 NE555芯片是一种经典的计时器集成电路,常用于电子设计中的定时和延时功能。下面是一个简单的NE555延时电路的详细分析和讲解: NE555芯片是一个多功能的集成电路,主要由比较器、RS触发器、RS锁存器以及输出驱动器等组成。它可以工…

Mysql进阶【3】论述Mysql优化

1.通过explain查看sql的详细信息 Mysql的sql优化企业里边主要是对慢sql进行优化,对语句进行优化,对索引进行优化 通过explain查看sql的详细信息,并且分析sql语句存在的问题,比如有没有使用到索引、使用了索引还是慢是不是索引设…

机器学习笔记 - EANet 外部注意论文简读及代码实现

一、论文简述 论文作者提出了一种新的轻量级注意力机制,称之为外部注意力。如图所示,计算自注意力需要首先通过计算自查询向量和自关键字向量之间的仿射关系来计算注意力图,然后通过用该注意力图加权自值向量来生成新的特征图。外部关注的作用…

智慧加油站解决方案,提高加油区和卸油区的安全性和效率

英码科技智慧加油站解决方案是一个综合应用了AI智能算法的视觉分析方案,旨在提高加油区和卸油区的安全性和效率。 加油区算法: 吸烟检测:通过AI算法分析视频流,检测是否有人在加油区域吸烟,以防止火灾风险。 打电话…

STM32开发——串口通讯(非中断+中断)

目录 1.串口简介 2.非中断接收发送字符 3.中断接收字符 1.串口简介 通过中断的方法接受串口工具发送的字符串,并将其发送回串口工具。 串口发送/接收函数: HAL_UART_Transmit(); 串口发送数据,使用超时管理机制HAL_UART_Receive(); 串口…

案例26:基于Springboot校园社团管理系统开题报告

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

苹果MacOS系统傻瓜式本地部署AI绘画Stable Diffusion教程

Stable Diffusion的部署对小白来说非常麻烦,特别是又不懂技术的人。今天分享两个一键傻瓜式安装包,对小白来说非常有用。下面两个任选一个安装就可以。 一、DiffusionBee 简单介绍 DiffusionBee是基于stable diffusion的一个安装包,有图形…

python文字转语音(pyttsx3+flask)

提示:文章结尾有全部代码 目录 前言一、Flaskpyttsx基本使用Flask导入Flask框架配置基础环境初始Flask代码 pyttsx3库基本使用导入pyttsx3初始化pyttsx3文字转语音运行 二、具体实现1.引入库 总结 前言 本文主要讲解如何用python的pyttsx3库flask框架,手…

有了IP地址,还需要MAC地址嘛?二选一可否?

概要 在计算机网络中,IP地址和MAC地址是两个最基本的概念。IP地址在互联网中是用于标识主机的逻辑地址,而MAC地址则是用于标识网卡的物理地址。虽然它们都是用于标识一个设备的地址,但是它们的作用和使用场景是不同的。 IP地址是在网络层&am…

数据结构之树与二叉树——算法与数据结构入门笔记(五)

本文是算法与数据结构的学习笔记第五篇,将持续更新,欢迎小伙伴们阅读学习。有不懂的或错误的地方,欢迎交流 引言 前面章节介绍的都是线性存储的数据结构,包括数组、链表、栈、队列。本节带大家学习一种非线性存储的数据结构&…