015: 深度学习之正向传播和反向传播

本文为合集收录,欢迎查看合集/专栏链接进行全部合集的系统学习。

合集完整版请参考这里。

上一节介绍了训练和推理的概念,这一节接着训练和推理的概念讲一下,神经网络的正向传播和反向传播。

正反向传播

其实单看正向传播和反向传播这两个概念,很好理解。

正向传播(Forward Propagation)是指数据从神经网络的第一层(也叫输入层)到最后一层(也叫输出层)的数据流动过程。

而反向传播(Backpropagation)是指数据从输出层到输入层的反向流动过程。

正常情况下,利用神经网络推理一张图像。图像数据从神经网络的输入层一直流到输出层就可以得到推理的结果,这是典型的正向传播过程,因此在推理时只有正向传播。

那反向传播是用在什么地方呢?没错,是训练。

上一节举了个例子,训练的过程就好像我们在初中高中学习课本知识一样,不断的校正我们大脑中对于知识的理解。

因此训练的过程需要有一个不断反馈、不断校正的过程,在神经网络中被校正的参数被称为神经网络的权重(或权值)。

还记得之前在介绍传统计算机视觉的时候提到的均值滤波器吗?均值滤波器中的参数都是1,可以完成对噪声的均匀滤除。

在这里插入图片描述

而神经网络中很多算法的参数是不确定的,我们没有办法来进行设计,只能让神经网络自己去学习,自己不断的去调整这些。

因此科学家们设计了一个反向传播机制,专门用来调整这个参数,下面用通俗的语言来介绍训练过程,以及反向传播是如何运行的。

训练和反向传播的模拟介绍

首先,在神经网络最后的输出层后面,都会有一个损失函数,该函数用来评判神经网络输出的结果与真实结果的接近程度。预测结果与真实结果越接近,那么损失函数的输出值就越低,如果损失函数输出值为0,那么说明预测结果和输出结果完全一致。

假设,AI模型在第一次训练时,神经网络里的参数权重都是随机值(实际情况也是这样),那么基本上第一次的预测结果与真实结果差着十万八千里。

比如真实值是10,而预测结果是1000,此时预测结果比真实结果高了很多,那我们就希望模型的参数进行调整,使得预测的结果继续变小。

这里就要用到神经网络的反向传播过程。

它会把本次预测结果与真实结果之间的差距(这里是1000 -10 = 990)反向传给神经网络的每一层,神经网络的每一层拿到后面传过来的 990 的变化量之后就会知道,本次预测高了,神经网络就会把自己的权重进行调整,调整的方向是使下一次的预测变得低一些。
在这里插入图片描述

若是下一次预测的结果是 800,结果还是偏高,会继续把这一次的变化量 (800-10=790) 再次进行反向传播,然后每一层继续往下调整参数,直到网络输出的结果为10。

学习率

上面描述的是一个大致的过程。在实际模型训练中,损失函数的输出是有波动的。

比如某一次预测值为 20,这是高于真实值的,我们希望继续往下调,下一次的预测值可能会变成0,此时又低于真实值,模型需要再继续调整参数使输出变得大一些,此时可能输出又变成了 20,这样反复调整会使得预测结果在真实的结果10之间上下波动,但是不收敛到10。

这是因为每次反向传播时,调整的幅度过大,在这个时候可以适当的将调整的幅度降低。

这个幅度,可以通过配置学习率来控制。学习率是神经网络模型的一个超参数,我们可以在训练模型时配置这个参数。

学习率降低后,假设输出可以做到每次调整的变化量为 5,这样结果就在5和15之间波动,如果在继续降低学习率,调整成0.1,那么预测值就在9.9和10.1之间波动,基本上就可以认为模型收敛到10了。

在真实的训练过程中,刚开始可以将学习率设置的大一些,到了后期将学习率设置的小一些,从而实现前期快速收敛、后期精度微调的效果。

以上便是训练的大致过程,反向传播在其中发挥了巨大的作用。

具体而言,反向传播在实际神经网络中计算的过程如下(了解即可):

根据预测结果和真实标签计算损失函数,输出损失值。

计算损失值对权重的偏导数(得到反向传播的梯度)。

通过链式法则依次计算前一层的梯度。

使用梯度下降法或其他优化算法,更新网络参数,使损失函数的输出值最小化。

正向传播和反向传播是神经网络中的核心概念,通过这两个过程,神经网络可以通过大量样本的训练来调整模型的权重,从而使模型逐渐优化并具备较好的泛化能力。

后面会有一个实战:在笔记本上训练一个图像识别的小模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/954428.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2025.1.15——二、字符型注入

一、基本操作:整理已知信息,本题为字符型注入 二、解题步骤 step 1:确认为字符型注入 键入: 1 键入:1 and 12 # 发现报错 键入:1 and 11 # 未发现报错 所以确认为字符型注入 step 2:查询…

UML系列之Rational Rose笔记四:时序图(顺序图_序列图)

时序图有很多画法,这基本上能算rose里面要求最乱的一种图了;有些人的需求是BCE模式,这是正常规范点的,有些人就不需要,有些需要用数据库交互,有些不需要;没有一个较为统一的需求;在此…

LabVIEW水位监控系统

LabVIEW开发智能水位监控系统通过集成先进的传感技术与控制算法,为工业液体存储提供精确的水位调控,保证了生产过程的连续性与安全性。 项目背景 在化工和饮料生产等行业中,水位控制的准确性对保证生产安全和提高产品质量至关重要。传统的水…

STC的51单片机LED点灯基于KEIL

前言: 该文源于回答一个朋友的问题,代码为该朋友上传,略作修改,在此说明问题以及解决问题的思路,以减少新手错误。 电路图: 该位朋友未上传电路图,说明如下: stc8g1k08a-sop8控制…

基于YOLOv8的卫星图像中船只检测系统

基于YOLOv8的卫星图像中船只检测系统 (价格90) 使用的是 MASATI-V2 数据集 训练集 3617张 验证集 452张 测试集 453张 包含 [boat] [船只] 1个类 通过PYQT构建UI界面,包含图片检测,视频检测,摄像头实时检测。 (该系…

用 Python 自动化处理日常任务

💖 欢迎来到我的博客! 非常高兴能在这里与您相遇。在这里,您不仅能获得有趣的技术分享,还能感受到轻松愉快的氛围。无论您是编程新手,还是资深开发者,都能在这里找到属于您的知识宝藏,学习和成长…

mac intel芯片下载安卓模拟器

一、调研 目前主流两个模拟器: 雷神模拟器 不支持macosmumu模拟器pro版 不支持macos intel芯片 搜索到mumu的Q&A中有 “Intel芯片Mac如何安装MuMu?” q&a🔗:https://mumu.163.com/mac/faq/install-on-intel-mac.html 提…

python中的RPA->playwright自动化录制脚本实战案例笔记

playwright录制功能使用绕过登录操作 1、首先安装playwright pip install playwright2、 安装支持的浏览器 playwright install # 安装支持的浏览器:cr, chromium, ff, firefox, wk 和 webkit3、接着在自己的项目下运行录制命令: playwright codegen…

【原创】大数据治理入门(2)《提升数据质量:质量评估与改进策略》入门必看 高赞实用

提升数据质量:质量评估与改进策略 引言:数据质量的概念 在大数据时代,数据的质量直接影响到数据分析的准确性和可靠性。数据质量是指数据在多大程度上能够满足其预定用途,确保数据的准确性、完整性、一致性和及时性是数据质量的…

数据结构(Java版)第八期:LinkedList与链表(三)

专栏:数据结构(Java版) 个人主页:手握风云 目录 一、链表中的经典面试题 1.1. 链表分割 1.2. 链表的回文结构 1.3. 相交链表 1.4. 环形链表 一、链表中的经典面试题 1.1. 链表分割 题目中要求不能改变原来的数据顺序,也就是如上图所示。…

ASP.NET Core - 配置系统之自定义配置提供程序

ASP.NET Core - 配置系统之自定义配置提供程序 4. 自定义配置提供程序IConfigurationSourceIConfigurationProvider 4. 自定义配置提供程序 在 .NET Core 配置系统中封装一个配置提供程序关键在于提供相应的 IconfigurationSource 实现和 IConfigurationProvider 接口实现&…

MPLS原理及配置

赶时间可以只看实验部分 由来:90年代中期,互联网流量的快速增长。传统IP报文依赖路由器查询路由表转发,但由于硬件技术存在限制导致转发性能低,查表转发成为了网络数据转发的瓶颈。 因此,旨在提高路由器转发速度的MPL…

【韩顺平Java笔记】第8章:面向对象编程(中级部分)【327-337】

327. 断点调试(Debug) 一个实际需求 在开发中,程序员在查找错误时,可用断点模式在断点调试过程中,是运行状态,是以对象的运行类型来执行的。 A extends B; B b new A(); b.xx();//按照运行类型来执行的 …

Qt 各版本选择

嵌入式推荐用 Qt4.8,打包的程序小:Qt4.8.7是Qt4的终结版本,是Qt4系列版本中最稳定最经典的 最后支持xp系统的长期支持版本:Qt5.6.3;Qt5.7.0是最后支持xp系统的非长期支持版本。 最后提供mysql数据库插件的版本&#xf…

常见好用的PHP CMS开源系统有哪些?

开源的系统,网站大家估计也见过很多,尤其是用PHP写的开源系统也很受用户们欢迎,这类系统通常以简单、使用、开源为优势,为用户提供更好的服务。以下就为大家介绍几个常见且好用的PHP CMS开源系统。欢迎补充! 1、WordP…

DuckDB:精通Insert语句处理数据冲突

本文介绍DuckDB insert语句用法,包括常规的批量插入,尤其是插入数据冲突的处理,最后还提及returning子句的用法,每个用法提供示例说明。 insert插入数据 INSERT INTO向表中插入新行。可以插入由值表达式指定的一行或多行&#xf…

【spring mvc】文件上传、下载

文件上传,存储至本地目录中 一、代码1、工具类(敏感后缀过滤)2、文件上传,存储至本地3、文件下载 二、效果演示1、上传1.1、postMan 请求1.2、上传效果 2、下载2.1、下载效果 一、代码 1、工具类(敏感后缀过滤&#x…

Ansible实战:如何正确选择 command 和shell模块?

在使用Ansible进行自动化运维时,command 和 shell 模块是我们执行命令的好帮手。虽然它们看起来很相似,但在功能特性和适用场景上其实有着明显的不同。正确选择合适的模块不仅能够提高任务的效率,还能帮助我们规避一些潜在的风险。在这篇文章…

手撕Transformer -- Day7 -- Decoder

手撕Transformer – Day7 – Decoder Transformer 网络结构图 目录 手撕Transformer -- Day7 -- DecoderTransformer 网络结构图Decoder 代码Part1 库函数Part2 实现一个解码器Decoder,作为一个类Part3 测试 参考 Transformer 网络结构 Decoder 代码 Part1 库函数…

UI自动化测试:异常截图和page_source

自动化测试过程中,是否遇到过脚本执行中途出错却不知道原因的情况?测试人员面临的不仅是问题的复现,还有对错误的快速定位和分析。而异常截图与页面源码(Page Source)的结合,正是解决这一难题的利器。 在实…