Gradient Descent

在这里插入图片描述
在整个maching learning的第三个步骤要找一个最好的function。在第二步是定义了一个 Loss function L,这个L是一个function的fuction
求完偏微分之后得到的向量就是Gradient(黄色部分)
在这里插入图片描述
随机找一个起始点0,它的等高线的法线方向就是gradient,是一个vector,之后把这个gradient乘上deep learning再取负号得到它更新的移动方向,1,以此类推。先算gradient再决定要走的方向。
在这里插入图片描述
在这里插入图片描述
eg可以把learning rate设置成一个依赖于次数t的function,这样再经历t次之后,分母t+1越大,得到的learning rate就会越小
自动调learning rate的方法
通常learning rate随着参数的变化,越来越小。最好的状态是不同参数给不同的learning rate
在这里插入图片描述
通过均方根实现对不同参数设置不同learning rate。wt这一点的微分是gt
在这里插入图片描述
σt是过去所有微分的root mean square(其计算方法为将平方误差求平均值,然后取平方根)
在这里插入图片描述
所以使用adagrad 更新参数的时候公式就长这样
斜率gt(微分gt)越大算出来的参数更新的就越快。
在这里插入图片描述
在这里插入图片描述
adagrad在分母里又具备了gt,这样的话gt越大,参数更新就越小,与之前的有冲突。但是adagrad在分母中包含这个微分,就是为了造成反差的效果。把过去所有的gradient的平方相加再相除,来看过去的gradient的反差有多大。
在这里插入图片描图
只有一个参数的时候才成立。以二次函数图像为例,最低点到随机点x0之间,最好的一步就是x0+2ab,简化同分得到绿色箭头右侧公式。下面的图像是对二次函数求微分得到的图像。所以在某一点的微分越大,距离原点越远。
在这里插入图片描述
w1的error surface(曲面误差)图像如蓝色所示,在这条图像上,如果比较a和b,那就是刚才那样的规律,斜率越大距离远点越远。w2的图像为绿色部分,值比较cd两点也是同理。但如果是跨参数比较,ac两点这个规律就不适用。
在这里插入图片描述
最好的一步这个公式里还有一个分母2a,这个2a就是对二次函数进行二次微分的来的。所以如果是跨参数来比较的话就需要一次微分和二次微分一起看。虽然c的斜率比a大,但是它的二次微分也比a大。谷比蓝色图像的谷要尖。
Stochastic Gradient Descent
在这里插入图片描述
和Gradient Descent不一样的是它只需要随机取一个点xn,只计算这个点的loss就可以而不是计算所有训练数据的损失。看一个example就更新一个参数。
在这里插入图片描述
Gradient一下把所有的example全部看完后更新参数,所以它是比较稳定。Stochastic Gradient Descent是看到一个example就更新一次参数。
Feature Scaling
在这里插入图片描述
不同的特征有相同的范围。比如x1远比x2小,所以把x2缩小使x1x2有相同的范围。
在这里插入图片描述
左边:w2比w1对y的影响要大,所以w2方向上会有尖锐的谷,w1方向上就会比较平滑
右边:w1,w2对y的影响差不多所以会得到接近圆形的loss图像
右边计算gradient更新参数要比左边方便
在这里插入图片描述
算出来微分为0的时候不一定就是loss最小的时候,也有可能在高原但是微分值为0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/779319.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Flash存储器解析:从原理到应用,全面了解其与缓存的区别

Flash存储器解析:从原理到应用,全面了解其与缓存的区别 Flash存储器是一种非易失性存储器技术,广泛应用于各种电子设备中,如USB闪存盘、固态硬盘(SSD)、智能手机、数码相机和嵌入式系统。它能够在断电情况下…

Windows使用nxlog发送系统日志到Linux的rsyslog服务器

Windows使用nxlog发送系统日志到Linux的rsyslog服务器 前言一、IP地址规划及示意图二、在windows上安装及配置nxlog1.下载nxlog2.安装nxlog3.配置nxlog4.创建对应日志路径的文件夹 三、windows上启动nxlog服务四、在CentOS 7上配置日志存到指定位置文件1.编辑/etc/rsyslog.conf…

【国产开源可视化引擎Meta2d.js】钢笔

钢笔 钢笔是和其他众多绘图工具(Photoshop、Sketch、Illustrator)中一致的钢笔工具,能够很方便的在线绘制各种小图标 在线体验: 乐吾乐2D可视化 示例: // 开始绘画:curve。除了curve,还有poly…

9 张图带你理解 Kafka 中高水位 HW

大家好,我是君哥。 Kafka 高水位(简称 HW)是 Kafka 中非常重要的一个概念,今天来聊一聊 HW。 1 HW 简介 HW 是 Kafka 中 Offset 的一个值,HW 作为一个边界,Offset 小于 HW 的消息被称为已提交消息&#…

让ChatGPT干正事、说人话、会思考!借助ChatGPT润出优质论文的实操指南

大家好,感谢关注。我是七哥,一个在高校里不务正业,折腾学术科研AI实操的学术人。关于使用ChatGPT等AI学术科研的相关问题可以和作者七哥(yida985)交流,多多交流,相互成就,共同进步&a…

Qt 文件初始化配置ini/conf类型读写

学习目标: 文件初始化配置 前置环境 运行环境:qt creator 4.12 学习内容 INI 文件是一种常见的配置文件格式,它通常用于存储应用程序或系统的设置和参数。INI 文件的格式很简单,由以下几个部分组成: 节(Section): 节用方括号括起来,如 [General]、[Network] 等。…

基于Redis和阻塞队列的 异步秒杀业务

异步前 之前的秒杀业务的查询优惠券、查询订单、减库存、创建订单都要查询数据库,而且有分布式锁,使得整个业务耗时长,对此采用异步操作处理,异步操作类似于餐厅点餐,服务员负责点菜产生订单、厨师负责根据订单后厨做…

LabVIEW图像分段线性映射

介绍了如何使用LabVIEW对图像进行分段线性映射处理,通过对特定灰度值区间进行不同的线性映射调整,以优化图像的显示效果。案例中详细展示了如何配置和使用LabVIEW中的图像处理工具,包括设置分段区间、计算映射参数和应用映射函数等步骤。 实…

STM32智能医疗监测系统教程

目录 引言环境准备智能医疗监测系统基础代码实现:实现智能医疗监测系统 4.1 数据采集模块 4.2 数据处理与分析 4.3 通信系统实现 4.4 用户界面与数据可视化应用场景:医疗监测与优化问题解决方案与优化收尾与总结 1. 引言 智能医疗监测系统通过STM32嵌…

Python爬取股票信息-并进行数据可视化分析,绘股票成交量柱状图

为了使用Python爬取股票信息并进行数据可视化分析,我们可以使用几个流行的库:requests 用于网络请求,pandas 用于数据处理,以及 matplotlib 或 seaborn 用于数据可视化。 步骤 1: 安装必要的库 首先,确保安装了以下P…

virtualbox窗口和win10窗口的切换

1、问题: 从windows切换到虚拟机可以用快捷键 ALTTAB,但是从虚拟机到windows使用 ALTTAB 无法成功切换 2、解决方法: 注意:发现设置为ctrlAlt会导致打开终端快捷键(CtrlAltT)失效,建议这里设置…

【C++】开源:地图投影和坐标转换proj库配置使用

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍地图投影和坐标转换proj库配置使用。 无专精则不能成,无涉猎则不能通。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下&a…

mars3d加载wms服务或者wmts服务注意事项

1.wms只支持4326、3857、4490的标准切片,其他坐标系不支持 Mars3D三维可视化平台 | 火星科技 2.wmts同理,Mars3D三维可视化平台 | 火星科技 3.对应级别tilematrix找到的瓦片tilerow&tilecol这两个参数使用常见报错无效参考: 【Mars3d】…

VSCode设置字体大小

方法1:Ctrl 和 Ctrl -,可以控制整个VSCode界面的整体缩放,但是不会调整字体大小 方法2:该方法只能设置编辑器界面的字号,无法改变窗口界面的字号。 (1)点开左下角如下图标,进入…

商贸物流大脑:大模型+数据要素赋能智慧物流数据平台

项目背景与意义 物流行业快速发展,数据量急剧增加,随着电子商务、智能制造等领域的快速发展,物流行业面领着前所未有的挑战和机遇,如效率低下、资源配置不均、信息不透明等问题。随着全球化和电子商务的快速发展,数据…

【Linux进阶】文件系统8——硬链接和符号连接:ln

在Linux下面的链接文件有两种, 一种是类似Windows的快捷方式功能的文件,可以让你快速地链接到目标文件(或目录);另一种则是通过文件系统的inode 链接来产生新文件名,而不是产生新文件,这种称为硬链接&…

Vue + SpringBoot:el-upload组件单文件、多文件上传实战解析

文章目录 单文件上传后端前端 多文件上传后端前端 单文件上传 后端 PostMapping("/uploadDxfFile") public R uploadDxfFile(RequestParam(value "file", required true) MultipartFile multipartFile) throws Exception {// 文件校验工作if (multipar…

【C语言小知识】缓冲区

缓冲区 当我们使用printf()将数据显示在屏幕上,或者使用scanf()函数将数据输入到电脑里,我们是否会产生些许疑问?为何输入的字符会直接显示到屏幕上等等。这里需要介绍一个C语言中的一个关键概念——缓冲区。 当我们使用老式系统进行运行代码…

机器学习之保存与加载

前言 模型的数据需要存储和加载,这节介绍存储和加载的方式方法。 存和加载模型权重 保存模型使用save_checkpoint接口,传入网络和指定的保存路径,要加载模型权重,需要先创建相同模型的实例,然后使用load_checkpoint…

创维汽车开展年中总结会:创新创造·勇开拓 智慧经营·攀高峰

2024年7月3日,回顾上半年的工作成果,总结经验教训,明确下半年的发展方向和重点任务,创维汽车于山西省晋中市榆次区山西联合创维体验中心开展年中总结会。 创维集团、创维汽车创始人黄宏生;开沃集团联合创始人、首席执…