深度学习网络(11)——训练神经网络

深度学习网络(11)——训练神经网络

article2025/1/2 14:55:53/文章来源:https://blog.csdn.net/m0_74259787/article/details/144786519

训练神经网络

对当前输入的感受野,只与滤波器的大小有关,与padding和stride无关,
对网络输入的感受野: $r_0=\sum_{l=1}^L((k_l-1)\prod_{i=1}^{l-1}s_i)+1$

激活函数

ReLU:max(0,x):

在正数区域,梯度不会消失
计算效率非常高
收敛速度很快

问题:

输出不是以0为中心
负数区域梯度为0(神经元“死掉”)

Leaky ReLU:
$y=\begin{cases}x,x>0\\ 0.01 x,x\leq 0\end{cases}$
任何时候梯度都不会为0(神经元不会“死掉”)

输出以0为中心的好处:模型训练收敛更快

使用建议：使用ReLU，可以尝试Leaky ReLU，尽量避免使用sigmoid/tanh

数据预处理:

$X'=\frac{X-\mu}{\sigma}$ , $\mu$ 是训练集的均值, $\sigma$ 是训练集的标准差, $X^{'}$ 是归一化后的数据

将权重全部设置为一个常量的话:不管进行多少轮正向传播以及反向传播,每俩层之间的参数都是一样的。换句话说,本来我们希望不同的结点学习到不同的参数,但是由于参数相同以及输出值都一样,不同的结点根本无法学到不同的特征！！！这样就失去了网络学习特征的意义。

dropout

在模型训练的每次前向传播计算中,将一些神经元随即设置为0,让网络学习冗余表示,防止特征的协同适应

Stochastic Depth

随机网络深度
训练时:随机跳过某些层
测试时:使用所有层

数据增强

水平翻转、锐化、随即裁剪和缩放、颜色扰动

超参数选择:

检查初始损失(关闭权重衰减)
过拟合少量样本
选择合适的lr
粗调1-5epochs
细调10-20epochs
检查损失和准确率曲线
如果第六步出现问题,返回第五步

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/945091.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

python爬虫爬抖音小店商品数据+数据可视化

python爬虫爬抖音小店商品数据+数据可视化

爬虫代码爬虫代码是我调用的数据接口，可能会过一段时间用不了，欢迎大家留言评论，我会不定时更新 import requests import time cookies {token: 5549EB98B15E411DA0BD05935C0F225F,tfstk: g1vopsc0sQ5SwD8TyEWSTmONZ3cA2u6CReedJ9QEgZ7byz…

阅读更多...

hadoop搭建

hadoop搭建

前言一般企业中不会使用master slave01 slave02来命名 vmware创建虚拟机打开vmware软件，新建虚拟机典型稍后安装系统选择centos7 虚拟机名称和安放位置自行选择（最小化安装消耗空间较少） 默认磁盘大小即可自定义硬件选择centos7的i…

阅读更多...

基于深度学习(HyperLPR3框架)的中文车牌识别系统-python程序开发测试

基于深度学习(HyperLPR3框架)的中文车牌识别系统-python程序开发测试

本篇内容为python开发，通过一个python程序，测试搭建的开发环境，读入一张带有车牌号的图片，成功识别出车牌号。 1、通过PyCharm新建一个工程，如：PlateRecognition，配置虚拟环境。 2、在工程中新…

阅读更多...

c# RSA加解密工具，.netRSA加解密工具

c# RSA加解密工具，.netRSA加解密工具

软件介绍名称： c# RSA加解密工具，.netRSA加解密工具依赖.net版本： .net 8.0工具类型： WinForm源码下载 c# RSA加解密工具，.netRSA加解密工具依赖项 WinFormsRSA.csproj <Project

阅读更多...

Ubuntu20.04安装Foxit Reader 福昕阅读器

Ubuntu20.04安装Foxit Reader 福昕阅读器

Ubuntu20.04安装Foxit Reader 福昕阅读器文章目录 Ubuntu20.04安装Foxit Reader 福昕阅读器先更新一下源 sudo apt update sudo apt upgrade下载Foxit Reader的稳定版本 wget https://cdn01.foxitsoftware.com/pub/foxit/reader/desktop/linux/2.x/2.4/en_us/FoxitReader.e…

阅读更多...

HUB、交换机、路由器和串口服务器

HUB、交换机、路由器和串口服务器

HUB：HUB是集线器，支持半双工的工作模式，就像对讲机那样。工作在物理层，收到数据后，会向其他端口转发，只是起到“中转站的作用”；而且对带宽是共享的，像河流一样，分的支流…

阅读更多...

基于微信小程序的校园访客登记系统

基于微信小程序的校园访客登记系统

基于微信小程序的校园访客登记系统功能列表用户端功能注册与登录 ：支持用户通过手机号短信验证码注册和登录。个人资料管理 ：允许用户编辑和更新个人信息及其密码。站内信消息通知：通知公告。来访预约：提交来访预约支持车牌…

阅读更多...

苹果叶病害图像分类数据集5类别：健康苹果叶、灰斑病、铁锈病、马赛克病、蛙眼叶斑病

苹果叶病害图像分类数据集5类别：健康苹果叶、灰斑病、铁锈病、马赛克病、蛙眼叶斑病

数据集下载苹果叶病害图像分类数据集5类别：健康苹果叶、灰斑病、铁锈病、马赛克病、蛙眼叶斑病（7100张图片）:https://download.csdn.net/download/m0_64879847/90181747 数据集展示健康苹果叶灰斑病马赛克病铁锈病蛙眼叶斑病

阅读更多...

【日常开发】Git Stash使用技巧

【日常开发】Git Stash使用技巧

文章目录引言一、git stash 基础命令（一）存储当前工作区的修改（二）查看存储列表二、查看存储的内容（一）查看特定存储的详细内容（二）查看特定存储修改的文件列表三、恢复存储的修改…

阅读更多...

超详细！一文搞定PID！嵌入式STM32-PID位置环和速度环

超详细！一文搞定PID！嵌入式STM32-PID位置环和速度环

本文目录一、知识点1. PID是什么？2. 积分限幅--用于限制无限累加的积分项3. 输出值限幅--用于任何pid的输出4. PID工程二、各类PID1. 位置式PID（用于位置环）（1）公式（2）代码使用代码 2. 增量式…

阅读更多...

数据库系统原理复习汇总

数据库系统原理复习汇总

数据库系统原理复习汇总一、数据库系统原理重点内容提纲题型：主观题 1、简答题第一章：数据库的基本概念：数据库、数据库管理系统、三级模式；两级映像、外码第二章：什么是自然连接、等值连接； 第三…

阅读更多...

【Spring】 Bean 注入 HttpServletRequest 能保证线程安全的原理

【Spring】 Bean 注入 HttpServletRequest 能保证线程安全的原理

文章目录前言1. 图示2. 源码坐标后记前言今天看了一段老业务代码，HttpServletRequest 被注入后直接用于业务逻辑。好奇Spring是如何解决线程安全问题。 Controller public class TestController {ResourceHttpServletRequest request;ResponseBodyGetMapping(…

阅读更多...

大数据面试笔试宝典之Flink面试

大数据面试笔试宝典之Flink面试

1.Flink 是如何支持批流一体的？ F link 通过一个底层引擎同时支持流处理和批处理. 在流处理引擎之上，F link 有以下机制： 1）检查点机制和状态机制：用于实现容错、有状态的处理; 2）水印机制：用于实现事件时钟; 3）窗口和触发器：用于限制计算范围，并定义呈现结果的…

阅读更多...

【Linux】进度条

【Linux】进度条

本文中，我们来写一个进度条。本文大纲： 写一个命令行版的进度条。 1.回车换行 2.缓冲区问题（本文不深究） 2.1测试代码 3.写一个什么样的进度条？ version1 version2 回车换行这俩不是一个概念&…

阅读更多...

React引入Echart水球图

React引入Echart水球图

在搭建React项目时候，遇到了Echart官方文档中没有的水球图，此时该如何配置并将它显示到项目中呢？ 目录一、拓展网站二、安装三、React中引入 1、在components文件夹下新建一个组件 2、在组件中引入 3、使用水波球组件一、拓展网站 …

阅读更多...

mysql三种读取模式（普通、流式、游标）

mysql三种读取模式（普通、流式、游标）

在与MySQL数据库交互时，数据的读取方式有多种选择，包括流式读取、游标读取和普通读取。每种方式都有其独特的原理、优势和劣势。本文将对这三种读取方式进行详细介绍， 1. 普通读取介绍普通读取是指通过JDBC的Statement或PreparedStateme…

阅读更多...

【畅购商城】微信支付之支付模块

【畅购商城】微信支付之支付模块

目录支付页面接口后端实现前端实现支付页面步骤一：创建 flow3.vue组件步骤二：引入第三方资源（js、css） <script> import TopNav from ../components/TopNav import Footer from …

阅读更多...

如何在 Ubuntu 上安装 PyTorch

如何在 Ubuntu 上安装 PyTorch

简介 PyTorch 因其易用性、动态计算图和高效性而日益流行，成为实现深度学习模型的首选。如果你想探索这个工具并学习如何在 Ubuntu 上安装 PyTorch，本指南将对你有所帮助！ 在本教程中，我们将引导你完成在 Ubuntu 系统上使用 Pip…

阅读更多...

如何设置Edge浏览器访问软件

如何设置Edge浏览器访问软件

使用Edge浏览器访问分销ERP A\V系列软件时会出现各种报错，如何设置Edge浏览器使其正常访问，请看下面的具体操作。一、打开Edge浏览器，点击右上角的设置及其他，如图： 二、在弹出界面中，点击扩展&#xff…

阅读更多...

ASP.NET Web应用程序出现Maximum request length exceeded报错

ASP.NET Web应用程序出现Maximum request length exceeded报错

一、问题描述在ASP.NET的web应用中，导出数据时出现500 - Internal server error.Maximum request length exceeded。二、原因分析这个错误通常出现在Web应用程序中，表示客户端发送的HTTP请求的长度超过了服务器配置的最大请求长度限制。这可能是因为…

阅读更多...

最新文章