生命在于学习——Python人工智能原理(3.4)

在这里插入图片描述

三、深度学习

7、过拟合与欠拟合

过拟合和欠拟合是所有机器学习算法都要考虑的问题。

(1)基本定义

a、欠拟合

欠拟合是指机器学习模型无法完全捕获数据集中的复杂模式,导致模型在新数据上的表现不佳,这通常是由于模型过于简单或不够复杂,无法充分利用数据集中的特征进行训练。
欠拟合的原因可能有:

  1. 模型复杂度不足
  2. 特征选择不当
  3. 数据预处理不当
  4. 数据量不足
  5. 训练不足

b、过拟合

过拟合是机器学习中的一个常见问题,它发生在模型过于复杂,以至于在训练数据上表现的非常好,但在新的、未见过的数据上表现不佳时,过拟合的模型对训练数据中的细节和噪声非常敏感,并可能将这些细节和噪声作为一般规则来学习,导致在测试数据上的泛化能力下降。
过拟合的原因可能包括:
1.模型复杂度过高
2.训练数据不足
3.数据分布不均或存在噪声
4.训练时间过长

c、平衡

在机器学习中,平衡是指找到一个合适的模型复杂度,既能避免欠拟合,又能防止过拟合,从而实现模型在训练数据和测试数据上的良好表现。
为了平衡模型的性能,可以考虑以下几个方面:
1.选择合适的模型
2.调整模型复杂度
3.正则化
4.早停法
5.数据增强与选择
6.交叉验证
7.集成学习
8.监控性能指标

(2)处理方法

a、欠拟合解决办法

1.增加特征数量
2.增加模型复杂度
3.减少正则化参数
4.增加训练数据
5.改进特征工程
6.使用更复杂的算法
7.使用集成学习

b、过拟合解决办法

1.权值衰减
2.提前停止训练
3.正则化
4.减少模型参数
5.Dropout
6.数据增强
7.决策树剪枝
8.交叉验证

8、卷积神经网络

卷积神经网络是一类包含卷积计算且具有深度结果的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按照其阶层结构对输入信息进行平移不变分类,因此也被成为平移不变人工神经网络。
卷积神经网络仿照生物的视知觉机制创建,可以进行监督学习与非监督学习,其卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征,如像素和音频进行学习,效果较好且没有额外的特征工程要求。

(1)卷积神经网络的结构

主要分为输入层、卷积层、池化层、全连接层、分类层等。

a、输入层

输入层是整个神经网络的输入,在处理图像的卷积神经网络中,它一般代表了一张图片的像素矩阵。其中三维矩阵的长和宽代表了图像的大小,深度代表了图像的色彩通道,从输入层开始,卷积神经网络通过不同的神经网络架构将上一层的三维矩阵转换为下一层的三维矩阵,直到最后的全连接层。

b、卷积层

卷积层是一个网络最重要的部分,卷积层试图将神经网络中的每小块进行更加深入的分析从而获得抽象度更高的特征。

c、池化层

池化层神经网络不会改变三维矩阵的深度,但是它可以缩小矩阵的大小,通过池化层可以进一步缩小最后全连接层中节点的个数,从而达到减小整个神经网络参数的目的。

d、全连接层

在经过多轮卷积和池化之后,在卷积神经网络的最后一班有1-2个全连接层给出最后的分类结果,经过几轮卷积和池化之后,可以认定图像中的信息已经被抽象成信息含量更高的特征。

e、Softmax层

Softmac层主要用于分类问题,通过Softmax层可以得到当前输出属于不同种类的概率分布情况。该层主要采用Softmax函数,又称归一化指数函数,是对数概率回归在C个不同值上的推广,公式如下:
在这里插入图片描述

其中,C表示神经网络输出层的输出数量,i表示输出层第i个输出,oi表示第i个输出值,e表示自然常数,∑c j=1 e-oj表示所有神经元输出值的对数概率函数之和。
Python实现代码如下:
def softmax(x):
exp_x = np.exp(x)
return exp_x/np.sum(exp_x)

(2)卷积的相关计算

a、重要参数介绍

卷积核大小
卷积核一班宽和高都比较小,如果输入是图片,宽高一般相同。
卷积核数量
卷积核数量即卷积产生的通道数,不同卷积核在输入数据中寻找不相同的特征,一般卷积核数量大于输入通道数,并且随着卷积的进行卷积核数量越来越多。
步长
在滑动卷积核时,必须制定步长,步长为1,是指卷积核每次移动1个像素,步长为2,是指每次移动2个像素。
零填充
有时候将输入数据用0在边缘处进行填充是很方便的。零填充的尺寸是一个超参数,零填充有一个良好性质,即可以控制输出数据的空间尺寸。

b、参数量及特征图计算

假设输入数据维度为WxHxCin,卷积核尺寸KxK,步长S,卷积核数量Cout,零填充数量为P,则特征图的宽W2,高H2,深D2,计算公式分别为:
W2=H2=(W-K+2P)/S+1
D2=Cout

c、池化层计算

池化层可以有效缩小矩阵尺寸,从而减小全连接层的参数数量,加快计算速度的同事有效防止过拟合问题。
最常用的池化方式是最大池化和平均池化,池化操作只减小矩阵的宽和高,不减少矩阵的深度。

d、全连接层计算

全连接层不保存分类信息,在整个卷积神经网络中起到分类器的作用。
下面为全连接层的计算过程,设x1,x2,x3为全连接层的输入,a1,a2,a3为输出,则有:
在这里插入图片描述

假设全连接层的输入维度是800,输出维度是500,则:
1、Loss对全连接的输入求导,如下:
在这里插入图片描述

2、Loss对权重系数求导:
在这里插入图片描述

3、对偏置系数b求导:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/707032.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SemanticKITTI 拼接语义点云帧

文章目录 KITTISemanticKITTISemantic Segmentation and Panoptic SegmentationSemantic Scene Completion 数据转换语义标签和点云拼接 KITTI The odometry benchmark consists of 22 stereo sequences, saved in loss less png format: We provide 11 sequences (00-10) wit…

群体优化算法----多乌鸦搜寻算法介绍,找多目标函数组解,Pareto前沿

介绍 乌鸦搜寻算法(Crow Search Algorithm,CSA)是一种新型的群体智能优化算法,其灵感来源于乌鸦的行为特性,尤其是乌鸦在食物搜寻和藏匿过程中的智能行为。乌鸦是一种高度聪明的鸟类,它们展示出复杂的社会…

对补码的理解:两种求法

课本的结论是:二进制数的最高位是符号位。符号位为 0 表示正数和 零 ,符号位为 1 表示负数。 正数是原码反码补码都是一样的。负数的反码是:符号位不变,剩下位取反。 负数的补码是:符号位不变,剩下位取反&a…

eclipse创建maven项目

第一步:打开eclipse 我们选择java项目即可 点击finish即可 它会自动下载插件 然后在控制台上输入Y即可

ChatGPT:自然语言处理的新纪元与OpenAI的深度融合

随着人工智能技术的蓬勃发展,自然语言处理(NLP)领域取得了显著的进步。OpenAI作为这一领域的领军者,以其卓越的技术实力和创新能力,不断推动着NLP领域向前发展。其中ChatGPT作为OpenAI的重要成果更是在全球范围内引起了…

HAL库--内存保护(MPU)实验

MPU是内核外设,想获取相关资料只能从内核手册查找 MPU功能仅F7/H7系列具备 内存保护单元(MPU介绍) MPU基本介绍 说白了MPU用来管理内存和外设存储区的访问权限 MPU可配置保护8/16个内存区域(看芯片型号),每个区域最小要求256字节,且每个区…

C++ | Leetcode C++题解之第149题直线上最多的点数

题目&#xff1a; 题解&#xff1a; class Solution { public:int gcd(int a, int b) {return b ? gcd(b, a % b) : a;}int maxPoints(vector<vector<int>>& points) {int n points.size();if (n < 2) {return n;}int ret 0;for (int i 0; i < n; i…

阿里云运维第一步(监控):开箱即用的监控

作者&#xff1a;仲阳 这是云的时代&#xff0c;现在云计算已经在各行各业广泛的应用。但是上云对于大多数客户来说&#xff0c;依然有很大的学习成本&#xff0c;如下图仅是阿里云都有几百款产品&#xff0c;怎么选择&#xff1f;怎么用&#xff1f;对于客户来说都是问题。“…

高温车间降温通风方案

高温车间降温&#xff0c;解决厂房高温闷热必须做到以下两点才能实现&#xff0c;否则即使安装中央空调也没用&#xff1a;一、解决厂房内部热量 通过通排风负压风机、环保空调、工业大风扇等常用排热降温设备&#xff0c;降低室内温度&#xff1b;二、屏蔽外部太阳热源 …

5.0 Python 函数简介

1.函数 1.1 基本定义 定义: 将一组语句的集合通过函数进行封装, 简单来说是具有一定功能的代码容器, 想要执行这些语句, 只需要调用函数的名称即可. 特性: * 1. 可重复使用, 减少代码冗余. * 2. 组织结构清晰, 可读性增强. * 3. 可扩展性提高, 便于维护. 1.2 使用规则 函…

OpenCV学习(4.13) 霍夫变换

1.霍夫变换 霍夫变换&#xff08;Hough Transform&#xff09;是图像处理中的一种技术&#xff0c;主要用于检测图像中的直线、圆或其他形状。它通过将图像空间中的点映射到参数空间来实现&#xff0c;这样&#xff0c;图像空间中在同一直线上的点在参数空间中会形成一条曲线&…

CentOS系统自带Python2无法使用pip命令

Linux运维工具-ywtool 目录 一. 系统环境二.解决三.验证四.备注(1)输入"yum install -y python-pip",提示没有可用 python-pip包(2)安装完pip后进行升级 一. 系统环境 centos7系统自带的python2.7无法使用pip命令 二.解决 yum install python-pip -y三.验证 pip…

用PlayCanvas打造一个3D模型

本文由ScriptEcho平台提供技术支持 项目地址&#xff1a;传送门 基于 PlayCanvas 的 3D 物理场景开发 应用场景介绍 PlayCanvas 是一款功能强大的 3D 引擎&#xff0c;可用于创建各种类型的 3D 体验&#xff0c;包括游戏、模拟和交互式可视化。本技术博客将介绍如何使用 Pl…

【ARM Cache 及 MMU 系列文章 6.2 -- ARMv8/v9 如何读取 Cache 内部数据并对其进行解析?】

请阅读【ARM Cache 及 MMU/MPU 系列文章专栏导读】 及【嵌入式开发学习必备专栏】 文章目录 Direct access to internal memoryL1 cache encodingsL1 Cache Data 寄存器Cache 数据读取代码实现测试结果Direct access to internal memory 在ARMv8架构中,缓存(Cache)是用来加…

企业中的绩效管理

背景 企业中为何需要绩效管理&#xff0c;企业绩效管理为何比较难&#xff0c;这在企业管理中是非常难&#xff0c;同样也是非常有价值的命题&#xff0c;那么首先应该对这个命题有清晰的认知&#xff0c;特别是要想明白为何企业需要绩效管理&#xff0c;应该先明白企业。 企…

2024 年 19 种最佳大型语言模型

大型语言模型是 2023 年生成式人工智能热潮背后的推动力。然而&#xff0c;它们已经存在了一段时间了。 LLM是黑盒 AI 系统&#xff0c;它使用深度学习对超大数据集进行处理&#xff0c;以理解和生成新文本。现代 LLM 开始成型于 2014 年&#xff0c;当时一篇题为“通过联合学…

妙用OSGraph:发掘GitHub知识图谱上的开源故事

作者&#xff1a;范志东 1. 何为OSGraph&#xff1f; OSGraph (Open Source Graph) 是一个开源图谱关系洞察工具&#xff0c;基于GitHub开源数据全域图谱&#xff0c;实现开发者行为、项目社区生态的分析洞察。可以为开发者、项目Owner、开源布道师、社区运营等提供简洁直观的…

手机如何扫描拍照?方法分享

手机如何扫描拍照&#xff1f;在数字化时代&#xff0c;手机扫描拍照软件已经成为我们日常生活和工作中不可或缺的工具。无论是快速识别纸质文档&#xff0c;还是将照片中的文字转化为可编辑的文本&#xff0c;这些软件都为我们提供了极大的便利。然而&#xff0c;市面上的手机…

msvcp110.dll有什么解决方案,msvcp110.dll几种方法详细步骤教程

本文旨在探讨如何应对电脑出现 vcruntime140_1.dll 无法继续执行代码错误提示的问题。同时&#xff0c;将阐释该文件的作用&#xff0c;列举常见的错误问题&#xff0c;并提供一些在修复 vcruntime140_1.dll 时的注意事项&#xff0c;以避免在解决过程中引发其他问题。接下来&a…

【网络安全】【深度学习】【入侵检测】SDN模拟网络入侵攻击并检测,实时检测,深度学习【一】

文章目录 1. 前言2. Mininet 和 Ryu 的区别2.1 Mininet2.2 Ryu2.3 总结 3. 模拟攻击3.1 环境准备3.2 创建 Mininet 网络拓扑3.2 启动 Ryu 控制器3.3 模拟网络攻击3.4 捕获流量 4. 实时异常检测4.1 在 Ryu 控制器中4.2 在 h2 机器上的实验结果4.3 深度学习模型部署上h2机器 帮助…