机器学习10-卷积和卷积核3

纹理表示
卷积神经网络
- 全链接神经网络的瓶颈
- 卷积网络中的卷积操作
- - 特征响应图组尺寸计算
池化操作
- 示例
图像增强
- 翻转
- 随机缩放抠图
- 色彩抖动
- 其他方案
- - 1. 平移
  - 2. 旋转
  - 3. 拉伸
  - 4. 径向畸变
  - 5. 裁剪

纹理表示

在这里插入图片描述

如何去表示纹理？

基于卷积核组的纹理表示方法：利用卷积核组提取图像中的纹理基，利用基元的统计信息来表示图像中的纹理。

卷积核组

在这里插入图片描述

1.设计卷积核组
2.利用卷积核组对图像进行卷积操作获得对应的特征响应图组；
3.利用特征响应图的某种统计信息来表示图像中的纹理

在这里插入图片描述

ri ,哪种边缘信息的统计响应均值越高那么图中这个边缘种类就越多，记录这多个基元的响应图均值就记录了这张图的边缘信息。

在这里插入图片描述
颜色越浅均值越高。

1对应C
2===》A
3===》B

设计重点：
卷积核类型 (边缘条形以及点状)
卷积核尺度(3-6个尺度）
卷积核方向 (6个角度)

在这里插入图片描述

总结：
1.设计卷积核组；
2. 利用卷积核组对图像进行卷积操作获得对应的特征响应图组；
3.利用特征响应图的某种统计信息来表示图像中的纹理。

卷积神经网络

全链接神经网络的瓶颈

在这里插入图片描述
3072+1,120000+1 还有一个偏置b。全连接神经网络只适合处理小图像，处理大图像的计算量过大，速度会很慢。
如果使用卷积的方式，将图像卷积成几个特征，然后再将特征作为连接网络的输入层，可以大大减少计算量。

在这里插入图片描述
卷积核：

不仅具有宽和高，还具有深度，常写成如下形式：
宽度×高度×深度
卷积核参数不仅包括核中存储的权值，还包括一个偏置值

卷积网络中的卷积操作

在这里插入图片描述
计算过程：

将卷积核展成一个5x5x3的向量，同时将其覆盖的图像区域按相同的展开方式展成5x5x3的向量
计算两者的点乘。
在点乘的结果上加上偏移量
数学公式：w^T *x + b
w为卷积核的权值，b为卷积核的偏置

在这里插入图片描述

卷积神经网络中，卷积核可以按照指定的间隔进行卷积操作，这个间隔就是卷积步长。
在这里插入图片描述

特征响应图组尺寸计算

给定输入数据矩阵时，影响输出的特征图组尺寸大小的因素：

卷积核的宽、高；
是否采用边界填充操作；
卷积步长;
该层的卷积核个数

在这里插入图片描述

池化操作

在机器学习中，池化（Pooling）操作有以下几个重要作用：

1. 降维
  池化层通过对输入数据进行下采样，减少数据的维度。例如，最大池化（Max Pooling）会在一个局部区域内选择最大值作为输出，这样可以将输入数据的尺寸缩小，减少后续层的计算量。
1. 特征不变性
  平移不变性：池化操作使得模型对输入数据的小幅度平移具有不变性。例如，最大池化选择局部区域内的最大值，无论该最大值在局部区域内如何平移，池化结果不变。
  旋转不变性和缩放不变性：一定程度上，池化操作也能使模型对输入数据的小幅度旋转和缩放具有一定的不变性。
1. 防止过拟合
  池化操作通过减少参数数量和计算量，能够在一定程度上防止模型过拟合。通过降低数据的复杂度，模型更容易学习到数据中的主要特征，而不是记住每个数据点的细节。
1. 加速训练
  由于池化操作减少了数据的维度，网络中的参数数量也相应减少，这使得训练过程中的计算量减小，从而加速训练过程。
1. 特征提取
  池化操作可以帮助提取数据中的主要特征。例如，平均池化（Average Pooling）可以提取局部区域内的平均特征，最大池化可以提取局部区域内最显著的特征。

常见的池化方法包括最大池化、平均池化和随机池化。不同的池化方法在不同的场景下有不同的应用效果。
常见的池化操作：
最大池化：使用区域内的最大值来代表这个区域
平均池化：采用区域内所有值的均值作为代表。
池化层的超参数：池化窗口和池化步长

示例

在这里插入图片描述

图像增强

**存在的问题：**过拟合的原因是学习样本太少，导致无法训练出能够泛化到新数
据的模型。
数据增强： 是从现有的训练样本中生成更多的训练数据，其方法是利用多种能
够生成可信图像的随机变换来增加样本。
数据增强的目标： 模型在训练时不会两次查看完全相同的图像。这让模型能够
观察到数据的更多内容，从而具有更好的泛化能力