CNN张量输入形状和特征图

CNN张量输入形状和特征图

这个是比较容易理解的张量的解释,比较直观

卷积神经网络

在这个神经网络编程系列中,我们正在逐步构建一个卷积神经网络(CNN),所以让我们看看CNN的张量输入。

在这里插入图片描述

在最后两篇文章中,我们介绍了张量和基本的张量属性秩、轴和形状。如果你还没有看过那些文章,我强烈建议你去查看。

我现在想做的是,用一个实际的例子来应用秩、轴和形状的概念。为此,我们将考虑将图像输入作为CNN的张量。

卷积神经网络是图像识别任务的首选网络,因为它们非常适合检测空间模式。

在这里插入图片描述

记住,张量的形状编码了关于张量轴、秩和索引的所有相关信息,所以我们将在示例中考虑形状,这将使我们能够计算出其他值。让我们开始。

CNN输入的形状

CNN输入的形状通常有四个长度。这意味着我们有一个秩为4的张量,有四个轴。张量形状中的每个索引代表一个特定的轴,每个索引处的值给出了相应轴的长度。

张量的每个轴通常代表输入数据的某种现实世界或逻辑特征。如果我们理解这些特征及其在张量中的轴位置,那么我们就可以很好地理解张量数据结构的整体。

为了分解这一点,我们将从右到左反向工作,考虑轴。记住,我们从最后一个轴开始,这是我们将要开始的地方,是实际数字或数据值所在的位置。

如果我们沿着最后一个轴运行并在那里检查一个元素,我们将看到一个数字。如果我们沿着任何其他轴运行,元素是多维数组。

对于图像,原始数据以像素的形式出现,由数字表示,并使用两个维度(高度和宽度)布局。

图像高度和宽度

为了表示两个维度,我们需要两个轴。

在这里插入图片描述

图像的高度和宽度在最后两个轴上表示。这里可能的值是28 x 28​,就像我们将在CNN项目中使用的fashion-MNIST数据集中的图像数据一样,或者是VGG16神经网络使用的224 x 224​图像大小,或者我们可以想象的任何其他图像尺寸。

图像颜色通道

下一个轴代表颜色通道。这里典型的值是3​,对于RGB图像,或者是1​,如果我们处理的是灰度图像。这种颜色通道的解释只适用于输入张量。

我们将在片刻后揭示,这个轴的解释在张量通过卷积层后会发生变化。

到目前为止,使用最后三个轴,我们已经将一个完整的图像表示为一个张量。我们有了颜色通道和高度和宽度,都以张量形式布局,使用了三个轴。

在这一点上,为了访问数据,我们需要三个索引。我们选择一个颜色通道,一个高度和一个宽度,以到达一个特定的像素值。

图像批次

这使我们来到了四个轴中的第一个,它代表批量大小。在神经网络中,我们通常使用样本的批次而不是单个样本,所以这个轴的长度告诉我们批次中有多少个样本。

这使我们能够看到,整个图像批次使用一个秩为4的张量表示。

假设我们有一个给定张量的形状[3, 1, 28, 28]​。使用形状,我们可以确定我们有三个图像的批次。

[批次大小,颜色通道,高度,宽度]

每张图像有一个单一的颜色通道,图像的高度和宽度分别是28 x 28​。

  1. 批次大小
  2. 颜色通道
  3. 高度
  4. 宽度

这给我们一个单一的秩为4的张量,最终将流经我们的卷积神经网络。

给定这样的图像张量,我们可以使用四个索引导航到批次中特定图像的特定颜色通道的特定像素。

NCHW vs NHWC vs CHWN

在阅读API文档和学术论文时,通常可以看到B​被N​替换。N​代表批次中的_样本数量_。

此外,我们在实际中经常遇到的另一个区别是维度的_重新排序_。常见的排序如下:

  • NCHW
  • NHWC
  • CHWN

正如我们所看到的,PyTorch使用NCHW​,而TensorFlow和Keras默认使用NHWC​(可以配置)。最终,选择使用哪一个主要取决于性能。一些库和算法更适合这些排序中的一种或另一种。

输出通道和特征图

让我们看看张量通过卷积层转换后,颜色通道轴的解释如何变化。

假设我们有一个张量,包含来自单个28 x 28​灰度图像的数据。这给我们提供了以下张量形状:[1, 1, 28, 28]​。

现在假设这个图像被传递到我们的CNN,并通过第一个卷积层。当这种情况发生时,我们的张量形状和底层数据将被卷积操作改变。

卷积改变了高度和宽度维度以及通道数量。输出通道的数量根据卷积层中使用的过滤器数量而变化。

在这里插入图片描述

假设我们有三个卷积过滤器,让我们看看通道轴会发生什么变化。

由于我们有三个卷积过滤器,我们将有三个来自卷积层的通道输出。这些通道是卷积层的输出,因此被称为输出_通道,而不是_颜色通道_。

三个过滤器中的每一个都对原始的单一输入通道进行卷积,产生三个输出通道。输出通道仍然由像素组成,但像素已经被卷积操作修改。根据过滤器的大小,输出的高度和宽度维度也会改变,但我们将在未来的文章中讨论这些细节。

特征图

有了输出通道,我们不再有颜色通道,而是有我们称之为_特征图_的修改后的通道。这些所谓的特征图是使用输入颜色通道和卷积过滤器进行卷积的结果。

特征图是由卷积产生的输出通道。

“特征”这个词被使用是因为输出代表了图像中的特定特征,例如边缘,并且这些映射在训练过程中网络学习时出现,并随着我们在网络中深入而变得更加复杂。

总结

我们现在应该对CNN输入张量的总体形状,以及秩、轴和形状的概念如何适用于这种理解有了很好的理解。

当我们开始构建CNN时,我们将在未来的文章中加深对这些概念的理解。在此之前,我们将在下一篇文章中见到你!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/952547.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】4.Linux常见指令以及权限理解(2)

文章目录 3. Linux指令3.1 ls指令和rm指令补充3.2 man指令(重要)3.3cp指令(重要)输出重定向3.3.1ubuntu20.04如何安装tree 3.4 mv指令(重要)mv指令更改文件名mv指令更改目录名 如何看待指令指令的重命名3.5…

硬件设计-齐纳管

目录 摘要 详情 齐纳管的工作电流、 摘要 齐纳管(Zener Diode)是一种特殊的二极管,它能够在特定的反向电压下保持电流稳定。正常情况下,二极管只允许正向电流通过,而阻止反向电流流过。而齐纳管在一定的反向电压下可…

C语言进阶——1数据的存储

目录 1. 数据类型介绍1.1 类型的基本归类:1.1.1 整形家族1.1.2 浮点型家族1.1.3 构造类型:1.1.4.指针类型1.1.5 void 表示空类型(无类型) 2. 整形在内存中的存储2.1 原码、反码、补码2.1.1 示例 20在计算机中的存储 2.2 大小端2.2…

【论文阅读】MAMBA系列学习

Mamba code:state-spaces/mamba: Mamba SSM architecture paper:https://arxiv.org/abs/2312.00752 背景 研究问题:如何在保持线性时间复杂度的同时,提升序列建模的性能,特别是在处理长序列和密集数据(如…

数据结构——查找二叉树

二叉搜索树的概念 如图所示&#xff0c;二叉搜索树&#xff08;binary search tree&#xff09;满足以下条件。 对于根节点&#xff0c;左子树中所有节点的值 < 根节点的值 < 右子树中所有节点的值。任意节点的左、右子树也是二叉搜索树&#xff0c;即同样满足条件 1. …

【并发多个请求并失败重发】

文章目录 需求思路代码 需求 可以一次发任意多个请求&#xff0c;如果有失败&#xff0c;则重发失败的请求&#xff0c;知道所有的都成功&#xff0c;或者超出最大重试次数&#xff0c;才返回最终结果。封装成可复用的并发请求工具。 实际的应用场景&#xff1a;数据太大&…

hutool糊涂工具通过注解设置excel宽度

import java.lang.annotation.*;Documented Retention(RetentionPolicy.RUNTIME) Target({ElementType.METHOD, ElementType.FIELD, ElementType.PARAMETER}) public interface ExcelStyle {int width() default 0; }/*** 聊天记录*/ Data public class DialogContentInfo {/**…

Redis高频知识点

Redis 目录 1 Redis是AP的还是CP的&#xff1f;2 介绍一下Redis的集群方案&#xff1f;3 什么是Redis的数据分片&#xff1f;4 Redis为什么这么快&#xff1f;5 Redis 的事务机制是怎样的&#xff1f;7 Redis的持久化机制是怎样的&#xff1f;8 Redis 的过期策略是怎么样的&a…

shell程序题1.11

作业&#xff1a; shell 脚本写出检测 /tmp/size.log 文件如果存在显示它的内容&#xff0c;不存在则创建一个文件将创建时间写入。 #!/bin/bash#-f 选项来判断 /tmp/size.log 文件是否是一个常规文件if [ -f "/tmp/size.log" ];thencat /tmp/size.logecho "…

Docker: 教程07 - ( 如何对 Docker 进行降级和升级)

如果我们使用 docker 来管理容器&#xff0c;那么保持 docker 引擎的更新将会是十分重要的&#xff0c;这一篇文章我们将会讨论如何对Docker 进行降级和升级。 准备工作 - docker 环境 我们需要拥有一个安装好 docker 的运行环境。 如果你需要了解如何安装 docker 可以通过如…

LabVIEW与CANopen常见问题及解决方法

1. 固件版本不匹配问题 ​ 错误信息&#xff1a; "Firmware image version is incompatible with C Series modules. Solution: Update the firmware by following the instructions in Firmware_Update_Instructions.html, accessible from the National Instruments\NI…

《框架程序设计》期末复习

目录 Maven 简介 工作机制&#xff08;★&#xff09; 依赖配置&#xff08;★&#xff09; Maven命令 MyBatis 入门 单参数查询&#xff08;★&#xff09; 多参数查询&#xff08;★★★&#xff09; 自定义映射关系&#xff08;★★★&#xff09; 基本增删改查操…

51单片机——I2C-EEPROM

I2C&#xff1a;总线标准或通信协议 EEPROM&#xff1a;AT24C02芯片 开发板板载了1个EEPROM模块&#xff0c;可实现IIC通信 1、EEPROM模块电路&#xff08;AT24C02&#xff09; 芯片的SCL和SDA管脚是连接在单片机的P2.1和P2.0上 2、I2C介绍 I2C&#xff08;Inter&#xff…

了解npm:JavaScript包管理工具

在JavaScript的生态系统中&#xff0c;npm&#xff08;Node Package Manager&#xff09;无疑是一个举足轻重的存在。它不仅是Node.js的包管理器&#xff0c;更是前端开发不可或缺的一部分&#xff0c;为开发者提供了丰富的包资源、便捷的包管理以及强大的社区支持。本文将深入…

Vscode辅助编码AI神器continue插件

案例效果 1、安装或者更新vscode 有些版本的vscode不支持continue,最好更新到最新版,也可以直接官网下载 https://code.visualstudio.com/Download 2、安装continue插件 搜索continue,还未安装的,右下脚有个Install,点击安装即可 <

ffmpeg aac s16 encode_audio.c

用ffmpeg库时&#xff0c;用代码对pcm内容采用aac编码进行压缩&#xff0c;出现如下错误。 [aac 000002bc5edc6e40] Format aac detected only with low score of 1, misdetection possible! [aac 000002bc5edc8140] Error decoding AAC frame header. [aac 000002bc5edc81…

what?ngify 比 axios 更好用,更强大?

文章目录 前言一、什么是ngify&#xff1f;二、npm安装三、发起请求3.1 获取 JSON 数据3.2 获取其他类型的数据3.3 改变服务器状态3.4 设置 URL 参数3.5 设置请求标头3.6 与服务器响应事件交互3.7 接收原始进度事件3.8 处理请求失败3.9 Http Observables 四、更换 HTTP 请求实现…

论文笔记(六十一)Implicit Behavioral Cloning

Implicit Behavioral Cloning 文章概括摘要1 引言2 背景&#xff1a;隐式模型的训练与推理3 隐式模型与显式模型的有趣属性4 policy学习成果5 理论见解&#xff1a;隐式模型的通用逼近性6 相关工作7 结论 文章概括 引用&#xff1a; inproceedings{florence2022implicit,titl…

CES 2025|美格智能高算力AI模组助力“通天晓”人形机器人震撼发布

当地时间1月7日&#xff0c;2025年国际消费电子展&#xff08;CES 2025&#xff09;在美国拉斯维加斯正式开幕。美格智能合作伙伴阿加犀联合高通在展会上面向全球重磅发布人形机器人原型机——通天晓&#xff08;Ultra Magnus&#xff09;。该人形机器人内置美格智能基于高通QC…

【安卓开发】自定义应用图标

要在 Android Studio 中设置应用的图标并自定义大小&#xff0c;可以使用 Android Studio 提供的图标生成工具。以下是具体步骤&#xff1a; 1、打开图标生成工具&#xff1a; 在 Android Studio 中&#xff0c;右键点击 res 文件夹&#xff0c;选择 New -> Image Asset。 …