CNN 01(CNN简介)

article2025/1/24 1:01:56/文章来源:https://blog.csdn.net/peng_258/article/details/132528359

一、卷积神经网络的发展

convolutional neural network

在计算机视觉领域，通常要做的就是指用机器程序替代人眼对目标图像进行识别等。那么神经网络也好还是卷积神经网络其实都是上个世纪就有的算法，只是近些年来电脑的计算能力已非当年的那种计算水平，同时现在的训练数据很多，于是神经网络的相关算法又重新流行起来，因此卷积神经网络也一样流行。

1974年，Paul Werbos提出了误差反向传导来训练人工神经网络，使得训练多层神经网络成为可能。
1979年，Kunihiko Fukushima（福岛邦彦），提出了Neocognitron，卷积、池化的概念基本形成。
1986年，Geoffrey Hinton与人合著了一篇论文：Learning representations by back-propagation errors。
1989年，Yann LeCun提出了一种用反向传导进行更新的卷积神经网络，称为LeNet。
1998年，Yann LeCun改进了原来的卷积网络，LeNet-5。

深度学习三大领域: 计算机视觉CV 自然语言处理NLP 语音识别 VR

二、为什么需要卷积神经网络

2.1 图像特征数量对神经网络效果压力

假设下图是一图片大小为28 * 28 的黑白图片时候，每一个像素点只有一个值（单通道）。那么总的数值个数为 784个特征。

那现在这张图片是彩色的，那么彩色图片由RGB三通道组成，也就意味着总的数值有28* 28 *3 = 2352个值。

从上面我们得到一张图片的输入是2352个特征值，即神经网路当中与若干个神经元连接，假设第一个隐层是10个神经元，那么也就是23520个权重参数。

如果图片再大一些呢，假设图片为1000 *1000* 3，那么总共有3百万数值，同样接入10个神经元，那么就是3千万个权重参数。这样的参数大小，神经网络参数更新需要大量的计算不说，也很难达到更好的效果，大家就不倾向于使用多层神经网络了。

所以就有了卷积神经网络的流行，那么卷积神经网络为什么大家会选择它。那么先来介绍感受野以及边缘检测的概念。

2.2 感受野

1962年Hubel和Wiesel通过对猫视觉皮层细胞的研究，提出了感受野(receptive field)的概念，Fukushima基于感受野概念提出的神经认知机(neocognitron)可以看作是卷积神经网络的第一个实现网络。

单个感受器与许多感觉神经纤维相联系，感觉信息是通过许多感受神经纤维发放总和性的空间与时间类型不同的冲动，相当于经过编码来传递。

2.3 边缘检测

为了能够用更少的参数，检测出更多的信息，基于上面的感受野思想。通常神经网络需要检测出物体最明显的垂直和水平边缘来区分物体。比如

看一个列子，一个 6×6的图像卷积与一个3×3的过滤器（Filter or kenel）进行卷积运算（符号为 *），* 也可能是矩阵乘法所以通常特别指定是卷积的时候代表卷积意思。

相当于将 Filter 放在Image 上，从左到右、从上到下地（默认一个像素）移动过整个Image，分别计算 ImageImage 被 Filter 盖住的部分与 Filter的逐元素乘积的和

在这个6×6 的图像中，左边一半像素的值全是 10，右边一半像素的值全是 0，中间是一条非常明显的垂直边缘。这个图像与过滤器卷积的结果中，中间两列的值都是 30，两边两列的值都是 0，即检测到了原 6×66×6 图像中的垂直边缘。

注：虽然看上去非常粗，是因为我们的图像太小，只有5个像素长、宽，所以最终得到结果看到的是两个像素位置，如果在一个500 x 500的图当中，就是一个竖直的边缘了。

随着深度学习的发展，我们需要检测更复杂的图像中的边缘，与其使用由人手工设计的过滤器，还可以将过滤器中的数值作为参数，通过反向传播来学习得到。算法可以根据实际数据来选择合适的检测目标，无论是检测水平边缘、垂直边缘还是其他角度的边缘，并习得图像的低层特征。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/92378.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

kubernetes--技术文档--可视化管理界面dashboard安装部署

kubernetes--技术文档--可视化管理界面dashboard安装部署

阿丹： 使用官方提供的可视化界面来完成。 Kubernetes Dashboard是Kubernetes集群的Web UI，用户可以通过Dashboard进行管理集群内所有资源对象，例如查看资源对象的运行情况，部署新的资源对象，伸缩Deployment中的Pod数量…

阅读更多...

搜索二叉树的算法解析与实例演示

搜索二叉树的算法解析与实例演示

目录一.搜索二叉树的特性与实现1.特点2.实现二.搜索二叉树的性能一.搜索二叉树的特性与实现 1.特点二叉搜索树是特殊的二叉树，它有着更严格的数据结构特点： （1）非空左子树的所有键值小于其根结点的键值。 （2&…

阅读更多...

【C++入门到精通】C++入门 —— 多态（抽象类和虚函数的魅力）

【C++入门到精通】C++入门 —— 多态（抽象类和虚函数的魅力）

阅读导航前言一、多态的概念1. 概念2. 多态的特点二、多态的定义及实现1. 多态的构成条件2. 虚函数3. 虚函数的重写⭕虚函数重写的两个例外1.协变(基类与派生类虚函数返回值类型不同)2.析构函数的重写(基类与派生类析构函数的名字不同) 4. override 和 final（C11 …

阅读更多...

1.4亿X区城市运行“一网统管”体系建设项目项目招标WORD

1.4亿X区城市运行“一网统管”体系建设项目项目招标WORD

导读：原文《1.4亿X区城市运行“一网统管”体系建设项目项目招标WORD》（获取来源见文尾），本文精选其中精华及架构部分，逻辑清晰、内容完整，为快速形成售前方案提供参考。部分内容： 各部分需求…

阅读更多...

为Claude的分析内容做准备：提取PDF页面内容的简易应用程序

为Claude的分析内容做准备：提取PDF页面内容的简易应用程序

由于Claude虽然可以分析整个文件，但是对文件的大小以及字数是有限制的，为了将pdf文件分批传入Claude人工智能分析和总结文章内容，才有了这篇博客： 在本篇博客中，我们将介绍一个基于 wxPython 和 PyMuPDF 库编写的简易的…

阅读更多...

FreeSWITCH 1.10.10 简单图形化界面5 - 使用百度TTS

FreeSWITCH 1.10.10 简单图形化界面5 - 使用百度TTS

FreeSWITCH 1.10.10 简单图形化界面5 - 使用百度TTS 0、界面预览1、注册百度AI开放平台，开通语音识别服务2、获取AppID/API Key/Secret Key3、安装百度语音合成sdk4、合成代码5、在PBX中使用百度TTS6、音乐文件-TTS7、拨号规则-tts_command 0、界面预览 http://…

阅读更多...

FxFactory 8 Pro Mac 苹果电脑版 fcpx/ae/motion视觉特效软件包

FxFactory 8 Pro Mac 苹果电脑版 fcpx/ae/motion视觉特效软件包

FxFactory pro for mac是应用在Mac上的fcpx/ae/pr视觉特效插件包，包含了成百上千的视觉效果，打包了很多插件，如调色插件，转场插件，视觉插件，特效插件，文字插件，音频插件，…

阅读更多...

C语言基础之——指针（下）

C语言基础之——指针（下）

前言：本篇文章将继续讲解有关指针的剩余基础知识。学无止境，一起加油叭！！ 目录一.指针运算 1.指针 - 整数 2.指针的关系运算 3.指针 - 指针二.指针与数组三.二级指针四.指针数组总结一.指针运算指针运算包括以下三…

阅读更多...

09-微信小程序网络请求API(实现轮播广告和简易的聊天窗口)

09-微信小程序网络请求API(实现轮播广告和简易的聊天窗口)

09-微信小程序API网络请求(实现轮播广告和简易的聊天窗口) 文章目录微信小程序API服务器域名配置注意网络相关APIrequestRequestTask 请求任务对象object.success 回调函数object.fail 回调函数案例代码（实现轮播图） WebSocket案例代码（实现…

阅读更多...

C++数据结构学习——栈

C++数据结构学习——栈

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、栈二、C语言实现1.声明代码2.实现增删查改代码3.测试代码总结前言栈（Stack）是计算机科学中一种常见的数据结构，它是…

阅读更多...

PHP敬老院管理系统Dreamweaver开发mysql数据库web结构php编程计算机网页

PHP敬老院管理系统Dreamweaver开发mysql数据库web结构php编程计算机网页

一、源码特点 PHP 敬老院管理系统（养老）是一套完善的web设计系统，对理解php编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。论文 https://download.csdn.net/download/qq_41221322/…

阅读更多...

Wlan——STA上线流程与802.11MAC帧讲解以及报文转发路径

Wlan——STA上线流程与802.11MAC帧讲解以及报文转发路径

目录 802.11MAC帧基本概念 802.11帧结构 802.11MAC帧的分类管理帧控制帧数据帧 STA接入无线网络流程信号扫描—管理帧链路认证—管理帧用户关联—管理帧用户上线不同802.11帧的转发路径 802.11MAC帧基本概念 802.11协议在802家族中的角色位置其中802.3标…

阅读更多...

数据结构——栈和队列OJ题

数据结构——栈和队列OJ题

栈和队列小提升！ 前言一、用队列实现栈队列接口实现（1）栈的接口定义（2）栈的初始化（3）入栈函数的定义（4）出栈函数的定义（5）查找栈顶元素&#xff0…

阅读更多...

Python“牵手”当当网商品详情API接口运用场景及功能介绍,当当网API接口申请指南

Python“牵手”当当网商品详情API接口运用场景及功能介绍,当当网API接口申请指南

当当网是全球知名的综合性网上购物商城，由国内著名出版机构科文公司、美国老虎基金、美国IDG集团、卢森堡剑桥集团、亚洲创业投资基金（原名软银中国创业基金）共同投资成立。当当网是北京当当网信息技术有限公司营运的一家中文购物网站&#x…

阅读更多...

QT版权查询

QT版权查询

文章目录 QT工具版权QT模块版权查询根据条件自动筛选： Qt Features, Framework Essentials, Modules, Tools & Add-Ons QT工具版权 Licensing QT模块版权查询在 All Modules 中点击进入每个模块，在详细内容中一般有Lisence相关内容。 Licens…

阅读更多...

uniapp - 实现卡片式胶囊单选后右上角出现 “√“ 对勾对号选中效果功能，适用于小程序h5网页app全平台通用（一键复制组件源码，开箱即用！）

uniapp - 实现卡片式胶囊单选后右上角出现 “√“ 对勾对号选中效果功能，适用于小程序h5网页app全平台通用（一键复制组件源码，开箱即用！）

效果图 uniapp全平台兼容（小程序/h5网页/app）实现点击选择后，右上角出现 √ 对号效果（角标形式展现），功能组件，改个样式，直接复制使用该组件。组件源码在 components 组件文件夹下，随便建立一个 .vue 文件，一键复制下方源码。

阅读更多...

DockerFile解析

DockerFile解析

1. 是什么 Dockerfile是田来构建Docker镜像的文本文件，是由一条条构建镜像所需的指令和参数构成的脚本 1.1 概述 1.2 官网 Dockerfile reference | Docker Documentation 1.3 构建三步骤 1. 编写dockerfile文件 2. docker build命令构建镜像 3. docker run依镜像运…

阅读更多...

文本分类任务

文本分类任务

文章目录引言1. 文本分类-使用场景2. 自定义类别任务3. 贝叶斯算法3.1 预备知识3.2 贝叶斯公式3.3 贝叶斯公式的应用3.4 贝叶斯公式在NLP中的应用3.5 贝叶斯公式-文本分类3.6 代码实现3.7 贝叶斯算法的优缺点 4. 支持向量机4.1 支持向量机-核函数4.2 支持向量机-解决多分类4.3…

阅读更多...

go学习之流程控制语句

go学习之流程控制语句

文章目录流程控制语句1.顺序控制2.分支控制2.1单分支2.2双分支单分支和双分支的四个题目switch分支结构 3.循环控制for循环控制while 和do...while的实现 4.跳转控制语句breakcontinuegotoreturngotoreturn 流程控制语句介绍：在程序中，程序运行的流程…

阅读更多...

【LeetCode75】第三十七题二叉树中的最长交错路径

【LeetCode75】第三十七题二叉树中的最长交错路径

目录题目： 示例： 分析： 代码： 题目： 示例： 分析： 给我们一棵二叉树，问我们在这棵树里能找到的最长交错路径。最长交错路径就是在二叉树里一左一右一左一右这样走，最…

阅读更多...

最新文章