【AI】卷积神经网络CNN

不定期更新,建议关注收藏点赞。


目录

  • 零碎小组件
  • 经验总结
  • 早期的CNN

最重要的模型架构无非是cnn 或 transformer

零碎小组件

  • 全连接神经网络
    目前已经被替代。
    每个神经元都有参与,但由于数据中的特征点变化大,全连接神经网络把所有数据特征都学习了,故效果不好。
  • 感受野:影响CNN特征的输入图像的区域
  1. 感受野并非越大越好。CNN就是获取局部信息,达到提高特征有效性。
  2. 实际感受野远小于理论感受野。因为感受野中的每个元素(像素)对输出单元的贡献不相同,实际上符合高斯分布,越边缘的贡献越小。
    比如,可视化以下算法的感受野
    在这里插入图片描述
    • 如何增大感受野?CNN中可以堆叠卷积层,这个结论通过VGG得到,2个33的卷积=1个55的卷积;改变初始权重,使得卷积核中心的权值更小,边缘的权值更大,但不能改变本质是高斯分布;使用可变形卷积+扩张卷积,改变之前CNN每个单元连接到局部矩形卷积窗口,使用相同数量的连接将每个单元稀疏连接到更大的底层区域。
  • 全局特征 v.s. 局部特征 ,低级特征v.s. 高级特征 在DL中都指代什么
    有时候这几个特征都描述的是同一个东西,只是在不同的故事中定位不一样。
  • vision transormer理论上比cnn好在哪里?在所有的任务上都好吗?
    目前大部分不是CNN就是transformer。

经验总结

  1. 代码不一定都要重写,东西不变故事变也是可以的
  2. 深度学习中 特色的形状 不同的样子很重要,而不是纠结几个卷积几个池化,从VGG之后开始转向这一点
  3. 要知道之前历史中的工作成果是哪些,弄清楚figure out
  4. 模型如果开始出错,不停的反向传播之后会越来越错,形成一个恶性循环,故这里也是一个能发现纠错的方法。

早期的CNN

  • LeNet5
    在这里插入图片描述
    输入(HWC):灰度图 32321
    模型组成:conv+pooling+FC(激活函数)
    应用场景:手写字符的识别与分类
    特点:用conv替代MLP(Multilayer Perceptron)极大降低参数量;通过池化进一步降低参数量,max和avg两种;同时提高了识别率

目前pooling用的比较少,因为丢失信息多

扩展:池化的反向传播是怎么处理的?

  • VGG16
    在这里插入图片描述

特点:

  1. 结构非常简洁,整个网络都使用了相同大小的卷积核33,和最大池化尺寸22
  2. 几个小滤波器33卷积层比一个大滤波器55或77卷积层好。因为2个33的卷积是有多个非线形层的多次整合,肯定比一次单次的好
  3. 验证适度加深网络结构可以提升性能。(不是越深越好,见后面Resnet)
  4. 耗费大量计算资源,使用更多的参数,占用140M内存,绝大多数参数来自FC
  • ResNet
    特点:
  1. 验证了模型深到一定程度效果不升反降,称为degradation;但这并不能用过拟合(训练误差小、测试误差大)来解释,因为这个模型训练误差和测试误差都很大;原因也不是梯度消失->0或爆炸,不会消失是因为模型中加上Batch Normalization BN归一化层控制每层输入的模值,不会爆炸是因为容易切割减小;由于非线性激活函数Relu使得输入到输出过程是不可逆的存在信息损失,每一层都会改变学习分布,对于通道数少的特征层需要扩张到5~30倍再Relu压缩才能保持信息。
  2. 在原有的上进行查漏补缺比重新学简单,进行跳接shortcut connection,通过跳接在激活函数前,将上几层之前的输出与本层计算输出相加,结果输入到激活函数中作为本层输出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/966275.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

企业FTP替代升级,实现传输大文件提升100倍!

随着信息技术的飞速发展,网络安全环境也变得越来越复杂。在这种背景下,传统的FTP(文件传输协议)已经很难满足现代企业对文件传输的需求了。FTP虽然用起来简单,但它的局限性和安全漏洞让它在面对高效、安全的数据交换时…

LabVIEW铅酸蓄电池测试系统

本文介绍了基于LabVIEW的通用飞机铅酸蓄电池测试系统的设计与实现。系统通过模块化设计,利用多点传感器采集与高效的数据处理技术,显著提高了蓄电池测试的准确性和效率。 ​ 项目背景 随着通用航空的快速发展,对飞机铅酸蓄电池的测试需求也…

Lecture8 | LPV VXGI SSAO SSDO

Review: Lecture 7 | Lecture 8 LPV (Light Propagation Volumes) Light Propagation Volumes(LPV)-孤岛惊魂CryEngine引进的技术 LPV做GI快|好 大体步骤: Step1.Generation of Radiance Point Set Scene Representation 生成辐射点集的场景表示:辐射…

0012—数组

存取一组数据,使用数组。 数组是一组相同类型元素的集合。 要存储1-10的数字,怎么存储? C语言中给了数组的定义:一组相同类型元素的集合。 创建一个空间创建一组数: 一、数组的定义 int arr[10] {1,2,3,4,5,6,7,8,…

AI绘画社区:解锁艺术共创的无限可能(9/10)

AI 绘画:不只是技术,更是社交新潮流 在科技飞速发展的今天,AI 绘画早已不再仅仅是一项孤立的技术,它正以惊人的速度融入我们的社交生活,成为艺术爱好者们交流互动的全新方式,构建起一个充满活力与创意的社…

让office集成deepseek,支持office和WPS办公软件!(体验感受)

导读 AIGC:AIGC是一种新的人工智能技术,它的全称是Artificial Intelligence Generative Content,即人工智能生成内容。 它是一种基于机器学习和自然语言处理的技术,能够自动产生文本、图像、音频等多种类型的内容。这些内容可以是新闻文章、…

c++ template-3

第 7 章 按值传递还是按引用传递 从一开始,C就提供了按值传递(call-by-value)和按引用传递(call-by-reference)两种参数传递方式,但是具体该怎么选择,有时并不容易确定:通常对复杂类…

使用springAI实现图片相识度搜索

类似的功能:淘宝拍照识别商品。图片相识度匹配 实现方式:其实很简单,用springai 将图片转换为向量数据,然后搜索就是先把需要搜索的图片转位向量再用向量数据去向量数据库搜索 但是springai现在不支持多模态嵌入数据库。做了一些…

私有化部署DeepSeek并SpringBoot集成使用(附UI界面使用教程-支持语音、图片)

私有化部署DeepSeek并SpringBoot集成使用(附UI界面使用教程-支持语音、图片) windows部署ollama Ollama 是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计 下载ollama 下载地址(…

半导体制造工艺讲解

目录 一、半导体制造工艺的概述 二、单晶硅片的制造 1.单晶硅的制造 2.晶棒的切割、研磨 3.晶棒的切片、倒角和打磨 4.晶圆的检测和清洗 三、晶圆制造 1.氧化与涂胶 2.光刻与显影 3.刻蚀与脱胶 4.掺杂与退火 5.薄膜沉积、金属化和晶圆减薄 6.MOSFET在晶圆表面的形…

正则表达式的简单介绍 + regex_match使用

正则表达式 正则表达式(Regular Expression,简称 regex)是一种用于匹配字符串的模式。它由一系列字符和特殊符号组成,用于描述、匹配一系列符合某个句法规则的字符串。正则表达式广泛应用于文本搜索、替换、验证等场景。 它的主…

AnythingLLM开发者接口API测试

《Win10OllamaAnythingLLMDeepSeek构建本地多人访问知识库》见上一篇文章,本文在上篇基础上进行。 1.生成本地API 密钥 2.打开API测试页面(http://localhost:3001/api/docs/) 就可以在页面测试API了 2.测试获取用户接口(/v1/admin/users) 3…

TypeScript 中的类:面向对象编程的基础

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

二级C语言题解:矩阵主、反对角线元素之和,二分法求方程根,处理字符串中 * 号

目录 一、程序填空📝 --- 矩阵主、反对角线元素之和 题目📃 分析🧐 二、程序修改🛠️ --- 二分法求方程根 题目📃 分析🧐 三、程序设计💻 --- 处理字符串中 * 号 题目&#x1f…

Qt 支持的动画格式对比,Lottie/APNG/GIF/WEBP

Qt版本:6.7.2 , QML 一,Lottie 在qml中使用LottieAnimation即可,但有三个问题: 1.动画加载中报错: 如果图片(.json)本身存在不支持的effect 或shape type等,效果并不好&#xff1a…

SpringCloud - Nacos注册/配置中心

前言 该博客为Nacos学习笔记,主要目的是为了帮助后期快速复习使用 学习视频:7小快速通关SpringCloud 辅助文档:SpringCloud快速通关 一、简介 Nacos官网:https://nacos.io/docs/next/quickstart/quick-start/ Nacos /nɑ:kəʊ…

老游戏回顾:TL2

TL2是一部ARPG游戏,是TL的续作游戏,由位于美国西雅图的Runic Games开发,游戏于2012年9月20日上市,简体中文版于2013年4月10日在国内上市。 2有非常独特的艺术风格,这些在1中就已经形成,经过升级将使这款游…

DeepSeek-R1 云环境搭建部署流程

DeepSeek横空出世,在国际AI圈备受关注,作为个人开发者,AI的应用可以有效地提高个人开发效率。除此之外,DeepSeek的思考过程、思考能力是开放的,这对我们对结果调优有很好的帮助效果。 DeepSeek是一个基于人工智能技术…

利用ETL工具进行数据挖掘

ETL的基本概念 数据抽取(Extraction):从不同源头系统中获取所需数据的步骤。比如从mysql中拿取数据就是一种简单的抽取动作,从API接口拿取数据也是。 数据转换(Transformation):清洗、整合和转…

k8s网络插件及基础命令

一、k8s的cni网络插件 1.k8s的内部网络模式 pod内的容器与容器之间的通信。一个节点上的pod之间的通信,docker0网桥直接通信。不同节点上的pod之间的通信:通过物理网卡的ip地址和其他节点上的物理网卡的设备进行通信,然后把流量转发到指定的…