卷积与图像卷积操作

什么是卷积

        教材上的卷积公式如下图:

        结合经典的水池问题来说明卷积公式:

  • f(t)代表进水量,表示t时刻进入的水量
  • g(x-t)代表排水量,表示t时刻进入的水量,在x时候还剩多少(%)

        上面说的只是特殊情况,即使只有三个时间点有进水,而在实际情况下我们的水池是每个时刻都会有进水,所以我们需要累加x时刻之前的每一个时刻的剩余量,得到以下公式:

         结合两个函数我们有以下分析:

        以t时刻为例,表示这个时刻刚刚进水还没有开始排,所以对应着g(t)中的A点。而t-1时刻到t时刻已经过去了一个小时,所以在g(t)中对应着B点。以此类推得到下面的图像。

        上图图看着有些别扭,这个时候我们把g(t)函数进行翻转就会得到下图的样子。这样对应上了教材上的定义:

  • 对g函数进行翻转,相当于在数轴上把g函数从右边褶到左边去,也就是卷积的“卷”的由来。
  • 然后再把g函数平移到n,在这个位置对两个函数的对应点相乘,然后相加,这个过程是卷积的“积”的过程。

        总结:如果一个系统输入不稳定而输出是稳定的,那么可以使用卷积来求这个系统的存量 

图像卷积操作

        什么是图像卷积操作

        卷积操作的目的是提取图像的特征。 一张图片是由多个像素点组成的,每个像素点都有它自己对应的信息(如:RGB值、灰度值等)。我们把像素点抽象成网格,而对应的像素点信息则是网格内的值,如下图所示:

        

       卷积操作就是把卷积核拍在原图上,对应的位置两两相乘,最后把得到的九个数累加得到新图像网格的一个值,然后卷积核继续向右或者向下滑动一个网格,继续计算直到遍历完整个原始网格。如下图所示。

        而我们的卷积操作就是使用卷积核对原图片进行特征提取得到新的图片,过程就是使用卷积核(以大小3×3的为例),由于卷积操作最后输出的网格大小会比原图小一圈,所以在使用卷积操作的时候可以在原图片外圈补0再进行卷积操作,这样输入和输出图片大小就相同了。如下:

        卷积与图像卷积的关系

        我们把图像当做f函数,则卷积核是g函数。在之前的水池例子中,我们可以说x时刻前的每一个时刻对我们当前x时刻的水量都有影响(因为每个时刻都有入水和出水)。而在图像卷积中,对于规定3×3大小的卷积核,我们认为的是当前像素点受其周围一圈像素点影响。如下图为例:

        经过对原图像的补零后,我们输入和输出的图像大小相同,当我们的卷积核落在原图上的时候,卷积核的中心网格对应的刚好是图片的左上角网格,而在卷积输出后,卷积的结果依然是对应着左上角网格。那么可以认为卷积操作其实是规定当前网格它周围一圈的网格对它的影响。

         

        深度学习中的卷积为何能用互相关运算代替

        在之前提到的卷积中,有说明需要反转g函数,而在深度学习中我们可以使用直接按位点乘(互相关运行),也可以把卷积核顺时针旋转180度(即将卷积核上下翻转再左右翻转)然后再做点乘。但如果它们使用相同的核数组,对于同一个输入,输出往往并不相同。

        那么,你也许会好奇在深度学习中卷积层为何能使用互相关运算替代卷积运算。这主要原因在于,在深度学习中核数组都是学出来的:卷积层无论使用互相关运算或卷积运算都不会影响模型预测时的输出。假设卷积层使用互相关运算学出某一核数组。设其他条件不变,使用卷积运算学出的核数组即为互相关核数组按上下、左右翻转。也就是说原始输入与学出的已翻转的核数组再做卷积运算时,依然得到的是同样输出。因此大多数深度学习中提到的卷积运算均指互相关运算。

        卷积核的作用

        不同的卷积核在图片的卷积操作中起到不同的作用,如下图:

 

        卷积核的局部特征提取

        结合一个例子来说明卷积核是如何进行特征提取的。

        我们把输入的一个x图片看成以下内容: 

         将整个图像与特定的卷积核进行卷积操作来提取局部特征,提取局部特征的目的是让卷积神经网络中的神经网络通过这些局部特征去判断和识别图片的内容。

参考

1.一文看懂卷积运算(convolution)与互相关运算(cross-correlation)的区别-CSDN博客

2.从“卷积”、到“图像卷积操作”、再到“卷积神经网络”,“卷积”意义的3次改变_哔哩哔哩_bilibili

3.卷积操作的基础知识_卷及操作-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/803307.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

连锁零售门店分析思路-人货场 数据分析

连锁零售门店分析思路 以下是一个连锁零售门店的分析思路: 一、市场与竞争分析 二、门店运营分析(销售分析) 三、销售与财务分析 四、客户分析 五、数字化与营销分析 最近帮一个大学生培训,就门店销售分析 ,说到门店…

实验07 接口测试postman

目录 知识点 1 接口测试概念 1.1为什么要做接口测试 1.2接口测试的优点 1.3接口测试概念 1.4接口测试原理和目的 2 接口测试内容 2.1测什么 2.1.1单一接口 2.1.2组合接口 2.1.3结构检查 2.1.4调用方式 2.1.5参数格式校验 2.1.6返回结果 2.2四大块 2.2.1功能逻辑…

Talk|清华大学袁天远:PreSight - 利用NeRF先验帮助自动驾驶场景在线感知

本期为TechBeat人工智能社区第605期线上Talk。 北京时间7月3日(周三)20:00,清华大学博士生—袁天远的Talk已经准时在TechBeat人工智能社区开播! 他与大家分享的主题是: “PreSight - 利用NeRF先验帮助自动驾驶场景在线感知”,他向大家介绍了新…

【送书活动十期】从零开始node.js制作CLI工具

这篇博客的由来是源于工作中一个java项目的配置项是加密后的私钥,私钥是由其他项目中调用web3生成随机账号得到的,而加密方法只是简单在java项目中执行代码得到。这便导致两步操作有点割裂,需要有一个脚本来完成生成私钥和加密私钥&#xff0…

vue使用audio 音频实现播放与关闭(可用于收到消息给提示音效)

这次项目中因为对接了即时通讯 IM,有个需求就是收到消息需要有个提示音效,所以这里就想到了用HTML5 提供的Audio 标签,用起来也是很方便,首先让产品给你个提示音效,然后你放在项目中,使用Audio 标签&#x…

【深度学习教程】

文章目录 李宏毅-机器学习/深度学习https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.phphttps://speech.ee.ntu.edu.tw/~hylee/ml/2022-spring.phphttps://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phphttps://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php 李宏…

如何通过网络快速搜寻到自己的STM32设备

目录 一、问题概述 二、解决思路 三、代码实现 1.创建任务 2.UDP广播接收 一、问题概述 以前一直用RS232串口修改设备配置信息,但是现场施工人员的232线太细,经常容易断掉,这次准备用网口去修改,遇到了一个问题,…

allure_pytest:AttributeError: ‘str‘ object has no attribute ‘iter_parents‘

踩坑记录 问题描述: 接口自动化测试时出现报错,报错文件是allure_pytest库 问题分析: 自动化测试框架是比较成熟的代码,报错也不是自己写的文件,而是第三方库,首先推测是allure_pytest和某些库有版本不兼…

新手教学系列——简单的服务配置项集中管理

前言 在开发和运维过程中,配置管理是一个非常重要但经常被忽视的环节。常用的配置文件格式包括env、ini和yaml等,它们非常适合模块级别的系统配置,尤其是一些敏感信息的配置,例如数据库连接字符串和密码等。但是,对于…

【文心智能体】前几天百度热搜有一条非常有趣的话题《00后疯感工牌》,看看如何通过低代码工作流方式实现图片显示

00后疯感工牌体验:https://mbd.baidu.com/ma/s/6yA90qtM 目录 前言比赛推荐工作流创建工作流入口创建工作流界面工作流界面HTTP工具卡点地方 总结推荐文章 前言 前几天百度热搜有一条非常有有趣《00后疯感工牌》。 想着通过文心智能体去一键生成00后疯感工牌是不是…

大语言模型在病理AI领域的应用·1|24-07-17·文献速递

小罗碎碎念 今日文献主题:大语言模型技术在病理组学中的应用 这次从厦门开会回来以后,一直在思考大语言模型在病理AI中的一个应用场景,为了辅助自己得出一个科学的结论,我搜集了最新发表的30篇与之相关的文献,用6期推文…

【解决】多个网卡导致nacos注册的服务ip有误问题

解决办法 在本地idea中启动的时候添加启动配置: 方法一 -Dspring.cloud.inetutils.preferred-networks你自己网卡的ip 方法二 -Dspring.cloud.nacos.discovery.ip你自己网卡的ip

封装网络请求 鸿蒙APP HarmonyOS ArkTS

一、效果展示 通过在页面直接调用 userLogin(params) 方法,获取登录令牌 二、申请网络权限 访问网络时候首先需要申请网络权限,需要修改 src/main 目录下的 module.json5 文件,加入 requestPermissions 属性,详见官方文档 【声明权…

陪玩系统小程序模式APP小程序H5系统搭建开发

随着移动互联网的营及和游戏行业的蓬轨发展,陪玩服务应远而生并迅速唱起,陪玩系统小程序作为连接游戏玩家与陪玩师的桥梁,其模式系统的搭建与开发是得尤为重要,本文将洋细凰述陪玩系统小程宗模式系统的搭建开发流程,包…

PCIe驱动开发(3)— 驱动设备文件的创建与操作

PCIe驱动开发(3)— 驱动设备文件的创建与操作 一、前言 在 Linux 中一切皆为文件,驱动加载成功以后会在“/dev”目录下生成一个相应的文件,应用程序通过对这个名为“/dev/xxx” (xxx 是具体的驱动文件名字)的文件进行相应的操作即…

C语言------指针讲解(2)

目录 一、数组名的理解 二、使用指针访问数组 三、一维数组传参的本质 四、冒泡排序 五、二级指针 六、指针数组 七、指针数组模拟二维数组 一、数组名的理解 通过学习,我们知道:数组名和数组首元素的地址打印出来的结果一模一样,数组…

信息安全CISSP认证重点学什么?学习后能掌握哪些安全技能?

引言: 想要在信息安全领域取得突破?那么CISSP认证是您必不可少的一步!本文将为您介绍CISSP认证的重点学习内容以及学习后可以掌握的安全技能,助您更好地了解并准备这一全球认可的信息安全证书。 随着信息安全领域的不断发展&…

【教学类-67-02】20240716毛毛虫ABB排序

背景需求: 【教学类-67-01】20240715毛毛虫AB排序-CSDN博客文章浏览阅读584次,点赞16次,收藏6次。【教学类-67-01】20240715毛毛虫AB排序https://blog.csdn.net/reasonsummer/article/details/140443310 在AB排序基础上,继续制作…

2024年带你轻松掌握最火10款项目管理软件:解决企业项目管理难题的利器

本文向您推荐10款卓越非凡的项目管理软件!它们能有效地助您梳理思绪,极大提高工作效率,使您即使身处繁忙之中仍能保持井然有序。这十款工具各具特色,从简洁明了的任务清单到复杂精密的项目追踪需求,满足各类用户群体的…

Python中的数据结构:五彩斑斓的糖果盒

在Python编程的世界里,数据结构就像是一个个五彩斑斓的糖果盒,每一种糖果都有其独特的味道和形状。这些多姿多彩,形状和味道各异的糖果盒子包括了:List(列表)、Tuple(元组)、Diction…