卷积变体-----分组卷积、深度可分离卷积、膨胀卷积

文章目录

  • 一、分组卷积
    • 1.1 概述
    • 1.2 参数量变换
  • 二、深度可分离卷积
    • 2.1 概述
    • 2.2 计算
  • 三、膨胀卷积


一、分组卷积

1.1 概述

 1. 分组卷积(Group convolution )最早在AlexNet中出现,由于当时的硬件资源有限,训练AlexNet时卷积操作不能全部放在同一个GPU处理,因此把特征图分给多个GPU分别进行处理,最后把多个GPU的结果进行融合。

 2. 一般的卷积会对输入数据的整体一起做卷积操作。而组卷积则是在深度上进行划分,即某几个通道编为一组,对输入数据做组合卷积操作。

在这里插入图片描述

1.2 参数量变换

 1. 标准的 2 D 2D 2D 卷积步骤如下图所示:输入特征为: H × W × C H × W × C H×W×C,然后应用 C ′ C' C 个卷积核组(每个卷积核组的大小为 h × w × c h × w × c h×w×c),输入层被转换为大小为 H ′ × W ′ × C ′ H' × W' × C' H×W×C 的输出特征。

在这里插入图片描述

 2. 分组卷积的表示如下图所示。我们计算一下标准 2 D 2D 2D 卷积 和分组卷积的参数量:
 标准 2 D 2D 2D 卷积: w × h × C × C ′ w × h × C × C' w×h×C×C
 分组卷积: w × h × C / 2 × C ′ / 2 × 2 w × h × C/2 × C'/2 × 2 w×h×C/2×C/2×2
 我们可以发现参数量减少到原来的 1 / 2 1/2 1/2,那当Group为4的时候,参数量将会减少到原来的 1 / 4 1/4 1/4

在这里插入图片描述

二、深度可分离卷积

2.1 概述

 1. 在深度可分离卷积(depthwise separable convolution)中,通常将卷积操作拆分成多个步骤。深度可分离卷积把普通卷积拆分成 D W DW DW 卷积(Depthwise Convolution,深度卷积)和 P W PW PW 卷积(Point Convolution,点卷积)两部分。:深度可分离卷积 = 深度卷积 + 点卷积。

在这里插入图片描述

 2. 深度卷积完成后的特征图数量与输入层的通道数相同。但这种运算对输入层的每个通道独立进行卷积运算,没有有效地利用不同通道在相同空间位置上的特征信息。因此需要点卷积来将这些特征图进行组合生成新的特征图。

 3. 举例:
 (1) 在第一部分深度卷积中,我们在不改变深度的情况下,对输入图像进行了分组卷积。我们使用 3 3 3 5 × 5 × 1 5×5×1 5×5×1 形状的卷积核。每个 5 × 5 × 1 5×5×1 5×5×1 卷积核迭代图像的 1 1 1 个通道(注意: 1 1 1 个通道,而不是所有通道),得到 3 3 3 8 × 8 × 1 8×8×1 8×8×1 的图像。将这些图像叠加在一起可创建 8 × 8 × 3 8×8×3 8×8×3 的图像。

在这里插入图片描述

 (2) 点卷积的运算与常规卷积运算非常相似,它的卷积核的尺寸为 1 × 1 × M 1×1×M 1×1×M M M M 为上一层的通道数。所以这里的卷积运算会将上一步的图像在深度方向上进行加权组合,生成新的特征图。有几个卷积核就有几个输出图像。
 点向卷积之所以如此命名是因为它使用了一个 1 × 1 1×1 1×1 卷积核,我们通过 1 × 1 × 3 1×1×3 1×1×3 卷积核迭代 8 × 8 × 3 8×8×3 8×8×3 图像,得到 8 × 8 × 1 8×8×1 8×8×1 图像。我们可以创建 256 256 256 1 × 1 × 3 1×1×3 1×1×3 卷积核,每个卷积核输出一个 8 × 8 × 1 8×8×1 8×8×1 图像,全部叠加到一起得到形状为 8 × 8 × 256 8×8×256 8×8×256 的最终图像。
在这里插入图片描述

在这里插入图片描述

2.2 计算

 用上面这个例子:
 普通卷积参数量为: 3 × 256 × 5 × 5 3×256×5×5 3×256×5×5
 深度可分离卷积参数量为: 3 × 5 × 5 + 3 × 256 × 1 × 1 3×5×5+3×256×1×1 3×5×5+3×256×1×1

三、膨胀卷积

 1. 膨胀卷积与普通的卷积相比,除了卷积核的大小以外,还有一个膨胀率(dilation rate)参数,主要用来表示膨胀的大小。卷积核的膨胀率(dilate rate)属性定义为卷积核的元素间距。如 dilate rate=2 是每隔一个像素位置应用一个卷积元素,dilate rate=1 就是普通的卷积。具体含义就是在卷积核中填充 dilation rate 个 0。

 2. (a) 是普通卷积,1-dilated convolution,卷积核的感受野为 3 × 3 = 9 3×3=9 3×3=9; (b) 是膨胀卷积,2-dilated convolution,卷积核的感受野为 5 × 5 = 25 5×5=25 5×5=25;(c) 是膨胀卷积,4-dilated convolution,卷积核的感受野为 9 × 9 = 81 9×9=81 9×9=81

在这里插入图片描述

 3. 卷积核经过膨胀后实际参与运算的卷积大小计算公式:膨胀后的卷积核尺寸 = 膨胀系数 × × × (原始卷积核尺寸 − 1 -1 1 + 1 +1 +1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/494585.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

电商系列之满减

> 插:AI时代,程序员或多或少要了解些人工智能,前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 坚持不懈,越努力越幸运,大家…

zabbix分布式部署

基于zabbix-proxy的分布式监控 1.1 分布式监控的作用 1)分担 server 的集中式压力; 2)解决多机房之间的网络延时问题。 1.2 数据流向 agent --> proxy --> server 1.3 构成组件 zabbix-server:整个监控体系中最核心的组…

鸿蒙开发-UI-交互事件-手势事件

鸿蒙开发-UI-图形-绘制自定义图形 鸿蒙开发-UI-图形-页面内动画 鸿蒙开发-UI-图形-组件内转场动画 鸿蒙开发-UI-图形-弹簧曲线动画 鸿蒙开发-UI-交互事件-通用事件 鸿蒙开发-UI-交互事件-键鼠事件 鸿蒙开发-UI-交互事件-焦点事件 文章目录 前言 一、绑定手势方法 1. gesture …

【tingsboard开源平台】下载数据库,IDEA编译,项目登录

一, PostgreSQL 下载 需要看官网的:点此下载直达地址:点此进行相关学习:PostgreSQL 菜鸟教程 二,PostgreSQL 安装 点击安装包进行安装 出现乱码错误: There has been an error. Error running C:\Wind…

pyecharts操作二

pyecharts操作二 pyecharts 是一个用于生成Echarts图表的Python库。Echarts是百度开源的一个数据可视化JS库,可以生成一些非常酷炫的图表。 环境安装 pip install pyecharts 检查版本 import pyecharts print(pyecharts.version) 2.0.3 3D柱状图绘制 import p…

设计模式之组合模式解析

组合模式 1)概述 1.定义 组合多个对象形成树形结构以表示具有“整体—部分”关系的层次结构。 组合模式对单个对象(即叶子对象)和组合对象(即容器对象)的使用具有一致性,组合模式又称为“整体—部分”(…

用Unity3D实现简单的RPG游戏

文章目录 开发流程及关键要素说明**1. **环境设置与项目创建******2. **场景搭建******3. **角色控制******4. **用户输入处理******5. **敌人与战斗系统******6. **物品与装备系统******7. **任务与对话系统******8. **UI与菜单系统******9. **保存与加载系统******10. **测试…

以太网链路聚合——增加带宽,解决生成树收敛慢的问题

目录 一.对STP生成树的补充 1.STP接口状态 2.STP生成树的改进 二.网络可靠性 1.单板可靠性 2.设备可靠性 3.链路可靠性 三.链路聚合 1.多条链路聚合增加带宽 2.链路聚合术语 四.链路聚合模式 1.手动模式 2.LASP模式 (1).LASP术语 (2&…

SecurityOauth2

引入SpringSecurity SpringSecurity 实现原理是提供了一个过滤器链,其中主要过滤器如下所示: 认证流程示意: 授权过程 SpringSecurity 会使用 FilterSecurityInterceptor 来进行权限校验,在 FilterSecurityInterceptor 中 会从…

Go-js,css,html压缩和混淆(可直接使用)

前提条件: 本地安装nodejs环境然后配置全局环境变量。 运行以下命令安装uglify压缩工具 npm install uglify-js -g 测试是否安装成功 uglifyjs -v 使用方式: 根据不同的操作系统取对应的压缩工具,然后将压缩工具放到项目根目录下,然后执行即可 工具文件: https://gitee.com…

协程库-锁类-实现线程互斥同步

mutex.h:信号量,互斥锁,读写锁,范围锁模板,自旋锁,原子锁 锁 **锁不能进行拷贝操作:**锁是用于管理多线程并发访问共享资源的同步原语。这些锁包括互斥锁(mutex)、读写锁…

ElementUI中的el-table表格实现动态添加一行、删除一行、清空所有行

ElementUI中的el-table表格实现动态添加一行、删除一行、清空所有行 1、需求分析2、代码实现HTMLdatamethods 1、需求分析 ElementUI中的el-table中实现动态添加一行、删除一行、清空所有行 2、代码实现 HTML <div class"middle-wrapper"><el-buttontype…

Golang hash/crc32 库实战指南:从基础到优化

Golang hash/crc32 库实战指南&#xff1a;从基础到优化 引言理解CRC32hash/crc32库概览实战技巧数据校验性能优化多线程应用 错误处理与调试错误处理调试 实际案例分析结论 总结重点回顾 引言 在现代软件开发中&#xff0c;数据的完整性和安全性至关重要。无论是数据库存储、…

Python抓取抖音直播间数据:技术探索与实践

目录 一、引言 二、技术准备 三、分析抖音直播间网页结构 四、编写爬虫代码 五、处理反爬虫机制 六、数据清洗与存储 七、总结 一、引言 随着互联网的快速发展&#xff0c;直播行业已成为当下的热门领域。抖音作为其中的佼佼者&#xff0c;吸引了大量的用户和主播。对于…

使用vue构建一个简单实用的春节红包插件!

摘要&#xff1a;本文将介绍如何使用Vue.js构建一个简单实用的春节红包插件。该插件通过模拟红包的打开和关闭过程&#xff0c;以及金额的随机分配&#xff0c;为春节红包活动提供了一个有趣且互动的体验。 一、引言 在春节这个充满欢乐和祝福的时刻&#xff0c;红包成为了传递…

Avalonia11.0.2+.Net6.0支持多语言,国际化使用DynamicResource绑定数据

Avalonia11.0.2+.Net6.0支持多语言,国际化使用DynamicResource绑定数据 介绍调整的内容效果展示介绍 本章内容是对上一章博客的补充,当时我们用的是自定义扩展的方式实现了多语言数据的绑定,本章我们用标准的 Text="{DynamicResource 名称}" 来替换 Text="{i…

iphoneX系统的参数

1. 2. 3. 4. 5.相关的网址信息 Apple iPhone X 規格、价格和评论 | Kalvo Apple iPhone X 規格、价格和评论 | Kalvo

Android ViewPager2 setOffscreenPageLimit预加载Fragment,Kotlin

Android ViewPager2 setOffscreenPageLimit预加载Fragment&#xff0c;Kotlin import android.os.Bundle import android.util.Log import android.view.LayoutInflater import android.view.View import android.view.ViewGroup import android.widget.TextView import androi…

社交革命:Facebook如何塑造数字社交的未来

引言 在当今数字化时代&#xff0c;社交媒体已成为人们生活的核心&#xff0c;而Facebook作为其中的领军者&#xff0c;一直在塑造着数字社交的未来。本文将深入探讨Facebook在数字社交领域的地位、影响力以及对未来社交的塑造作用&#xff0c;为读者揭示这场社交革命如何由Fa…

华为开源自研AI框架昇思MindSpore应用案例:梯度累加

目录 一、环境准备1.进入ModelArts官网2.使用CodeLab体验Notebook实例 二、案例实现 梯度累加的训练算法&#xff0c;目的是为了解决由于内存不足&#xff0c;导致Batch size过大神经网络无法训练&#xff0c;或者网络模型过大无法加载的OOM&#xff08;Out Of Memory&#xff…