YOLO即插即用---PConv

Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks

论文地址:

1. 论文解决的问题

2. 解决问题的方法

3. PConv 的适用范围

4. PConv 在目标检测中的应用

5. 评估方法

6. 潜在挑战

7. 未来研究方向

8.即插即用代码


论文地址:

2303.03667icon-default.png?t=O83Ahttps://arxiv.org/pdf/2303.03667

1. 论文解决的问题

这篇论文主要解决的是神经网络的运行速度问题。尽管近年来神经网络的性能突飞猛进,但其高延迟和高计算量也限制了其在实际应用中的推广。为了解决这个问题,研究者们通常关注降低浮点运算次数 (FLOPs),但论文指出,单纯降低 FLOPs 并不一定能带来相应的延迟降低。

2. 解决问题的方法

论文分析了导致低延迟的主要原因,发现是运算符频繁的内存访问导致的。因此,论文提出了一个新的运算符——部分卷积 (PConv),它通过减少冗余计算和内存访问来更有效地提取空间特征。

PConv 的原理

  • PConv 只对输入通道的一部分应用常规卷积,而其余通道则保持不变。

  • 通过这种方式,PConv 在降低 FLOPs 的同时,也减少了内存访问次数,从而提高了运行速度。

  • 为了充分利用所有通道的信息,PConv 通常与逐点卷积 (PWConv) 结合使用,形成一个 T 形的感受野,更专注于中心位置。

3. PConv 的适用范围

PConv 可以应用于各种需要提取空间特征的神经网络任务,例如:

  • 图像分类: PConv 可以替代现有的卷积运算符,例如深度可分离卷积 (DWConv) 和分组卷积 (GConv),从而提高运行速度。

  • 目标检测: PConv 可以用于特征提取网络,例如骨干网络,从而提高检测速度。

  • 语义分割: PConv 可以用于特征提取网络,例如编码器,从而提高分割速度。

4. PConv 在目标检测中的应用

PConv 在目标检测中的应用位置

  • 骨干网络: PConv 可以用于替代骨干网络中的 DWConv 或 GConv,从而提高特征提取速度。

  • 特征金字塔网络 (FPN): PConv 可以用于替代 FPN 中的 DWConv 或 GConv,从而提高多尺度特征提取速度。

  • 注意力机制: PConv 可以用于改进注意力机制,例如 Squeeze-and-Excitation (SE) 块,从而提高注意力机制的效率。

PConv 在目标检测中的优势

  • 提高检测速度: PConv 可以降低目标检测的推理时间,从而提高检测速度。

  • 提高检测精度: PConv 可以提取更丰富的特征,从而提高检测精度。

  • 降低计算量: PConv 可以降低目标检测的计算量,从而降低对计算资源的需求。

5. 评估方法

为了评估 PConv 在目标检测中的应用效果,可以使用以下指标:

  • 平均精度 (AP): 评估目标检测算法的精度。

  • 平均精度均值 (mAP): 评估目标检测算法的平均精度。

  • 推理时间: 评估目标检测算法的运行速度。

  • 计算量: 评估目标检测算法的计算复杂度。

6. 潜在挑战

尽管 PConv 在目标检测中具有很大的潜力,但也存在一些潜在挑战:

  • 参数调整: PConv 的性能可能受到参数设置的影响,例如部分比例和卷积核大小。

  • 与现有模型的兼容性: PConv 需要与现有的目标检测模型进行整合,这可能需要进行一些修改。

  • 训练时间: PConv 可能需要更长的训练时间才能达到最佳性能。

7. 未来研究方向

未来研究方向可以包括:

  • 改进 PConv 的设计: 探索更有效的 PConv 设计,例如不同的部分比例和卷积核大小。

  • 将 PConv 应用于其他目标检测模型: 将 PConv 应用于其他目标检测模型,例如 YOLO 和 SSD。

  • 探索 PConv 在其他视觉任务中的应用: 探索 PConv 在其他视觉任务中的应用,例如图像检索和视频理解。

PConv 是一种很有潜力的运算符,可以用于提高目标检测的速度和精度。将 PConv 应用于目标检测模型,可以降低推理时间、提高检测精度,并降低对计算资源的需求。未来研究可以进一步探索 PConv 的设计、与其他模型的兼容性,以及在其他视觉任务中的应用。

8.即插即用代码

from torch import nn
import torch
class Partial_conv3(nn.Module):

    def __init__(self, dim, n_div, forward):
        super().__init__()
        self.dim_conv3 = dim // n_div
        self.dim_untouched = dim - self.dim_conv3
        self.partial_conv3 = nn.Conv2d(self.dim_conv3, self.dim_conv3, 3, 1, 1, bias=False)

        if forward == 'slicing':
            self.forward = self.forward_slicing
        elif forward == 'split_cat':
            self.forward = self.forward_split_cat
        else:
            raise NotImplementedError

    def forward_slicing(self, x):
        # only for inference
        x = x.clone()  # !!! Keep the original input intact for the residual connection later
        x[:, :self.dim_conv3, :, :] = self.partial_conv3(x[:, :self.dim_conv3, :, :])

        return x

    def forward_split_cat(self, x):
        # for training/inference
        x1, x2 = torch.split(x, [self.dim_conv3, self.dim_untouched], dim=1)
        x1 = self.partial_conv3(x1)
        x = torch.cat((x1, x2), 1)

        return x


if __name__ == '__main__':
    block = Partial_conv3(64, 2, 'split_cat').cuda()
    input = torch.rand(3, 64, 64, 64).cuda() #输入shape b c h w
    output = block(input)
    print(input.size(), output.size())

大家对于YOLO改进感兴趣的可以进群了解,群中有答疑,(QQ群:828370883)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/913926.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

手写jdbc 工具类(封装思维,解决硬编码...)

目录 前言 手写jdbc 工具类 封装思维 对于封装思维的理解 举一个关于封装思维的例子 解决硬编码 什么是硬编码? 硬编码的例子: 解决办法 解法1 解法2 解法3 jdbc工具类总的代码如下 资源关闭的先后问题 解决办法: 总结 …

数据库的四个基本概念

数据,数据库,数据库管理系统和数据库系统是与数据库技术密切相关的4个基本概念。 1. 数据(data) 描述事物的符号记录,譬如:数字、文字、图形、图像、音频、视频等,多种表现形式,均可…

java---认识异常(详解)

还有大家来到权权的博客~欢迎大家对我的博客提出意见哦,有错误会及时改进的~点击进入我的博客主页 目录 一、异常的概念及体系结构1.1 异常的概念1.2 异常的体系结构1.3异常的分类 二、异常的处理2.1防御式编程2.2 异常的抛出2.3 异常的捕获2.3.1异常声明throws2.3.…

移远通信亮相骁龙AI PC生态科技日,以领先的5G及Wi-Fi产品革新PC用户体验

PC作为人们学习、办公、娱乐的重要工具,已经深度融入我们的工作和生活。随着物联网技术的快速发展,以及人们对PC性能要求的逐步提高,AI PC成为了行业发展的重要趋势。 11月7-8日,骁龙AI PC生态科技日在深圳举办。作为高通骁龙的重…

【云原生开发】namespace管理的后端开发设计与实现

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

老破机器硬盘要坏,转移虚拟机里的打字平台过程全记录

我有一台老破机器,说破其实没多破,但是老应该是有几年了,这机器一开始一直放在领导办公室不让人用,后来因为单位整体搬迁,我跟领导讨了来,win10的系统,我装了个虚拟机好像是15的版本&#xff0c…

【JavaEE初阶】多线程上部

文章目录 本篇目标:一、认识线程(Thread)1.概念:2.创建线程 二、Thread 类及常见方法2.1 Thread 的常见构造方法2.2 Thread 的几个常见属性2.3 启动⼀个线程 - start()2.4 中断⼀个线程2.5 等待⼀个线程 - join()2.6 获取当前线程…

[vulnhub] Corrosion: 2

https://www.vulnhub.com/entry/corrosion-2,745/ 提示:枚举才是神 主机发现端口扫描 使用nmap扫描网段类存活主机 因为靶机是我最后添加的,所以靶机IP是6 ,kali是10 nmap -sP 192.168.56.0/24 Starting Nmap 7.94SVN ( https://nmap.org ) …

MySQL数据库的备份与还原

目录 mysql 数据库的备份 生成SQL脚本 1 在控制台使用mysqldump命令可以用来生成指定数据库的脚本 ​编辑2 在数据库图形化界面工具:DateGrip 中操作:导出 mysql 数据库的还原 执行SQL脚本 1 在控制台使用 命令,指定将sql脚本导入到指定…

ASR 点亮闪光灯和后摄对焦马达

ASR翱捷科技 ASR kernel 5.10 android14 ASR EVB平台 ASR 原理图 闪光灯是gpio控制 1.驱动 路径:asr\kernel\linux\drivers\media\platform\asr-mars11\flash\leds-gpio-flash.c 驱动加载后生成设备节点/sys/class/leds/torch 和/sys/class/leds/flash。 Makefile Kconfig…

【大数据学习 | HBASE】hbase的读数据流程与hbase读取数据

1. hbase的读数据流程 在解析读取流程之前我们还需要知道两个功能性的组件和HFIle的格式信息 HFILE 存储在hdfs中的hbase文件,这个文件中会存在hbase中的数据以kv类型显示,同时还会存在hbase的元数据信息,包括整个hfile文件的索引大小&…

【GPTs】MJ Prompt Creator:轻松生成创意Midjourney提示词

博客主页: [小ᶻZ࿆] 本文专栏: AIGC | GPTs应用实例 文章目录 💯GPTs指令💯前言🚀 MJ Prompt Creator主要功能适用场景优点缺点 💯 小结 💯GPTs指令 中文翻译: 任务说明 您是一款为幻灯片…

实现3D热力图

实现思路 首先是需要用canvas绘制一个2D的热力图,如果你还不会,请看json绘制热力图。使用Threejs中的canvas贴图,将贴图贴在PlaneGeometry平面上。使用着色器材质,更具json中的数据让平面模型 拔地而起。使用Threejs内置的TWEEN&…

ATom: 矿物粉尘在卷云形成中的主导作用

目录 ATom: Dominant Role of Mineral Dust in Cirrus Cloud Formation 简介 摘要 代码 引用 网址推荐 知识星球 机器学习 ATom: Dominant Role of Mineral Dust in Cirrus Cloud Formation 简介 该数据集提供了:(1)由 NOAA 粒子分析…

C语言 | Leetcode C语言题解之第560题和为K的子数组

题目: 题解: // 暴力美学:20行C代码 int subarraySum(int *nums, int numsSize, int k) {int count 0;// 弄个大数组做个暴力的Hash表,大概4*20M*2160M。用calloc初始化为全零。int *maps (int *)calloc(1001 * 20001 * 2, siz…

基于vue框架的的社区居民服务管理系统8w86o(程序+源码+数据库+调试部署+开发环境)系统界面在最后面。

系统程序文件列表 项目功能:居民,楼房信息,报修信息,缴费信息,维修进度 开题报告内容 基于Vue框架的社区居民服务管理系统开题报告 一、研究背景与意义 随着城市化进程的加速,社区居民数量激增,社区管理面临着前所未有的挑战。传统的社区…

UE5.4 PCG 自定义PCG蓝图节点

ExecuteWithContext: PointLoopBody: 效果:点密度值与缩放成正比

[ Linux 命令基础 2 ] Linux 命令详解-系统管理命令

🍬 博主介绍 👨‍🎓 博主介绍:大家好,我是 _PowerShell ,很高兴认识大家~ ✨主攻领域:【渗透领域】【数据通信】 【通讯安全】 【web安全】【面试分析】 🎉点赞➕评论➕收藏 养成习…

单链表算法题(数据结构)

1. 反转链表 https://leetcode.cn/problems/reverse-linked-list/description/ 题目: 看到这个题目的时候我们怎么去想呢?如果我们反应快的话,应该可以想到我们可以从1遍历到5然后依次头插,但是其实我们还有更好的办法&#xff…

Java代码审计-模板注入漏洞

一、模板引擎 在Java开发当中,为了将前端和后端进行分离,降低项目代码的耦合性,使代码更加易于维护和管理。除去以上的原因,模板引擎还能实现动态和静态数据的分离。 二、主流模板引擎 在Java中,主流的模板引擎有:Fre…