YOLO系列论文综述(从YOLOv1到YOLOv11)【第9篇:YOLOv7——跨尺度特征融合】

YOLOv7

  • 1 摘要
  • 2 网络架构
  • 3 改进点
  • 4 和YOLOv4及YOLOR的对比


YOLO系列博文:

  1. 【第1篇:概述物体检测算法发展史、YOLO应用领域、评价指标和NMS】
  2. 【第2篇:YOLO系列论文、代码和主要优缺点汇总】
  3. 【第3篇:YOLOv1——YOLO的开山之作】
  4. 【第4篇:YOLOv2——更好、更快、更强】
  5. 【第5篇:YOLOv3——多尺度预测】
  6. 【第6篇:YOLOv4——最优速度和精度】
  7. 【第7篇:YOLOv5——使用Pytorch框架、AutoAnchor、多尺度预训练模型】
  8. 【第8篇:YOLOv6——更高的并行度、引入量化和蒸馏以提高性能加速推理】
  9. 【第9篇:YOLOv7——跨尺度特征融合】
  10. 【第10篇:YOLOv8——集成检测、分割和跟踪能力】
  11. 【第11篇:YOLO变体——YOLO+Transformers、DAMO、PP、NAS】
  12. 【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】
  13. 【第13篇:YOLOv10——实时端到端物体检测】
  14. 【第14篇:YOLOv11——在速度和准确性方面具有无与伦比的性能】
  15. 【第15篇(完结):讨论和未来展望】

1 摘要

  • 发表日期:2022年7月
  • 作者:Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang
  • 论文:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
  • 代码:https://github.com/WongKinYiu/yolov7
  • 主要优缺点
    • 在COCO数据集上达到新的速度与精度平衡;
    • 跨尺度特征融合提高对不同尺度物体的检测能力;
    • 改进训练过程中的标签分配方式提高训练效率。

2 网络架构

2022年7月,YOLOv7由YOLOv4和YOLOR的同一组作者发布在ArXiv上。当时,它在5 FPS到160 FPS的速度范围内,在速度和精度上超过了所有已知的目标检测器。与YOLOv4一样,它仅使用MS COCO数据集进行训练,而没有使用预训练的Backbone。YOLOv7提出了一些架构上的改进和一系列bag-of-freebies,这些改进提高了准确性,但不影响推理速度,只增加了训练时间。

下图展示了YOLOv7的详细架构。

网络架构

3 改进点

YOLOv7的架构变化包括:

  • 扩展高效层聚合网络(E-ELAN):ELAN是一种通过控制最短最长梯度路径,使深度模型能够更高效地学习和收敛的策略。YOLOv7提出了E-ELAN,适用于具有无限堆叠计算块的模型。E-ELAN通过打乱和合并基数来结合不同组的特征,增强网络的学习能力,而不破坏原始的梯度路径。
  • 基于拼接模型的模型缩放:通过调整一些模型属性生成不同大小的模型。YOLOv7的架构是基于拼接的架构,在这种架构中,标准的缩放技术(如深度缩放)会导致过渡层输入通道和输出通道之间的比例变化,从而导致模型硬件利用率的下降。YOLOv7提出了一种新的缩放策略,其中块的深度和宽度以相同的因子缩放,以保持模型的最佳结构。

YOLOv7中使用的bag-of-freebies包括:

  • 计划重参数化卷积:类似于YOLOv6,YOLOv7的架构也受到重参数化卷积(RepConv)[98] 的启发。然而,他们发现RepConv中的恒等连接会破坏ResNet [61] 中的残差和DenseNet [109] 中的拼接。因此,他们移除了恒等连接,并将其称为RepConvN。
  • 辅助头的粗标签分配和主头的细标签分配:主头负责最终输出,而辅助头则帮助训练。
  • 卷积-批量归一化-激活中的批量归一化:这将批量归一化的均值和方差集成到卷积层的偏置和权重中,以便在推理阶段使用。
  • 受YOLOR启发的隐性知识
  • **指数移动平均(EMA)**作为最终推理模型。

4 和YOLOv4及YOLOR的对比

YOLOv7相对于同一组作者开发的先前YOLO模型的改进如下:

  • 与YOLOv4相比,YOLOv7参数量减少了75%,计算量减少36%,同时AP提高了1.5%。
  • 与YOLOv4-tiny相比,YOLOv7-tiny分别减少了39%的参数量和49%的计算量,同时保持了相同的AP。
  • 与YOLOR相比,YOLOv7分别减少了43%的参数量和15%的计算量,并且AP略微提高了0.4%。

在MS COCO 2017测试开发集上的评估显示,YOLOv7-E6在输入尺寸为1280像素的情况下,在NVIDIA V100上以50 FPS的速度达到了55.9%的AP和73.5%的AP50。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/926472.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Redis3——线程模型与数据结构

Redis3——线程模型与数据结构 本文讲述了redis的单线程模型和IO多线程工作原理,以及几个主要数据结构的实现。 1. Redis的单线程模型 redis6.0之前,一个redis进程只有一个io线程,通过reactor模式可以连接大量客户端;redis6.0为了…

【C++】STL容器中的比较函数对象

目录 set、map容器 priority_queue容器 在STL中涉及到以某种规则排序的容器都需要比较函数对象,比如:set、map、priority_queue这些容器内部都是依赖比较函数对象以某种规则存储数据的。STL容器中的比较函数对象可以是:函数指针、仿函数(函…

领养我的宠物:SpringBoot开发指南

第2章 开发环境与技术 本章节对开发宠物领养系统需要搭建的开发环境,还有宠物领养系统开发中使用的编程技术等进行阐述。 2.1 Java语言 Java语言是当今为止依然在编程语言行业具有生命力的常青树之一。Java语言最原始的诞生,不仅仅是创造者感觉C语言在编…

南京仁品耳鼻喉专科医院:12月启动公益义诊月

专业医疗资源送至“家门口”!南京仁品耳鼻喉专科医院启动公益义诊月 随着2024年即将步入尾声,南京仁品耳鼻喉医院为回馈社会,提升公众健康福祉,将于12月隆重推出“三甲专家公益义诊月”活动。此次活动旨在通过汇聚众多耳鼻喉领域…

centos8:Could not resolve host: mirrorlist.centos.org

【1】错误消息: [rootcentos211 redis-7.0.15]# yum update CentOS Stream 8 - AppStream …

会议直击|美格智能亮相2024紫光展锐全球合作伙伴大会,融合5G+AI共拓全球市场

11月26日,2024紫光展锐全球合作伙伴大会在上海举办,作为紫光展锐年度盛会,吸引来自全球的众多合作伙伴和行业专家、学者共同参与。美格智能与紫光展锐竭诚合作多年,共同面向5G、AI和卫星通信为代表的前沿科技,聚焦技术…

网络安全入门之网络安全工具分享-含初期所有工具(附百度网盘链接)

网络安全基础工具 抓包工具 burpsuite 这是一款十分经典的抓包改包工具,在全球范围内使用十分广泛,并且其内置各种插件,具有爆破,自动识别验证码,加解密发包等多种功能 专业版破解网盘链接: 通过百度网…

联想Lenovo SR650服务器硬件监控指标解读

随着企业IT架构的复杂性和业务需求的增长,服务器的稳定运行变得至关重要。联想Lenovo SR650服务器以其高性能和稳定性,在各类应用场景中发挥着关键作用。为了保障服务器的稳定运行,监控易作为一款专业的IT基础设施监控软件,为联想…

Android studio 利用cmake编译和使用so文件

1.编译出so文件 1.1 创建支持c的项目 需要在sdk-tools下载ndk和cmake Android studio会自动给一个含有jni的demo,运行打印出 hello c; //这边你文件project static {System.loadLibrary("withnewest");} //声明需要调用的方法 public nativ…

【论文笔记】Frequency Domain Model Augmentation for Adversarial Attack

Abstract 对于黑盒攻击,替代模型与受害模型之间的差距通常较大,表现为较弱的攻击性能。基于对抗样本的可迁移性可以通过同时攻击不同模型来提高的观察,提出了利用变换图像模拟不同模型的模型增强方法。 然而,现有的空间域变换并没…

AI/ML 基础知识与常用术语全解析

目录 一.引言 二.AI/ML 基础知识 1.人工智能(Artificial Intelligence,AI) (1).定义 (2).发展历程 (3).应用领域 2.机器学习(Machine Learning,ML) (1).定义 (2).学习方式 ①.监督学习 ②.无监督…

python数据可视化销量柱状图练习

需求: 假设某店铺的商品销量分为 线上销量 和 线下销量: 使用 叠加柱状图 分别显示线上和线下销量。 在柱状图中添加每种商品的总销量。 图表美观,包含图例、网格、颜色区分等。 代码实现: import matplotlib.pyplot as plt imp…

SE16N 外键校验报错问题

问题: SE16N维护时,偶尔有一些莫名奇妙的校验报错,条目XX在表XX中不存在,但是实际数据时存在的。 分析: DEBUG过程中,定位到数据校验部分,发现当外键定义的关联字段中存在某些不在对应维护表中…

ESP32-S3模组上跑通ES8388(10)

接前一篇文章:ESP32-S3模组上跑通ES8388(9) 二、利用ESP-ADF操作ES8388 2. 详细解析 上一回解析了es8388_init函数中的第3段代码(也是实际与ES8388寄存器打交道的第1段代码),本回继续往下解析。为了便于理…

微软表示不会使用你的 Word、Excel 数据进行 AI 训练

​微软否认使用 Microsoft 365 应用程序(包括 Word、Excel 和 PowerPoint)收集数据来训练公司人工智能 (AI) 模型的说法。 此前,Tumblr 的一篇博文声称,雷德蒙德使用“互联体验”功能抓取客户的 Word 和 Excel 数据,用…

深入浅出:开发者如何快速上手Web3生态系统

Web3作为互联网的未来发展方向,正在逐步改变传统互联网架构,推动去中心化技术的发展。对于开发者而言,Web3代表着一个充满机遇与挑战的新领域,学习和掌握Web3的基本技术和工具,将为未来的项目开发提供强大的支持。那么…

用c语言完成俄罗斯方块小游戏

用c语言完成俄罗斯方块小游戏 这估计是你在编程学习过程中的第一个小游戏开发,怎么说呢,在这里只针对刚学程序设计的学生,就是说刚接触C语言没多久,有一点功底的学生看看,简陋的代码,简陋的实现&#xff0…

redis中的哨兵

redis中的哨兵 一、哨兵机制的概念二、redis哨兵的部署2.1 docker的安装2.2 编排redis主从节点2.3 配置哨兵节点 三、redis哨兵的选举机制3.1 redis-master宕机之后的情况3.2 重启redis-master后的情况 四、redis哨兵机制的原理4.1主观下线4.2客观下线4.3选举leader节点4.4选出…

四轮转向键盘控制改进版 ros2(python)

目录 写在前面的话核心代码键盘输入发布车子速度和车子转向发布控制模式函数调用 完整代码运行演示 写在前面的话 上一篇博客:键盘控制车子四轮转向,原代码把键盘控制和车轮速度发布绑定到一起了,不适合后续的分布式独立开发,所以…

电阻的基本应用

从使用数量的角度来看,电阻在电子元器件中的数量要占到30%以上,电阻可以在电路中用于分压、分流、限流、负载、反馈、阻抗匹配、RC充放电电路、上下拉、运算放大器外围电路、兼容设计电路、电流转电压等,下面介绍一下电阻的基本应用 在集总参…