Yolo系列算法-理论部分-YOLOv4

0. 写在前面

        YOLO系列博客,紧接上一篇Yolo系列算法-理论部分-YOLOv3-CSDN博客

1. YOLOv4-实战破局

        2020年,YOLO系列的作者发表声明,出于道德方面的考虑,退出CV界,Alexey Bochkovskiy团队接手,正式推出YOLOv4项目。

       YOLOv4使用深度学习中一些常用Tricks进行了大量的测试,最终选择:WRC、CSP、CmBN、SAT、 Mish activation、Mosaic data augmentation、DropBlock regularization 和 CIoU loss。

        YOLOv4将实用的训练技巧应用在传统的YOLO基础上,让其生机勃勃,重新焕发出生命,实现了检测速度和精度的最佳权衡。

  1.  使用 GTX 1080Ti 或 2080Ti 的GPU就能训练出高效而强大的目标检测网络,降低了使用GPU的门槛
  2. 在论文中也验证了大量先进的训练技巧对目标检测性能的影响;
  3. 改进当前先进的目标检测方法,使其适合在单GPU上训练,改进包括CBN、PAN、SAM等。
2. 网络结构

        最简洁的表示: 

YOLOv4 = CSPDarknet53(主干) + SPP附加模块(颈) + PANet路径聚合(颈) + YOLOv3(头部)

2.1 CSPDarknet53

        CSPNet(Cross Stage Partial Network),用来解决以往网络结构需要大量推理计算的问题,网络优化中有很多重复梯度信息,该网络能随意将梯度进行组合,同时减少计算量;通过将基本层的特征图分为两个部分,最后通过一个跨阶段的层次结构合并来实现

  1.   将原来的Darknet53与CSPNet进行结合,Darknet53的结构是由一系列的残差结构组成,CSPNet主要工作就是将原来的残差块堆叠拆分成两部分:主干部分继续堆叠原来的残差块,支路部分相当于一个残差边,经过少量的处理直接连接到最后。

        2. 使用Mish激活函数代替原来的Leaky ReLU。

2.2 SPP

        SPP最初的设计目的是使卷积神经网络不受固定输入尺寸的限制,在YOLOv4中,引入SPP是为了显著地增加感受野,分离出最重要的上下文特征,同时不降低运行速度,经典空间金字塔池化层,如下图所示。

                在YOLOv4中,分别利用四个不同尺度的最大池化对上层输出的feature map进行处理,最大池化的池化核大小分别是13×13、9×9、5×5、1×1。

2.3 PANet

        PANet是COCO2017年实例分割比赛冠军,目标检测比赛第二名,核心思路是充分利用特征融合。

  1. FPN:主要通过融合高低层特征提升目标检测的效果,尤其可以提高小尺寸的检测效果
  2. Bottom-up Path Augmentation:主要考虑网络浅层特征信息,主要是边缘形状等特征;
  3. Adaptive Feature Pooling:用来特征融合,用每一个ROI提取不同层的特征来做融合,对于提升模型效果有很大好处;
  4. Fully-connected Fusion:针对原有的支路FCN,引入一个前背景二分类全连接支路,通过融合这两条支路的输出得到更加精确的结果。
2.4 Head

        继承了YOLOv3的Head进行多尺度预测,提高了对不同size目标的检测性能,输出的张量shape分别是(19,19,255)、(38,38,255)、(76,76,255),因为COCO有80个类别,每个网格对应有3个Anchor boxes,所以每一个要预测的bounding box对应5个值,3×(80 + 5)=255。

3. Tricks 改进方法
3.1 Mosaic

        新的数据增强方法,将四张图片拼接在一起;拥有丰富检测目标背景的同时,在BN计算的时候一次性就能处理四张图片。

3.2 SAT

        一种自对抗训练数据增强方法,第一阶段,神经网络改变原始图像而不改变网络权值,以这种方式,神经网络对自身进行对抗性攻击,改变原始图像,以制造图像上没有所需对象的欺骗;在第二阶段用正常的方法训练神经网络去检测目标。

3.4 CmBN

        Cross mini-Batch Normalization,跨小批量标准化,收集一个batch内多个mini-batch内的统计数据。

3.5 SAM

        原始的算法是最大池化层和平均池化层分别作用于feature map,得到的feature map,再输入一个卷积层中,接着使用Sigmoid函数来创建空间注意力;

        YOLOv4将SAM进行了修改,直接使用一个卷积层作用于输入特征,再使用Sigmoid函数创建注意力,将空间注意力变成点注意力。

3.6 PANet

        将PAN网络进行了小修改,使用张量连接concat代替原来的连接。

4. 性能表现

        在COCO数据集上,与YOLOv3相比,在AP和FPS上分别提升10%和12%。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/465732.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

财富池指标公式--通达信主力资金指标公式,主力资金流向怎么看?

今日分享的通达信主力资金指标公式,是一个分析主力资金进出的指标。 具体信号说明: 当紫色的起涨点主力资金线和红色的拉升资金同时上传0线,并且紫色的拉升线超过资金线,大盘进入派发阶段,后市看涨,是参考…

【python】成功解决使用 np.savetxt 出现ValueError: fname must be a string or file handle

【python】成功解决使用 np.savetxt 出现ValueError: fname must be a string or file handle 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入…

vue2点击左侧的树节点(el-tree)定位到对应右侧树形表格(el-table)的位置,树形表格懒加载

左侧树代码 <el-tree :data"treeData" node-key"id" default-expand-all"" //节点默认全部展开:expand-on-click-node"false" //是否在点击节点的时候展开或者收缩节点:props"defaultProps" node-click"handleNodeC…

大数据架构设计

本博客地址&#xff1a;https://security.blog.csdn.net/article/details/136657478 一. 基本概念 1、解决传统数据架构无法及时响应用户请求的常用解决方法&#xff1a; ● 增加异步处理队列&#xff0c;通过工作处理层批量处理异步处理队列中的数据修改请求。 ● 建立数据库…

uni-popup(实现自定义弹窗提示、交互)

一般提示框的样式&#xff0c;一般由设计稿而定&#xff0c;如果用uniapp的showmodel&#xff0c;那个并不能满足我们需要的自定义样式&#xff0c;所以最好的方式是我们自己封装一个&#xff01;&#xff08;想什么样就什么样&#xff09;&#xff01; 一、页面效果 二、使用…

BUUCTF-----[GXYCTF2019]禁止套娃

题目 目录扫描&#xff0c;扫到.git泄露&#xff0c;使用工具查看到index.php的源码 <?php include "flag.php"; echo "flag在哪里呢&#xff1f;<br>"; if(isset($_GET[exp])){if (!preg_match(/data:\/\/|filter:\/\/|php:\/\/|phar:\/\//i,…

独家揭秘:短剧app开发的5大关键技巧

在移动互联网时代&#xff0c;短剧app成为了各大平台竞相推广的热门产品之一。想要在激烈的市场竞争中脱颖而出&#xff0c;短剧app开发必须做到精益求精。作为短剧app开发领域的专家&#xff0c;我将揭秘短剧app开发的5大关键技巧&#xff0c;帮助开发者们在激烈的竞争中立于不…

力扣大厂热门面试算法题 39-41

39. 组合总和&#xff0c;40. 组合总和 II&#xff0c;41. 缺失的第一个正数&#xff0c;每题做详细思路梳理&#xff0c;配套Python&Java双语代码&#xff0c; 2024.03.17 可通过leetcode所有测试用例。 目录 39. 组合总和 解题思路 完整代码 Python Java 40. 组合…

前端应用开发实验:Vue的特性

目录 实验目的实验内容图片浏览功能代码实现效果 简单购物车功能代码实现效果 汇率换算功能代码实现效果 关于需要准备的内容&#xff0c;如Vue的下载就不多赘述了 实验目的 &#xff08;1&#xff09;掌握vue实例编写的语法和基本选项的使用 &#xff08;2&#xff09;在实际…

深度学习pytorch——Broadcast自动扩展

介绍 在 PyTorch 中&#xff0c;Broadcast 是指自动扩展&#xff08;broadcasting&#xff09;运算的功能。它允许用户在不同形状的张量之间执行运算&#xff0c;而无需手动将它们的形状改变为相同的大小。当进行运算时&#xff0c;PyTorch 会自动调整张量的形状&#xff0c;使…

十八、软考-系统架构设计师笔记-真题解析-2022年真题

软考-系统架构设计师-2022年上午选择题真题 考试时间 8:30 ~ 11:00 150分钟 1.云计算服务体系结构如下图所示&#xff0c;图中①、②、③分别与SaaS、PaaS、IaaS相对应&#xff0c;图中①、②、③应为( )。 A.应用层、基础设施层、平台层 B.应用层、平台层、基础设施层 C.平…

尊嘟假嘟,只需HiFi测序即可获得T2T基因组?

探秘动植物物种进化及遗传多样性的第一步往往是进行基因组测序&#xff0c;基因组从头组装&#xff08;Genome De novo assembly&#xff09; 是指从测序数据中重建生物基因组序列的过程。组装一直是生物信息学中的核心问题。 然而&#xff0c;到2019年底完成图这个概念仍然只…

香港公司变更注册地址所需材料及流程全解析

香港公司变更注册地址&#xff1a;所需材料及流程全解析 各位老板好&#xff0c;我是经典世纪胡云帅&#xff0c;随着业务的拓展和发展&#xff0c;香港公司可能需要变更其注册地址。变更注册地址不仅关系到公司的日常运营&#xff0c;还与公司的法律地位和品牌形象息息相关。本…

Grok-1 开源:马斯克旗下xAI公司发布革命性AI模型,开启开源大模型新篇章|3140亿参数

自从埃隆马斯克&#xff08;Elon Musk&#xff09;上周&#xff08;3月11日&#xff09;在 X 平台上宣布 Grok 将于本周开源的消息后&#xff0c;无数目光便聚焦于此&#xff0c;期待之情溢于言表。继 Meta 旗下的 Llama 2 模型开源之后&#xff0c;开源大模型界便充满了对新技…

Linux查看硬件型号详细信息

1.查看CPU &#xff08;1&#xff09;使用cat /proc/cpuinfo或lscpu &#xff08;2&#xff09;使用dmidecode -i processor Dmidecode 这款软件允许你在 Linux 系统下获取有关硬件方面的信息。Dmidecode 遵循 SMBIOS/DMI 标准&#xff0c;其输出的信息包括 BIOS、系统、主板、…

【Unity】获取游戏对象或组件的常用方法

前言 在Unity开发过程中&#xff0c;我们经常需要获取组件&#xff0c;那么在Unity里如何获取组件呢&#xff1f; 一、获取游戏对象 1.GameObject.Find GameObject.Find 是通过物体的名称获取对象的 所以会遍历当前整个场景&#xff0c;效率较低 而且只能获取激活状态的物体…

Sentinel篇:线程隔离和熔断降级

书接上回&#xff1a;微服务&#xff1a;Sentinel篇 3. 隔离和降级 限流是一种预防措施&#xff0c;虽然限流可以尽量避免因高并发而引起的服务故障&#xff0c;但服务还会因为其它原因而故障。 而要将这些故障控制在一定范围&#xff0c;避免雪崩&#xff0c;就要靠线程隔离…

作品展示ETL

1、ETL 作业定义、作业导入、控件拖拽、执行、监控、稽核、告警、报告导出、定时设定 欧洲某国电信系统数据割接作业定义中文页面&#xff08;作业顶层&#xff0c;可切英文&#xff0c;按F1弹当前页面帮助&#xff09; 涉及文件拆分、文件到mysql、库到库、数据清洗、数据转…

青海200MW光伏项目 35kV开关站图像监控及安全警示系统

一、背景 随着我国新能源产业的快速发展&#xff0c;光伏发电作为清洁能源的重要组成部分&#xff0c;得到了国家政策的大力扶持。青海作为我国光伏资源丰富地区&#xff0c;吸引了众多光伏项目的投资建设。在此背景下&#xff0c;为提高光伏发电项目的运行效率和安全性能&…

数据安全与个人隐私:美国人的焦虑与变化

PrimiHub一款由密码学专家团队打造的开源隐私计算平台&#xff0c;专注于分享数据安全、密码学、联邦学习、同态加密等隐私计算领域的技术和内容。 在这个每一次点击、轻敲或按键都留下数字踪迹的时代&#xff0c;美国人对个人数据安全的焦虑与日俱增。他们感觉对数据的使用几乎…