五一堵车 | AI“高速”车辆检测轻而易举监测大家安全

133b85171133e1141761cb72f1bd9973.gif

点击蓝字关注我们

关注并星标

从此不迷路

计算机视觉研究院

a3852f97bcc6123c18ae9d5546fb477f.gif

190afd93903486f5e4a09c8046c13abe.gif

学习群|扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

五一节不管是离开小城镇还是进入大城市,每个高速路口都是堵车,现在人工智能愈来愈发达,不再用通过交警得知高速公路上的案发事件,现在都是摄像机覆盖,AI可以通过镜头&算法检测到行驶的车辆,如果有交通事故都是第一时间传达交警来处理。以至于有些路段都是通过无人机来进行交通事故处理!

0d767c8f34c2243b78c807e40de16294.jpeg

一、简要

Single-stage目标检测方法因其具有实时性强、检测精度高等特点,近年来受到广泛关注。通常,大多数现有的single-stage检测器遵循两个常见的实践:它们使用在ImageNet上预先训练的网络主干来完成分类任务,并使用自顶向下的特征金字塔表示来处理规模变化。

12e460517ac580caf56fbcc73190a55a.gif

好比在国庆节的高速路上,车辆较多,而且车辆的行驶速度不一,大多数都是高速行驶状态中,所以有研究者研究了一个single-stage检测框架,它结合了微调预训练模型和从零开始训练的优点。新框架构成了一个标准的网络,使用一个预先训练的主干网络和一个并行的轻型辅助网络从零开始训练。

75cadcebf93aaa1269d8308b2176be52.png

此外,研究者认为通常使用的自顶向下的金字塔表示只关注于将高级语义从顶层传递到底层。然而在新的检测框架中引入了一个双向网络,它可以有效地传递中低层次和高层次的语义信息。

二、背景&动机

研究表明,训练检测模型从零开始解决这个问题,导致精确定位。但是与基于微调的对应网络相比,从零开始训练时间花费多。因此研究者引入一个训练模型,将训练前的和从零开始训练的优点结合起来,该框架使用一个预训练前的主干和一个从零开始训练的浅辅助网络。提出的方法相比baseline在AP指标上分别提高了7.4%4.2%。在COCO测试集上,固定300×300输入,提出的以ResNet为backbone的检测器在单级推理方面超过了现有的单级检测方法,AP达到了34.3 ,在一个Titan X GPU上时间为19毫秒,同时兼顾了精度和速度。

a1f739b3481ad98b35a9f3b97fe99efe.png

现在遇到的问题:

  • 小目标检测的难点

小目标检测是一个具有挑战性的问题,它既需要精确描述对象的低层/中层信息,也需要区分目标对象与背景或其他对象类别的高级语义信息。

近来的one-stage探测器的目标是获得与two-stage相近的检测精度。
尽管在大中型目标上效果较好,但这些探测器在小目标上的性能却低于预期。
例如:
当使用一个500×500的输入时,使用RetinaNet在COCO数据集上,
AP为47,但在小目标上,AP只有 14。
  • 预训练网络的利弊

主流的one-stage目标检测框架的通用策略是:利用一个经过ImageNet预训练的backbone完成分类任务。然后利用检测目标的数据集进行微调,从而达到快速收敛的效果。但是目标检测中的分类任务和定位任务之间仍然存在较大差异,尤其是在目标框重叠阈值高的情况下。

在ICCV2019Kaiming He的最新论文中,也对利用ImageNet
进行预训练然后fine-tune这种模式进行了思考,并且认为从
零开始训练检测模型,有助于精确定位。但是另一方面,与典
型的基于微调的网络相比,从零开始训练非常深的网络需要的
训练时间要长得多。

三、新框架

0b8303d012f3261063ab0cafd6e8a282.png

新框架图图显示了由三个主要组件组成的总体架构:标准SSD网络轻量级暂存网络(LSN)双向网络

标准SSD使用预先训练的网络主干。因此将来自标准SSD层的功能(conv4_3,FC_7,conv8_2,conv9_2,conv10_2和conv11_2)称为主干特征,因为它们源自预先训练的网络主干。研究者采用VGG-16作为主干网络。轻量级暂存网络(LSN)产生低/中级特征表示,然后将其注入到后续标准预测层的主干特征中以改善其性能。然后,将当前层和前一层的结果特征以自下而上的方式组合到双向网络中。双向网络中的自顶向下方案包含独立的并行连接,以将高级语义信息从网络的较后一层注入到前一层。

不同之处:

新框架中双向网络与现有的几个单级检测器使用的特征金字塔网络(FPN)相比有以下不同之处。

首先,FPN的自底向上部分遵循了标准中使用的CNN的金字塔特征层次结构SSD的框架。FPN和SSD的自底向上部分都遵循骨干网的前馈计算,建立了特征层次结构。除了FPN/标准SSD中的自底向上部分外,新框架中的双向网络中的自底向上方案以级联的方式将前一层的特性传播到后一层。此外,FPN中的topdown金字塔通过级联操作逐层融合了许多CNN层。在双向网络的自顶向下方案中,预测层通过独立的并行连接进行融合,而不是逐层逐层的级联/顺序融合。

LSN Feature Extraction

在现有检测框架中常用的特征提取策略包括从网络主干,如VGG-16,在多个卷积块和最大池层的重复堆栈中提取特征,以产生语义强的特征(见下图)。

876eed829a8407e52b0c79e12e181c71.png

这种特征提取策略有利于偏好平移不变性的图像分类任务。与图像分类不同,目标检测还需要精确的目标描述,其中局部低/中水平特征(如纹理)信息也是至关重要的。为了补偿预先训练的网络的主干特征中的信息损失,在新框架的LSN中使用了另一种特征提取方案,如上图(b)。

首先,通过池化操作将输入图像下采样到第一SSD预测层的目标大小。然后,得到的下采样图像通过轻量级串行操作(LSO),包括卷积、batch-norm和ReLU层。请注意,LSN是用随机初始化从零开始训练的。它遵循类似的金字塔特征层次,如标准SSD。

四、实验

469c790cb20418222f9e4e9d71803d07.png

[18]  Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, and Piotr Dollr. Focal loss for dense object detection. In ICCV, 2017

bd3f909016699459a8bac1589b119ce7.png

3a3a0445718edebae52acd403a392ab2.png

82b20206bb208e1de5759f2b91be92d5.png

计算机视觉研究院 ▶▶▶

JOIN US

学习群

73cc84d0932b6e4fe5487814ea80b7a5.gif

© THE END 

转载请联系本公众号获得授权

7738a46d640e5751074a6230020c8bfd.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、图像分割、模型量化、模型部署等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

VX:2311123606

40da565be810402b518055f21bc40a4c.png

往期推荐 

🔗

  • 最近几篇较好论文实现代码(附源代码下载)

  • AI助力社会安全,最新视频异常行为检测方法框架

  • 新技术:高效的自监督视觉预训练,局部遮挡再也不用担心!

  • VS Code支持配置远程同步了

  • 改进的阴影抑制用于光照鲁棒的人脸识别

  • 基于文本驱动用于创建和编辑图像(附源代码)

  • 基于分层自监督学习将视觉Transformer扩展到千兆像素图像

  • 霸榜第一框架:工业检测,基于差异和共性的半监督方法用于图像表面缺陷检测

  • CLCNet:用分类置信网络重新思考集成建模(附源代码下载)

  • YOLOS:通过目标检测重新思考Transformer(附源代码)

  • 工业检测:基于密集尺度特征融合&像素级不平衡学习框架(论文下载)

  • Fast YOLO:用于实时嵌入式目标检测(附论文下载)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/15548.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

linux常用命令大全

作为开发者,Linux是我们必须掌握的操作系统之一。因此,在编写代码和部署应用程序时,熟练使用Linux命令非常重要。这些常用命令不得不会,掌握这些命令,工作上会事半功倍,大大提高工作效率。 一. 文件和目录…

OJ刷题 第十三篇

22102 - 将字符串反序 时间限制 : 1 秒 内存限制 : 128 MB 请将一个给定的字符串反序(字符长度为1到10000,且有可能包含空格)。 输入 反序前的字符串 输出 反序后的字符串 样例 输入 abcd 输出 dcba 答案: C版本1:(掌握&…

( 哈希表) 217. 存在重复元素 ——【Leetcode每日一题】

❓217. 存在重复元素 难度:简单 给你一个整数数组 nums 。如果任一值在数组中出现 至少两次 ,返回 true;如果数组中每个元素互不相同,返回 false 。 示例 1: 输入:nums [1,2,3,1] 输出:true…

冷链物流运转 3D 可视化监控,助力大数据实时监控

智慧物流是以信息化为依托并广泛应用物联网、人工智能、大数据、云计算等技术工具,在物流价值链上的 6 项基本环节(运输、仓储、包装、装卸搬运、流通加工、配送)实现系统感知和数据采集的现代综合智能型物流系统。随着冷链信息化、数字化发展…

【Linux】8、查看 Linux 主机运行状态、压缩和解压缩命令、Linux 的环境变量

目录 一、查看 Linux 系统资源占用二、硬盘信息监控三、网络监控命令四、Linux 文件上传和下载命令五、压缩和解压(1) 压缩格式(2) tar 命令 六、Linux 的环境变量 一、查看 Linux 系统资源占用 ✒️ 可通过 top 命令查看系统的 CPU、内存的使用情况(类似 Windows …

AutoGPT安装教程

最近安装AutoGPT时遇到了一些问题,写下这篇文章记录一下 1 下载AutoGPT AutoGPT链接:https://github.com/Significant-Gravitas/Auto-GPT/tree/v0.2.2 下载AutoGPT 推荐下载stable 版本 2 申请openai 的api key 获取api的key,这里就不介…

【MySQL高级】——InnoDB索引MyISAM索引

一、索引概述 MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。 索引的本质:索引是数据结构。你可以简单理解为“排好序的快速查找数据结构”,满足特定查找算法。 这些数据结构以某种方式指向…

史上最全的接口测试,吐血整理从零到接口自动化实战...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 接口测试&#xf…

C++中的stack容器

文章目录 stack的介绍stack的使用 stack的介绍 stack是一种容器适配器,专门用在具有后进先出操作特性的环境中,只能在容器的一端进行插入删除;stack是作为容器适配器被实现的,容器适配器即是对特性类封装作为其底层的容器&#xf…

SCADA平台的HMI功能

01 前言 虹科Panorama SCADA平台支持桌面HMI、Web HMI和移动HMI的功能。桌面HMI主要是在桌面工作站实现数据可视化,能够获取到最全面的数据信息以及实现功能;Web HMI可以通过在软件中添加Web HMI服务器,运行程序后,可以在Web 客户…

被修饰成单栋的倾斜摄影处理思路

作者:kele 前言 倾斜摄影数据是三维项目系统中的常客。在某些项目中,为了给倾斜摄影上的建筑赋予属性信息,实现点击建筑高亮并展示属性的功能,客户将倾斜摄影数据进行了模型单体化(使用pdmodeler或者其它软件&#xf…

Apache Flink

Apache Flink 1 Flink的特点2 流式计算架构2.1 Lambda架构2.2 Kappa架构2.3 IOTA架构 3 Flink部署3.1 Standalone模式3.2 Standalone-HA模式3.3 Flink on Yarn模式3.3.1 Session mode3.3.2 Per-Job mode3.3.3 Application mode 4 Flink运行时的组件4.1 JobManager(作…

【嵌入式环境下linux内核及驱动学习笔记-(8-内核 I/O)-信号驱动】

目录 3 信号驱动的异步通知3.1 linux异步通知编程3.1.1 什么是信号3.1.2 信号的工作流程: 3.2. 应用层3.2.1 信号接收 signal函数3.2.2 应用层 fcntl 函数3.2.3 应用层信号驱动机制步骤 3.3 驱动层3.3.1 驱动层模板3.3.2 驱动层 实现fasync函数3.3.3 fasync_helper3.3.4 struct…

从历史天气预报 API 看气象大数据的商业价值

引言 近年来,随着气象观测技术的不断提升和气象大数据的快速发展,越来越多的企业开始将气象数据应用于商业领域。其中,历史天气预报 API 作为一种可获取历史气象数据的接口,具有广泛的商业应用价值。 本文将从历史天气预报 API …

Delphi 知识 彻底搞懂Delphi中的匿名方法

前言: 顾名思义,匿名方法是一个没有与之相关的名字的过程或函数。一个匿名方法将一个代码块视为一个实体,可以分配给一个变量或作为一个方法的参数使用。此外,匿名方法可以引用变量,并在定义该方法的上下文中为变量绑定…

【Unity入门】19.定时调用Invoke

【Unity入门】定时调用Invoke 大家好,我是Lampard~~ 欢迎来到Unity入门系列博客,所学知识来自B站阿发老师~感谢 (一)计时器 (1)Invoke 单词调用 计时器我们并不陌生,在cocos上有着schedule类是…

056:cesium 七种方法设置颜色

第056个 点击查看专栏目录 本示例的目的是介绍如何在vue+cesium中设置颜色,这里用到了7种方法,查看API,还有很多种方法 直接复制下面的 vue+cesium源代码,操作2分钟即可运行实现效果. 文章目录 示例效果配置方式示例源代码(共115行)相关API参考:专栏目标示例效果 配置…

【C++】map和set的模拟实现

一、思路 1. 改造RBTree 现在我们有一棵 R B T r e e RBTree RBTree,那么如何用它实现 m a p map map和 s e t set set?我们知道 m a p map map是 KV 结构, s e t set set是 K 结构,传统思路是两份 R B T r e e RBTree RBTree的代…

【MATLAB图像处理实用案例详解(12)】——利用BP神经网络实现图像压缩

目录 一、图像压缩二、BP神经网络实现图像压缩原理三、算法步骤3.1 图像块划分3.2 归一化3.3 建立BP神经网络3.4 保存结果 四、效果演示 一、图像压缩 常见的文件压缩软件如WinZip、WinRAR等采用的是无损压缩,能够完全恢复原文件内容。多媒体信息具有信息量大、冗余…

STM32F4 HAL库使用DMA进行ADC采样实时发送波形到串口显示(包含傅里叶变换)

1.总体逻辑 按下STM32F4的KEY0按键,通过外部中断的方式对按键进行检测,然后开启一次带DMA的固定点数的ADC采集,采集完成后在DMA的中断发送采集到的数据,然后清空数据区准备下一次的按键中断。电脑接受到串口数据后对数据进行简单…