R-YOLO

Abstract

提出了一个框架,名为R-YOLO,不需要在恶劣天气下进行注释。考虑到正常天气图像和不利天气图像之间的分布差距,我们的框架由图像翻译网络(QTNet)和特征校准网络(FCNet)组成,用于逐步使正常天气域适应不利天气域。具体来说,我们使用简单而有效的QTNet来生成图像,这些图像继承了正常天气域中的注释,并对两个域之间的间隙进行插值。然后,在FCNet中,我们提出了两种基于对抗性学习的特征校准模块,以局部到全局的方式有效地对其两个领域中的特征表示。

Introduction

基于UDA的方法将知识从源域转移到目标域,以弥补域差距,提高泛化能力。用于对象检测器的最先进的(SOTA)UDA方法主要依赖于对抗性学习来在全局级别和实例级别对齐源图像和目标图像的表示。然而,在一级物体探测器上使用上述方法的问题有两个:

  • 全局级别的特征对齐容易发生负迁移,使得UDA模型甚至表现得比模型在源域上更差
  • 其次,主要针对受益于区域建议网络的两级检测器设计了实例级特征自适应方法。
    提出了一个R-YOLO网络,包含QTNet(图像翻译网络)和FCNet(特征对齐网络)来逐步减少两个域之间的差异。我们声称,作为预处理步骤,不需要在源域和目标域之间进行严格的翻译,我们只能将图像生成为两个域之间的插值,以指导对抗性学习。因此,我们设计了一个简单而有效的网络来学习残差图像,以在源域和目标域之间进行相互图像翻译。与现有的图像翻译/恢复方法相比,我们的QTNet有三个主要优势:
  • 它生成具有相同场景但位于不同域的跨域图像,有利于以下基于对抗性学习的特征对齐
  • 它不需要对朦胧和雨天图像的先验知识,因此可以统一用于不利图像的翻译任务;
  • 易于训练以避免基于GAN的方法的训练问题。
    在FCNet中提出了两种对抗性学习模块:
  • 逐像素特征对齐模块(PFC)
  • 全局特征对其模块(GFC)
    PFC模块以像素方式对齐低级别特征,以增强前景对象和背景的跨域,这对于降低后续全局特征对齐中的负迁移风险非常重要。
    GFC模块使用多尺度特征对抗性训练来全局消除不同域之间特征图上的多样性,并增强对象类别对齐。

主要贡献如下:

  • 我们提出了一个统一的一阶段目标检测器训练框架,即R-YOLO,在恶劣天气下,不使用不利领域注释。R-YOLO包含QTNet和FCNet适用于所有YOLO系列检测器,且有着相同的推理速度。
  • 设计了一种简单且有效的网络来相互转化正常图像和不利图像以生成两个域之间的插值。我们还建议使用两种对抗性学习模块来逐步减少特征水平上的领域差异。

Method

在这里插入图片描述

我们有两个主要目标来提高YOLO在恶劣环境下的性能:

  • 在不引入基于GAN的方法的训练问题的情况下,设计一个简单而有效的图像翻译网络来进行数据扩充
  • 提出一种为一级检测器量身定制的特征对准网络,避免触发负转移

QTNet

在这里插入图片描述
我们的QTNet的目的是设计一个适用于朦胧和雨天图像的统一网络,因此在图像翻译过程中无法探索任何特定于天气的信息或先验信息。受残差图像最近在图像恢复和增强任务中的成功启发,如图像去噪[45]、[46]、[47]和图像阴影去除[48]、[49]、[50],我们设计了带有残差模块的QTNet,以直接缩小从输入到输出的映射范围,使学习过程更容易。我们使用简单的自动编码器作为主干,并添加跳过连接路径,将多层编码器特征融合到解码器特征中。为了改进网络训练过程,我们在自动编码器的输入和输出之间添加了跳跃连接,使其能够学习负残差映射。
具体来说,使用源域和目标域图像XS、XT,我们可以获得合成目标图像,XST。然后,QTNet可以训练成对的XS、XST图像,如果XS被用作输入图像,则XST被用作GT图像,反之亦然。
我们使用多尺度重建损失来监督图像翻译后的语义保存网络训练,可以定义如下:
在这里插入图片描述
xi是输入图像,QTNet(xi)是输出图像,xiG是xi对应的GT图像。d是损失强制执行的总层数,λi是对应每层的权重参数。注意QTNet训练的都是合成图像,一旦经过训练,就可以被用来翻译图像。我们还使用感知损失来生成逼真图像。具体来说,给定QTNet的输出图像及其相应的GT图像,我们使用预训练的网络,例如在ImageNet上预训练的VGG,来提取上述两幅图像的特征。然后,我们使用这两个特征之间的MSE损失来评估生成图像的真实性,从而感知损失Lp可以指导高真实性图像生成的QTNet训练,可以定义如下:
在这里插入图片描述
训练QTNet的损失如下:
在这里插入图片描述
生成的图像的重要性有三个方面,这有利于以下特征自适应步骤:

  • 我们可以在目标域中获得大量的注释样本
  • 生成的图像可以看作是源域和目标域之间的插值样本,它驱动源域决策边界适应目标域
  • 对于大量的跨域图像(具有相同场景但在不同域中的图像),我们可以在不考虑语义不一致问题的情况下对齐两个域中的特征,从而避免负迁移。

FCNet(特征对齐网络)

得益于生成的跨域图像,我们在FCNet中进行了基于对抗性学习的特征对齐,其关键是学习鉴别器无法识别的常见特征分布。为此,我们提出了两种特征校准模块,PFC模块和GFC模块,以消除两个领域在特征水平上的差异。FCNet建立在YOLO主干上,而不改变YOLO网络结构。我们唯一做的事就是添加两种鉴别器和对应损失函数来限制特征学习。

PFC
我们发现,与正常天气相比,恶劣天气下的物体细节和背景之间存在巨大差异。具体来说,悬浮的微小颗粒或快速下落的雨滴首先影响前景对象和背景的颜色、边缘和纹理等低级特征,然后导致对象的草图和语义等高级特征的差异。因此,有必要且相对容易地将每个像素的低水平特征校准为对不利天气具有鲁棒性的共同分布。
在这里插入图片描述
Dp是像素特征鉴别器,在本文中是简单的Conv+sigmoid。Gp(xi)j表示从Gp(xi)获得的特征图中的第j个位置的特征向量,H和W是Gp(xi)的高度和宽度。对于QTNet生成的跨域图像,可以严格保证源图像和目标图像之间的语义一致性。然后,在低级别特征图上实施PFC损失可以以像素方式对齐低级别特征,以有效地增强关于前景对象和背景细节的跨域特征。然后,在低级别特征图上实施PFC损失可以以像素方式对齐低级别特征,以有效地增强关于前景对象和背景细节的跨域特征。

GFC Module
一旦像素级低级别特征被校准,就更容易通过多尺度GFC模块学习图像级对齐的特征表示,例如图像风格、全局亮度和暗度。根据YOLO结构(以YOLOv3为例),其中多尺度特征图被提取并发送到用于收集不同尺度特征图的颈部结构,我们在多尺度特征上强制执行GFC模块。多尺度GFC损失定义如下:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/356166.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ES 分词器

概述 分词器的主要作用将用户输入的一段文本,按照一定逻辑,分析成多个词语的一种工具 什么是分词器 顾名思义,文本分析就是把全文本转换成一系列单词(term/token)的过程,也叫分词。在 ES 中,Ana…

部署一个私有化的博客系统

效果 安装 1.创建目录 mkdir /opt/typecho/usr cd /opt/typecho 2.编写配置文件 vim docker-compose.yml 内容如下 version: 3 services:typecho:image: joyqi/typecho:nightly-php7.4-apachecontainer_name: typechorestart: alwaysenvironment:- TYPECHO_SITE_URLhttp:…

大模型应用开发:为产品创建一个AI客服/智能助手

欢迎阅读本系列文章!我将带你一起探索如何使用OpenAI API来开发GPT应用。无论你是编程新手还是资深开发者,都能在这里获得灵感和收获。 本文将继续展示AI助手的开发方式,在OpenAPI中它的名字是Assistants。 什么是Assistants? 在之…

《信息系统项目管理师》备考计划

《信息系统项目管理师》证书价值和作用 信息系统项目管理师证书的价值体现在提升专业知识、助力职业发展、职称评定、技能补贴和人才引进或积分落户等方面。 一方面可以通过系统学习,可以显著提高自己在信息系统项目管理领域的专业水平。方便自己以后向更多的方向…

【思科】 GRE VPN 的实验配置

【思科】GRE VPN 的实验配置 前言报文格式 实验需求配置拓扑GRE配置步骤R1基础配置GRE 配置 ISP_R2基础配置 R3基础配置GRE 配置 PCPC1PC2 抓包检查OSPF建立GRE隧道建立 配置文档 前言 VPN :(Virtual Private Network),即“虚拟专…

路由进阶

文章目录 1.路由的封装抽离2.声明式导航 - 导航链接3.声明式导航-两个类名自定义匹配的类名 4.声明式导航 - 跳转传参查询参数传参动态路传参两种传参方式的区别动态路由参数可选符 5.Vue路由 - 重定向6.Vue路由 - 4047.Vue路由 - 模式设置8.编程式导航 - 两种路由跳转9.编程式…

AttributeError: ‘Plotter‘ object has no attribute ‘topicture‘

在以下网址找到自己的pytorch和cuda版本然后点击进入: https://nvidia-kaolin.s3.us-east-2.amazonaws.com/index.html 下载自己系统和python对应的最新版本 使用pip安装 pip install kaolin-0.14.0-cp38-cp38-linux_x86_64.whl

如何使用Everything随时随地远程访问本地电脑搜索文件

文章目录 前言1.软件安装完成后,打开Everything2.登录cpolar官网 设置空白数据隧道3.将空白数据隧道与本地Everything软件结合起来总结 前言 要搭建一个在线资料库,我们需要两个软件的支持,分别是cpolar(用于搭建内网穿透数据隧道…

力扣日记1.28-【回溯算法篇】93. 复原 IP 地址

力扣日记:【回溯算法篇】93. 复原 IP 地址 日期:2023.1.28 参考:代码随想录、力扣 93. 复原 IP 地址 题目描述 难度:中等 有效 IP 地址 正好由四个整数(每个整数位于 0 到 255 之间组成,且不能含有前导 0&…

项目解决方案:市小区高清视频监控平台联网整合设计方案(上)

目 录 一、项目需求 1.1业务需求 1.2技术需求 1.3 环境要求 1.3.1 硬件要求 1.3.2 技术服务要求 二、系统设计方案 2.1 视频监控平台基础功能设计 2.2 视频资源及联网设备编码与管理设计 2.2.1 全省现有联网视频资源属性 2.2.2 视频资源编码具体格…

超值福利,全是独家特制版软件,功能超凡且完全免费

闲话休提,直接为您呈现四款神仙级别的软件。 1、我的ABC软件工具箱 这款小巧而强大的批量处理办公助手——我的ABC软件工具箱,不仅界面清爽、无弹窗广告,更重要的是,它完全免费!这款工具箱将成为您高效办公的得力助手…

D8: Type com.huazhuokeji.footballpark.BuildConfig is defined multiple times:

D8: Type com.huazhuokeji.footballpark.BuildConfig is defined multiple times: 报错信息如下分析总结 报错信息如下 E:\unityProject\GVoice\Temp\gradleOut\launcher\build\intermediates\project_dex_archive\release\out\com\huazhuokeji\footballpark\BuildConfig.dex:…

获取鼠标点击图片时候的坐标,以及利用html 中的useMap 和area 实现图片固定位置的点击事件

一 编写原因 应项目要求,需要对图片的固定几个位置分别做一个点击事件,响应不同的操作,如下图,需要点击红色区域,弹出不同的提示框: 二 获取点击图片时候的坐标 1. 说明 实现这以上功能的前提是需要确定需…

Dataloader加载数据集

文章目录 回顾Epoch, Batch-Size, Iterations糖尿病 Dataset 构建数据集实现代码DataLoader使用 糖尿病分类预测代码torchvision.datasets练习 练习 回顾 上节课使用全部数据进行训练。 Epoch, Batch-Size, Iterations epoch:训练的总轮次,指所有的训练样本都进…

高分文献解读|乳酸通过与可溶性腺苷酸环化酶结合调控铁代谢

乳酸(LA)的过量产生可能发生在运动期间或者许多疾病中,例如癌症中。个人伴有高乳酸血症的患者常表现为贫血、血清铁减少以及一种铁代谢关键调控因子—铁调素(hepcidin)升高。然而,目前尚不清楚乳酸是否以及如何调节铁调素的表达。…

C++从初级工程师到中级工程师【个人学习笔记】

目录 1 背景2 要点2.1 内存分区模型2.1.1 程序运行前2.1.2 代码 2.2.1 程序运行后栈区代码 1 背景 从这一章开始,开始学习C的面向对象编程,是C中的核心。 2 要点 2.1 内存分区模型 C程序在执行时,将内存大方向划分为4个区域 代码区&…

HiveSQL题——排序函数(row_number/rank/dense_rank)

一、窗口函数的知识点 1.1 窗户函数的定义 窗口函数可以拆分为【窗口函数】。窗口函数官网指路: LanguageManual WindowingAndAnalytics - Apache Hive - Apache Software Foundationhttps://cwiki.apache.org/confluence/display/Hive/LanguageManual%20Windowin…

怎样用流程自定义表单提升办公效率?

如果想要提升办公协作效率,可以试试低代码技术平台及流程自定义表单工具。不可否认的是,随着社会的进步和发展,传统的表单制作工具已经没有办法再满足业务量不断上涨的办公需求了,但是,借助专业的流程自定义表单工具就…

“值得一试的六个浏览器扩展推荐|让你的上网更加便捷和有趣!”

iTab新标签页(免费ChatGPT) iTab是新一代组件式标签页的首创者,简洁美观高效无广,是您打造个人学习工作台的浏览器必备插件。 详情请见: iTab新标签页(免费ChatGPT) - Microsoft Edge Addons AdGuard 广告拦截器 AdGuard 广告拦截器可有效的…

核对表:使用条件语句CHECKLIST:Using Conditionals

核对表&#xff1a;使用条件语句CHECKLIST&#xff1a;Using Conditionals if-then语句 代码的正常路径清晰吗&#xff1f; if-then 测试对等量分支的处理方式正确吗? 确保不要用“>”代替“>”或用“<”代替“<”。 使用了else子句并加以说明吗&#xff1f; els…