【论文阅读笔记】Split frequency attention network for single image deraining

1.论文介绍

Split frequency attention network for single image deraining
用于单幅图像去噪的分频注意力网络
Paper Code
2023年 SIVP

2.摘要

雨纹对图像质量的影响极大,基于数据驱动的单图像去噪方法不断发展并取得了巨大的成功。然而,传统的卷积神经网络只能隐式地对频域特征进行建模,而离散余弦变换(DCT)可以看作是对频域特征的显式建模。因此,我们提出了一种分裂频率注意力,以改善内部相关性的输入特征在频域的DCT。我们选择前K个低频分量作为DCT层的输出,在频域恢复出高质量的图像,而分裂机制使网络聚焦于信息丰富的区域,保持了恢复图像细节的保真度。在几个数据集上的实验表明,我们的方法取得了更好的结果比最近的最先进的方法。

Keywords:频域,去噪,图像恢复

3. Introduction

雨条纹降低了从相机捕获的图像,大多数高级别的户外视觉任务需要清晰的图像,并且由于下雨场景,这些方法通常表现不佳。因此,研究者们提出了许多处理降雨图像的算法。大多数方法忽略了图像的结构信息,并且由于不能保持图像细节和结构的保真度而破坏了纹理细节。由于分裂注意力通过对输入特征图进行分裂和分类,使网络专注于具有丰富信息的区域。分裂注意力通过改善输入特征的内部相关性,保持了图像细节的保真度和图像结构的一致性。因此,我们采用了分裂注意力的方法来恢复降雨图像。

综上所述,我们提出了一个分裂频率的注意力网络用于单图像去噪。首先,我们提出了一个分裂频率注意(SFA),以改善内部相关性的输入特征在频域的DCT。在此基础上提出了一种分裂频率注意块(SFAB)算法,从图像的丰富信息区域中提取特征,使恢复后的图像保持了图像细节和结构的保真度。最后,提出了一种分裂频率注意组(SFAG)级联的端到端网络,恢复雨图像。

4.网络结构介绍

网络结构如下图,主要包含四个模块:预处理模块、分裂频率注意力特征提取、动态特征增强(DFE)模块和重建模块。预处理模块包含一个3 × 3卷积层和两个下采样层,大大降低了GPU的内存消耗。使用分裂频率注意组来提取深度特征。然后利用两个DFE模块融合更多的空间信息,增强了变换能力。对称地,重建模块包含两个上采样层和一个3 × 3卷积层,用于恢复特征的大小和输出恢复的图像。mixup操作用于连接下采样层和上采样层。
在这里插入图片描述

频域学习

根据二维离散余弦变换(DCT),频谱可按下式计算:在这里插入图片描述
其中 x ∈ R H × W x ∈ R^{H×W} xRH×W表示输入,H和W分别是输入的高度和宽度。基函数 B h , w i , j B^{i,j}_{h,w} Bh,wi,j为:
在这里插入图片描述
相应地,可以通过下式从频谱f中恢复x:
在这里插入图片描述
如果假设h、w =0,则:
在这里插入图片描述
f 0 , 0 d c t f^{dct}_{0,0} f0,0dct表示2D DCT的最低频率分量,并且它与全局平均池化(GAP)成比例。

当使用GAP时,仅保留最低频率信息。将GAP推广到2D DCT的更多频率分量,并使用2D DCT的多个频率分量压缩更多信息。设X为输入特征图,分配2D DCT分量来压缩通道注意力的结果,并定义:
在这里插入图片描述
[ui vi ]是对应于X的频率分量2D索引,并且Freqi是压缩向量。在信道注意之后,DCT层的输出被定义为:
在这里插入图片描述
其中sigmod是激活函数,fc表示诸如一维卷积或全连接层的映射函数,并且Freq是具有不同2D DCT分量的整个压缩向量:
在这里插入图片描述
其中K是前K个低频分量,根据先前的工作,低频分量更适合CNN。

就是介绍了一下二维离散余弦变换和逆变换:
在这里插入图片描述
然后根据频域信号,只提取低级特征,即i=0、1、……K-1的信号,把它们连接在一起然后形成Freq。

分离的网络

由于受感受野的限制,CNN缺乏交互性和相关性,所以提出了一种分裂网络,通过对特征进行分裂和分类来提高输入特征的内部相关性,并从信息丰富的区域中提取特征,使恢复后的图像保持图像细节和结构的保真度。在分裂网络和频率关注度的基础上,设计了一种基本的分块分裂频率关注度(SFA)来构建去盲网络。

分频注意
如下图所示,在SFA中,输入特征图沿通道轴沿着分成m个部分。以 X ∈ R W × H × C X ∈ R^{W×H×C} XRW×H×C为输入特征图,利用3 × 3卷积得到 X 1 ∈ R W × H × C 1 X_1 ∈ R^{W×H×C_1} X1RW×H×C1,其中C1=mC,然后利用逐元素求和运算融合这些分裂。跨多个分裂的元素求和可以融合组合表示。

然后将融合特征f ∈ RW×H×C通过一个DCT层得到X2 ∈ RW×H× C,然后采用两个1 × 1卷积层得到X3 ∈ RW×H×C和X4 ∈ RW×H×C1,然后使用r − softmax操作增强来自丰富区域的信息,然后将特征再次分类为m个分裂。然后将每个分裂乘以前一个分裂,最后再次使用逐元素求和运算以获得输出特征。结构如下:
在这里插入图片描述

分裂频率注意块(SFAB)是基于SFA设计的。SFAB由若干个1 × 1卷积层、批归一化(BN)、校正的线性激活函数(ReLU)和SFA。
在这里插入图片描述

使用跳过连接来增强细节信息。然后利用SFAB和SFA建立分裂频率注意群(SFAG)。在SFAG中,输入特征被分成两条路径,一条是SFA,另一条是几个SFAB,两个结果融合生成输出:
在这里插入图片描述
其中G(·)由几个SFAB和一个3×3卷积层组成。
在这里插入图片描述

动态特征增强

通常,在卷积层中使用固定网格内核。具有固定网格内核的卷积不能提取结构化信息。提出了具有动态和灵活内核的可变形卷积以利用结构化信息。两个可变形卷积层被用作动态特征增强(DFE),以从丰富区域捕获更重要的信息。

混接

在浅层中捕获的低级特征可以通过短连接传递到更深层,并且可以增强图像的细节信息。但是深度网络表现出了不受欢迎的行为,如鲁棒性和记忆,并且提出了一种mixup操作。混淆很简单,它可以增加神经网络的鲁棒性我们应用mixup来连接下采样层和上采样层,并且下采样层中的细节信息可以与更深的上采样层中捕获的高级特征融合。第二下采样层的输出与第一上采样的输出混合,并且第一下采样层的输出与第二上采样的输出混合。混合操作定义为:
在这里插入图片描述
其中fmix是输出,α是在训练期间学习的参数,f↓是来自下采样层的特征,f↑表示来自上采样层的特征图。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/467537.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Go语言gin框架中加载html/css/js等静态资源

Gin框架没有内置静态文件服务,但可以使用gin.Static或gin.StaticFS中间件来提供静态文件服务。 效果图如下: 一、gin 框架加载 Html 模板文件的方法 方式1:加载单个或多个html文件,需要指明具体文件名 r.LoadHTMLFiles("vie…

Sketch软件:重塑UI/UX设计流程的革命性工具

Sketch是一款在Mac操作系统上运行的矢量图形设计软件,其功能特色丰富多样,深受设计师们的喜爱。以下是Sketch软件的主要功能特色介绍: 专业矢量图形设计:Sketch为UI设计、移动应用设计和Web设计等领域提供了强大的支持。它支持线条…

优化选址问题 | 基于NSGAII求解考虑成本、救援时间和可靠性的海上救援选址多目标问题附matlab代码

目录 问题代码问题 NSGA-II(非支配排序遗传算法II)是一种流行的多目标优化算法,用于解决具有多个冲突目标的问题。在海上救援选址问题中,我们可能希望同时优化成本、救援时间和可靠性。以下是一个简化的示例,说明如何使用NSGA-II算法来解决这个问题,并提供相应的MATLAB代…

【数据结构】布隆过滤器

目录 前言 1. 什么是布隆过滤器? 2. 布隆过滤器的原理 2.1 添加元素原理 2.2 判断元素存在原理 3. 布隆过滤器使用场景 4. 使用 Java 语言实现布隆过滤器 测试用例 测试结果 注:手机端浏览本文章可能会出现 “目录”无法有效展示的情况&#x…

Flutter-底部弹出框(Widget层级)

需求 支持底部弹出对话框。支持手势滑动关闭。支持在widget中嵌入引用。支持底部弹出框弹出后不影响其他操作。支持弹出框中内容固定头部和下面列表时,支持触摸头部并在列表不在头部的时候支持滑动关闭 简述 通过上面的需求可知,就是在界面中可以支持…

【早鸟优惠|高录用|EI稳定检索】2024年虚拟现实、图像和信号处理国际学术会议(ICVISP 2024)诚邀投稿/参会!

【早鸟优惠|高录用|EI稳定检索】 2024年虚拟现实、图像和信号处理国际学术会议(ICVISP 2024)诚邀投稿/参会! # 早鸟优惠 # 先投稿先送审 # #投稿免费参会、口头汇报及海报展示# 2024年虚拟现实、图像和信号处理国际学术会议(I…

京津冀自动驾驶产业盛会“2024北京国际自动驾驶技术展览会”

随着科技的飞速发展,自动驾驶技术成为了汽车产业变革的热点和前沿。智能化、网联化已经成为推动汽车产业创新发展的重要力量,而自动驾驶技术则是其中的关键一环。它不仅能够提高道路安全性、缓解交通拥堵,还能为乘客带来更加舒适、便捷的出行…

RediSearch比Es搜索还快的搜索引擎

1、介绍 RediSearch是一个Redis模块,为Redis提供查询、二次索引和全文搜索。要使用RediSearch,首先要在Redis数据上声明索引。然后可以使用重新搜索查询语言来查询该数据。RedSearch使用压缩的反向索引进行快速索引,占用内存少。RedSearch索…

Qt5.14.2 深入理解Qt多线程编程,掌握线程池架构实现高效并发

在高并发的软件系统中,多线程编程是解决性能瓶颈和提高系统吞吐量的有效手段。作为跨平台的应用程序开发框架,Qt为我们提供了强大的多线程支持。本文将深入探讨Qt多线程编程的实现细节,并介绍线程池的设计思想,帮助读者彻底掌握Qt…

Flutter-数字切换动画

效果 需求 数字切换时新数字从上往下进入,上个数字从上往下出新数字进入时下落到位置并带有回弹效果上个数字及新输入切换时带有透明度和缩放动画 实现 主要采用AnimatedSwitcher实现需求,代码比较简单,直接撸 import dart:math;import p…

huawei 华为交换机 配置手工模式链路聚合示例

组网需求 如 图 3-21 所示, SwitchA 和 SwitchB 通过以太链路分别都连接 VLAN10 和 VLAN20 的网络,SwitchA 和 SwitchB 之间有较大的数据流量。 用户希望SwitchA 和 SwitchB 之间能够提供较大的链路带宽来使相同 VLAN 间互相通信。 同时用户也希望能够提…

网页星光闪耀背景动画特效

网页星光闪耀背景动画特效 源码下载 网页星光闪耀背景动画特效

DockerHub搜索并拉取一个Redis镜像

1)去DockerHub搜索Redis镜像 2)查看Redis镜像的名称和版本 3)利用docker pull命令拉取镜像 4)利用docker save命令将 redis:latest打包为一个redis.tar包 5)利用docker rmi 删除本地的redis:latest 6)利用…

Github 2024-03-18 开源项目周报Top15

根据Github Trendings的统计,本周(2024-03-18统计)共有15个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Python项目6TypeScript项目2Go项目2JavaScript项目2非开发语言项目1HTML项目1CSS项目1Rust项目1Dart项目1C++项目1Jupyter Notebook项目1Electr…

创新应用2:nnmf+DBO+K-Medoids聚类,蜣螂优化算法DBO优化K-Medoids,适合学习和发paper。

创新应用2:nnmfDBOK-Medoids聚类,蜣螂优化算法DBO优化K-Medoids,适合学习和发paper。 一、蜣螂优化算法 摘要:受蜣螂滚球、跳舞、觅食、偷窃和繁殖等行为的启发,提出了一种新的基于种群的优化算法(Dung Beetle Optim…

ONLYOFFICE文档8.0全新发布:私有部署、卓越安全的协同办公解决方案

ONLYOFFICE文档8.0全新发布:私有部署、卓越安全的协同办公解决方案 文章目录 ONLYOFFICE文档8.0全新发布:私有部署、卓越安全的协同办公解决方案摘要📑引言 🌟正文📚一、ONLYOFFICE文档概述 📊二、ONLYOFFI…

openssl3.2 - exp - openssl speed test

文章目录 openssl3.2 - exp - openssl speed test概述笔记表面上能列出的算法集合没列出的算法, 有的也支持不支持的算法的例子直接提示算法不支持算法的属性找不到到底哪些算法才是可以测试的算法?那看看哪些算法是支持的?包含支持的算法的名称数组在算法失败的提示处, 将支…

Qt文件以及文件夹相关类(QDir、QFile、QFileInfo)的使用

关于Qt相关文件读写操作以及文件夹的一些知识,之前也写过一些博客: Qt关于路径的处理(绝对路径、相对路径、路径拼接、工作目录、运行目录)_qt 相对路径-CSDN博客 C/Qt 读写文件_qt c 读取文本文件-CSDN博客 C/Qt读写ini文件_…

阿里云-零基础入门NLP【基于机器学习的文本分类】

文章目录 学习过程赛题理解学习目标赛题数据数据标签评测指标解题思路TF-IDF介绍TF-IDF 机器学习分类器TF-IDF LinearSVCTF-IDF LGBMClassifier 学习过程 20年当时自身功底是比较零基础(会写些基础的Python[三个科学计算包]数据分析),一开始看这块其实挺懵的&am…

基于Spring Boot的四川火锅文化网站的设计与实现

摘 要 四川火锅文化网站的目的是让使用者可以更方便的将人、设备和场景更立体的连接在一起。能让用户以更科幻的方式使用产品,体验高科技时代带给人们的方便,同时也能让用户体会到与以往常规产品不同的体验风格。 与安卓,iOS相比较起来&…