图像超分辨率技术新进展:混合注意力聚合变换器HAAT

目录

1. 引言:

2. 混合注意力聚合变换器(HAAT):

2.1 Swin-Dense-Residual-Connected Block(SDRCB):

2.2 Hybrid Grid Attention Block(HGAB):

3. 实验结果:

4. 结论:


1. 引言:

在计算机视觉领域,单图像超分辨率(SISR)技术的目标是从一个低分辨率的图像中重建出高分辨率的图像。这一技术因其在多种应用中的广泛需求而成为一个关键的研究领域。传统的基于CNN的方法,如SRCNN、VDSR和SRGAN,通过使用卷积神经网络显著改善了图像的纹理特征恢复。然而,这些方法在模拟图像中的长距离依赖关系方面存在局限,这主要是由于CNN的固有偏置,包括参数依赖的感受野扩展和卷积操作的核大小限制,这可能导致忽略图像中的非局部空间信息。

为了解决这些问题,研究者开始探索基于Transformer的SISR模型,这些模型能够利用其长距离依赖模拟的能力,从而提高SISR的性能。特别是,SwinIR利用Swin Transformer取得了显著的改进,而混合注意力变换器(HAT)通过结合重叠的交叉注意力模块、基于窗口的自注意力和通道注意力,也产生了最先进的结果。

2. 混合注意力聚合变换器(HAAT):

HAAT模型的提出是为了解决现有基于Transformer的方法在图像恢复问题上的局限性,尤其是当前基于窗口的Transformer网络将自注意力计算限制在集中区域,导致感受野受限并且无法充分利用原始图像的特征信息。

HAAT通过整合Swin-Dense-Residual-Connected Blocks(SDRCB)和Hybrid Grid Attention Blocks(HGAB)来构建,其中SDRCB在保持精简架构的同时扩展了感受野,从而提高了性能。HGAB则结合了通道注意力、稀疏注意力和窗口注意力,以改善非局部特征融合,并实现更引人注目的视觉结果。

2.1 Swin-Dense-Residual-Connected Block(SDRCB):

SDRCB是HAAT模型的一个关键组成部分,它利用Swin Transformer Layer(STL)的移窗自注意力机制来捕获长距离依赖关系。STL根据全局内容调整模型的强调点,增强特征提取,并在网络加深时保持全局细节,扩大感受野而不降低性能。SDRCB通过与密集残差连接的结合,进一步扩展了感受野,并提高了对关键信息的强调,这对于需要细致、上下文敏感处理的SISR任务至关重要。SDRCB的计算过程涉及到多级特征图的连接、特征转换和残差缩放,其中残差缩放因子用于稳定训练过程。下图是SDRCB框架:

2.2 Hybrid Grid Attention Block(HGAB):

HGAB是HAAT模型的另一个核心组成部分,它由混合注意力层(MAL)和多层感知器(MLP)层组成。HGAB的工作流程是将输入特征按照通道分割,并分别通过不同的自注意力机制进行处理,包括窗口多头自注意力(W-MSA)、稀疏窗口多头自注意力(SW-MSA)和网格多头自注意力(Grid-MSA)。此外,HGAB还对输入特征执行通道注意力操作。HGAB的设计采用了后归一化方法,以增强网络训练的稳定性。MAL的计算过程涉及到对输入特征的分割、不同自注意力机制的处理以及通道注意力的操作,最终将这些特征重新组合并加到原始特征上。下图是HGAB结构:

3. 实验结果:

HAAT模型在DF2K数据集上进行了训练,该数据集是一个包含DIV2K和Flickr2K的大规模聚合数据集。在训练过程中,研究人员通过双三次下采样方法生成了不同缩放因子的低分辨率图像。为了评估模型的有效性,研究人员在Set5和Set14等知名的SISR基准数据集上进行了性能评估。实验结果表明,HAAT在峰值信噪比(PSNR)和结构相似性(SSIM)这两个评价指标上均优于现有的最先进技术。这一结果证明了HAAT在参数数量更少、计算需求更低的情况下,仍然能够取得比现有最先进模型更好的结果。下图是HAAT与SOTA方法的定量比较:

4. 结论:

本文介绍了HAAT,这是一种新型的单图像超分辨率模型。HAAT通过增强DRCT架构,强调了信息流的稳定性和通过残差块中的密集连接扩展感受野,以及通过移窗注意力机制自适应地获取全局信息。这使得模型能够增强对全局地理信息的强调,优化其能力,并避免信息瓶颈。此外,HAAT还提供了HGAB来表示图像中的长距离关系,通过整合通道注意力、稀疏注意力和窗口注意力,提高了多级结构相似性。

HAAT在DF2K数据集上进行了训练,并在Set5和Set14数据集上进行了验证。实验结果表明,HAAT在单图像超分辨率任务中的性能超越了现有的最先进技术。

引用论文:HAAT: Hybrid Attention Aggregation Transformer for Image Super-Resolution

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/930734.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Appium】AttributeError: ‘NoneType‘ object has no attribute ‘to_capabilities‘

目录 1、报错内容 2、解决方案 (1)检查 (2)报错原因 (3)解决步骤 3、解决结果 1、报错内容 在PyCharm编写好脚本后,模拟器和appium也是连接成功的,但是运行脚本时报错&…

1.1 Beginner Level学习之“创建 ROS msg 和 srv”(第十节)

学习大纲: 1. msg 和 srv msg 文件是描述 ROS 消息字段的简单文本文件。它们用于为不同语言生成消息的源代码。srv 文件则描述了一个服务,包括两部分:请求和响应。Srv 文件用于生成服务的源代码。msg 文件存储在包的 msg 目录中。srv 文件存…

Android仿美团左右联动购物列表

Android仿美团左右联动购物列表 左右联动购物列表,不难。 一、思路: 两个RecycleView 二、效果图: 三、关键代码: public class MainActivity extends AppCompatActivity {private RecyclerView rl_left;private RecyclerVie…

微信小程序 运行出错 弹出提示框(获取token失败,请重试 或者 请求失败)

原因是:需要登陆微信公众平台在开发管理 中设置 相应的 服务器域名 中的 request合法域名 // index.jsPage({data: {products:[],cardLayout: grid, // 默认卡片布局为网格模式isGrid: true, // 默认为网格布局page: 0, // 当前页码size: 10, // 每页大小hasMore…

室联人形机器人:家政服务任务结构化、技术要点、深入应用FPGA的控制系统框架设计(整合版)

目录: 0 引言 1 人形机器人对室内家政服务任务的结构化 1.1人形机器人在室内家政服务中的比较优势 1.1.1 人形机器人拟人性的7个维度 1.1.2 拟人性在室内家政服务工作中的比较优势 1.1.3 潜在的重要用户:宠物爱好者 1.2 居所室内环境的特征与结构…

【YOLO部署Android安卓手机APP】YOLOv11部署到安卓实时目标检测识别——以火焰烟雾目标检测识别举例(可自定义更换其他目标)

前言:本项目基于YOLOv11部署到手机APP实现对火焰烟雾的检测识别,当然,以此你可以按照本项目开发步骤扩展更换为其他目标进行检测,例如更换为车牌、手势、人脸面部活动、人脸表情、火焰烟雾、行人、口罩、行为、水果、植物、农作物等等部署手机APP进行检测。本文为详细设计/…

python 执行celery

1、redis安装并启动redis安装与使用-CSDN博客 2、安装 celery 、eventlet 3. Task handler raised error: ValueError(not enough values to unpack (expected 3, got 0)) - Redskaber - 博客园 pip install celery pip install eventlet 3、python 版本3.10 #创建异步任…

未完成_RFdiffusion应用案例_从头设计pMHC的结合剂

目录 1. 论文导读1)摘要2)设计流程3)设计流程的验证 2. 实战 1. 论文导读 Liu, Bingxu, et al. “Design of high specificity binders for peptide-MHC-I complexes.” bioRxiv (2024): 2024-11. 1)摘要 MHC-I 将胞内抗原肽递呈…

【css】基础(一)

本专栏内容为:前端专栏 记录学习前端,分为若干个子专栏,html js css vue等 💓博主csdn个人主页:小小unicorn ⏩专栏分类:css专栏 🚚代码仓库:小小unicorn的代码仓库🚚 &a…

【Python高级语法与正则表达式】

目录 1.正则表达式 1.1概述: 1.2re模块介绍 1.3re模块相关方法(常用): 1.4案例 1.5正则表达式详解 1.5.1查什么 1.5.2查多少 1.5.3 从哪查 1.6重要概念 1.6.1子表达式 1.7 正则表达式的其他方法 1.7.1选择匹配符 1.7.2…

Vue03

目录 一、今日目标 1.生命周期 2.综合案例-小黑记账清单 3.工程化开发入门 4.综合案例-小兔仙首页 二、Vue生命周期 三、Vue生命周期钩子 四、生命周期钩子小案例 1.在created中发送数据 六、工程化开发模式和脚手架 1.开发Vue的两种方式 2.Vue CLI脚手架 基本介绍…

云轴科技ZStack出席中国电信国际EMCP平台香港发布会,持续推动海外合作

近日,以“云聚未来 翼起新篇”为主题的中国电信国际多云服务一站式平台(E-surfing Managed Cloud Platform,简称EMCP平台)新闻发布会在香港成功举办,标志着中国电信国际在云计算服务领域取得了又一重大进展。云轴科技…

Alibaba Druid(简称Druid)

目录 核心功能 数据源配置与管理: 高性能与可扩展性: 监控与SQL解析: 安全性: 应用场景 使用方式 配置示例 通过yaml方式配置 web.xml中配置 访问Druid的监控页面 监控页面展示 Alibaba Druid(简称Druid&am…

JavaWeb学习--cookie和session

目录 (一)Cookie概述 1.什么叫Cookie 2.Cookie规范 3.Cookie的覆盖 4.cookie的最大存活时间 ​​​​​​(Cookie的生命) (二) Cookie的API 1.创建Cookie:new 构造方法 2.保存到客户端浏…

策略模式实战 - 猜拳游戏

**可以整体的替换一套算法,这就是策略模式。**这样对于同一个问题,可以有多种解决方案——算法实现的时候,可以通过策略模式来非常方便的进行算法的整体替换,而各种算法是独立封装好的,不用修改其内部逻辑。 具体的实…

Transformer简述和实现

Transformer 1、概述 (一)、诞生 自从2017年此文《Attention is All You Need》提出来Transformer后,便开启了大规模预训练的新时代,也在历史的长河中一举催生出了GPT、BERT这样的里程碑模型。 (二)、优势 相比之前占领市场的LSTM和GRU模型&#xf…

Astro 5.0 发布

Astro 5.0 发布! 使用 Astro Content Layer 可以从任何来源加载内容,并使用 Server Islands 将缓存的静态内容与动态个性化内容结合起来。 什么是 Astro Astro 是用于构建内容驱动网站(包括博客、营销和电子商务)的 Web 框架。…

数据结构与算法-03链表-04

链表与递归 在链表操作中移除、反转经常会用到递归实现。通过力扣案例理解链表常规操作中的递归实现。 移除数据 删除链表的节点 问题 LCR 136. 删除链表的节点 - 力扣(LeetCode) 问题描述 给定单向链表的头指针和一个要删除的节点的值,定…

Let up bring up a linux.part2 [十一]

之前的篇幅中我们已经将 Linux 内核 bringup 起来了,不知道大家有没有去尝试将根文件系统运行起来,今天我就带领大家完成这个事情,可以跟着下面的步骤一步步来完成: 在这里我们使用 busybox 构建 rootfs: 下载 busyb…

WEB开发: Node.js路由之由浅入深(一) - 全栈工程师入门

作为一个使用Node.js多年的开发者,我已经习惯于用Node.js写一些web应用来为工作服务,因为实现快速、部署简单、自定义强。今天我们一起来学习一个全栈工程师必备技能:web路由。(观看此文的前提是默认你已经装好nonde.js了&#xf…