【EDSR】《Enhanced Deep Residual Networks for Single Image Super-Resolution》

在这里插入图片描述

CVPR workshops-2017

code:

  • https://github.com/limbee/NTIRE2017/tree/master
  • https://github.com/sanghyun-son/EDSR-PyTorch

文章目录

  • 1 Background and Motivation
  • 2 Related Work
  • 3 Advantages / Contributions
  • 4 Method
    • 4.1 Residual blocks
    • 4.2 Single-scale model
    • 4.3 Multi-scale model
  • 5 Experiments
    • 5.1 Datasets and Metrics
    • 5.2 Geometric Self-ensemble
    • 5.3 Evaluation on DIV2K Dataset
    • 5.4 Benchmark Results
    • 5.5 NTIRE2017 SR Challenge
  • 6 Conclusion(own)


1 Background and Motivation

single image super-resolution(SISR)aims to reconstruct a high-resolution image I S R I^{SR} ISR from a single low-resolution image I L R I^{LR} ILR

I L R I^{LR} ILR I S R I^{SR} ISR 的关系因应用场景而异,比如 bicubic downsampled 关系,blur,decimation(抽取) or noise

现有方法要么网络结构设计的不太稳定,要么 treat super-resolution of different scale factors as independent problems

作者设计了 single-scale SR model——enhanced deep super-resolution network(EDSR),和 multi-scale deep super-resolution system (MDSR)

2 Related Work

learn mapping functions between I L R I^{LR} ILR and I H R I^{HR} IHR image pairs

learning methods from neighbor embedding to sparse coding

第一篇用 DCNN 做 SR 的《Learning a deep convolutional network for image super-resolution》(ICCV-2014)

encoder

3 Advantages / Contributions

提出 single-scale SR model EDSR(改进了 residual block)和 multi-scale SR model MDSR(新结构)

Our proposed single-scale and multi-scale models have achieved the top ranks in both the standard benchmark datasets and the DIV2K dataset.

在这里插入图片描述

4 Method

4.1 Residual blocks

applying ResNet architecture directly to low-level vision problems like super-resolution can be suboptimal.

在这里插入图片描述
作者学习 SRResNet 去掉了 skip connection 后的 ReLU,在此基础上,又去掉了 BN,去掉 BN 的理由如下:

they get rid of range flexibility from networks by normalizing the features, it is better to remove them

4.2 Single-scale model

在这里插入图片描述

upsample 是 x2 or x3 or x4,根据任务要求来


深度为 B 宽度为 F 的网络 occupy O ( B F ) O(BF) O(BF) memory with O ( B F 2 ) O(BF^2) O(BF2)

提升宽度可以显著提升 model capacity,但是 inception-v4 中观察到 if filters number(width) 超过 1000,网络迭代后会慢慢死掉(average pooling 之前的 layer的输出为0),作者加大宽度的时候也会遇到这个问题,解决办法, Scaling of the Residuals——【Inception-v4】《Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning》

在这里插入图片描述
factor 0.1


作者用 x2 的模型作为预训练,来训练 x4 的,效果比直接从头开始训练 x4 的要好
在这里插入图片描述

4.3 Multi-scale model

在这里插入图片描述
不知道 Single-scale model 的基础上直接多尺度输出,效果 OK 不

这样多少有点冗余的感觉

训练的时候,对应任务部分才训练,其余部分都冻住,例如训练 x2 SR 的时候,x3 和 x4 相关 resblock 被冻结

construct the minibatch with a randomly selected scale among ×2, ×3 and ×4.

Only the modules that correspond to the selected scale are enabled and updated

在这里插入图片描述
Baseline 参数量比较小,MDSR 中等,EDSR 设计的比较大

单个 MDSR 网络肯定是大的,但比起 3个同等规模的 EDSR 来说,会省下一些参数量

5 Experiments

we use the RGB input patches of size 48×48 from LR image with the corresponding HR patches.

5.1 Datasets and Metrics

Datasets

  • DIV2K:2K resolution
  • Set5
  • Set14
  • B100
  • Urban100
  • NTIRE 2017 Super-Resolution Challenge

评价指标

  • peak signal-to-noise ratio (PSNR)
  • SSIM

5.2 Geometric Self-ensemble

就是 TTA——test time augmentation 吧

在这里插入图片描述
作者用 flip 和 rotation 产生另外 7 种包含原始输入共 8 种 inputs,推理后, inverse transform to those output images,最后 8个结果平均

eg 顺时针旋转 30 度的图 SR 后,逆时针转 30 回来

在这里插入图片描述
上面表达式中 n n n 表示输入图片的索引,i 是 transformation 的索引

LR = low resolution

SR = super resolution

论文中如果用了 Geometric Self-ensemble,模型名称后面会有个 +

5.3 Evaluation on DIV2K Dataset

在这里插入图片描述
作者用 L1 loss 替换 L2 loss,从第一列和第二列结果对比来看,L1 要好

其实抛开参数量谈效果,很流氓,但作者也说了这篇文章的 motivation,this work is initially proposed for the purpose of participating in the NTIRE2017 Super-Resolution Challenge——技术报告

5.4 Benchmark Results

在这里插入图片描述
在这里插入图片描述

效果对比起来看,确实 OK

5.5 NTIRE2017 SR Challenge

在这里插入图片描述

在这里插入图片描述

6 Conclusion(own)

  • applying ResNet architecture directly to low-level vision problems like super-resolution can be suboptimal.
  • geometric self-ensemble is valid only for symmetric downsampling methods such as bicubic downsampling

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/469547.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Android自动化测试中短信的操作技巧!

一、发送短信的机制简介 短信作为一种重要的移动通信方式,在APP测试中也经常需要验证短信功能的正确性。为了避免大量手动操作设备发送短信的低效率,我们可以利用ADB命令达到自动发送短信的目的。 短信的发送需要手机短信APP的支持。命令行通过启动短信…

Data-Free Generalized Zero-Shot Learning 中文版

摘要 深度学习模型具有从大规模数据集中提取丰富知识的能力。然而,由于涉及到数据版权和隐私问题,数据共享变得越来越具有挑战性。因此,这妨碍了从现有数据向新的下游任务和概念有效转移知识。零样本学习(ZSL)方法旨在…

数据结构 --- 复杂度概念及计算讲解(时间复杂度,空间复杂度)

今天没有sao话,今天认真学习 一、时间复杂度 1、概念讲解 2、计算讲解 二、空间复杂度 1、概念讲解 2、计算讲解 三、常见复杂度对比 四、完结撒❀ 前言: 经常刷题的人都知道,我们在解决一道题时可能有多个解法,那么如何…

1、Java虚拟机学习-类的生命周期-加载阶段-以及怎样查看方法区中的对象和堆中对象的关联以及静态变量存在什么地方

类的生命周期 其中连接又可以分为3个小阶段 一、加载阶段 1、加载阶段第一步是类加载器根据类的全限定名通过不同的渠道以二进制流的方式获取字节码信息。 渠道: 2、类加载器在加载完类之后,Java虚拟机会将字节码中的信息保存在内存的方法区中。 方法区是虚拟…

HarmonyOS NEXT应用开发—投票动效实现案例

介绍 本示例介绍使用绘制组件中的Polygon组件配合使用显式动画以及borderRadius实现投票pk组件。 效果预览图 使用说明 加载完成后会有一个胶囊块被切割成两个等大的图形来作为投票的两个选项,中间由PK两字分隔开点击左边选项,两个图形会随着选择人数…

Http 超文本传输协议基本概念学习摘录

目录 HTTP协议 超文本传输协议 HyperText超文本 HTML超文本标记语言 HTTP协议原理 请求发送 服务器处理 响应发送 连接关闭或保持 HTTP协议版本 HTTP/0.9 HTTP/1.0 HTTP/1.1 HTTP/2 HTTP/3 HTTP请求方法 GET POST PUT DELETE HEAD OPTIONS HTTP请求头字…

MQTT学习从零到实战:二

本次基于MQTT实现的服务器之一:EMQX 协议版本:5.0 文档路径:快速开始 | EMQX 5.0 文档 MQTT协议服务器搭建 本次使用的服务器是EMQX。 下载地址:立即开始 | EMQX 从中我们也可以看出,企业版支持数据持久化&#xf…

springboot+template模板语法+SQL如何从零开始创建并运行一个实例

目录 一、创建springboot项目 二、启动程序测试一下,右上角点击运行: 三、代码编写 1、先在entity里写一个实体类,User: 2、写一个mapper接口,写四个接口,增删改查。(我这里后面就以获取所…

蓝桥杯每日一题——棋盘

问题描述 小蓝拥有 n xn 大小的棋盘,一开始棋盘上全都是白子。小蓝进行了 m 次操作,每次操作会将棋盘上某个范围内的所有棋子的颜色取反(也就是白色棋子变为黑色,黑色棋子变为白色)请输出所有操作做完后棋盘上每个棋子的颜色。输入格式 输入的…

3.14_理解专业术语_3.18

分布式电源 风能、太阳能、生物质能等新能源的应用,有很大部分是分散式的,且容量较小。这些分散布置在电力负荷附近的、容量在数千瓦至数十兆瓦之间的、为环境兼容的、节能的发电装置,如燃气轮机、内燃机、小型光伏发电站、燃料电池、风力发电…

Docker知识--01

虚拟化 # 什么是虚拟化 在计算机中,虚拟化(英语:Virtualization)是一种资源管理技术,是将计算机的各种实体资源,如服务器、网络、内存及存储等,予以抽象、转换后呈现出来,打…

【计算机网络】IP 协议

网络层IP协议 一、认识 IP 地址二、IP 协议报头格式三、网段划分1. 初识子网划分2. 理解子网划分3. 子网掩码4. 特殊的 IP 地址5. IP 地址的数量限制6. 私有 IP 地址和公网 IP 地址7. 理解全球网络(1)理解公网(2)理解私网&#xf…

C语言---指针的两个运算符:点和箭头

目录 点(.)运算符箭头(->)运算符需要注意实际例子 C语言中的指针是一种特殊的变量,它存储了一个内存地址。点(.)和箭头(->)是用于访问结构体和联合体成员的运算符。…

[LeetBook]【学习日记】排序算法——归并排序

主要思想 归并排序是一种分治算法,其排序过程包括分和治分是指将要排序的序列一分为二、二分为四,直到单个序列中只有一个数治是指在分完后,将每两个元素重新组合,四合为二、二合为一,最终完成排序 图片作者&#xf…

SkiaSharp使用SKCanvas.DrawText绘制2D文本时部分字符渲染位置异常。

Skia是一个开源的 2D 图形库,支持多种平台和语言,可以用于绘制各种图形和效果,SkiaSharp是其.Net版本。 在绘制文本时,一般做法是: private void SkContainer_PaintSurface(object? sender, SkiaSharp.Views.Deskto…

Linux系统安装宝塔面板结合内网穿透实现公网登录本地面板——“cpolar内网穿透”

文章目录 一、使用官网一键安装命令安装宝塔二、简单配置宝塔,内网穿透三、使用固定公网地址访问宝塔 宝塔面板作为建站运维工具,适合新手,简单好用。当我们在家里/公司搭建了宝塔,没有公网IP,但是想要在外也可以访问内…

Midjourney 和 Dall-E 的优劣势比较

Midjourney 和 Dall-E 的优劣势比较 Midjourney 和 Dall-E 都是强大的 AI 绘画工具,可以根据文本描述生成图像。 它们都使用深度学习模型来理解文本并将其转换为图像。 但是,它们在功能、可用性和成本方面存在一些差异。 Midjourney 优势: 可以生成更…

攻防世界新手模式例题(Web)

PHP2 首先我们查看页面,查看前端代码 发现均没有什么有效信息,由题目可知,此问题与php相关,于是我们可以看一下他的index.php文件 查看时用?index.phps 补充知识:phps文件就是php的源代码文件,通常用于…

算法之位运算

常见的位运算操作: 首先先熟悉一下常见的位运算操作: 1. 基础位运算 左移<<, 右移>>, 按位与&, 按位或|, 按位异或^, 按位取反~ 注意: 异或其实是一种无进位相加. 2. 给定一个 n, 确定它的二进制表示中第x位是 0 还是 1 n & (1<<x) 或者 (n>…

消费者组大观:5种状态,1场分布式奇迹

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 消费者组大观&#xff1a;5种状态&#xff0c;1场分布式奇迹 前言EmptyDead状态处理 Dead 状态的策略&#xff1a;防范和恢复&#xff1a; PreparingRebalance处理 "PreparingRebalance" 状…