Paper Reading: PAMS:通过参数化最大尺度量化超分辨率

在这里插入图片描述

PAMS: Quantized Super-Resolution via Parameterized Max Scale
PAMS:通过参数化最大尺度量化超分辨率, ECCV 2020
paper: https://arxiv.org/pdf/2011.04212.pdf
GitHub: https://github.com/colorjam/PAMS

摘要

深度卷积神经网络(DCNNs)在超分辨率(SR)任务中显示出了卓越的性能。然而,其高昂的内存消耗和计算开销显著限制了其在资源有限设备上的实际部署,这主要源于权重和激活值之间的浮点存储和操作。尽管此前的努力主要依赖于定点操作,但使用固定编码长度量化权重和激活值可能会导致显著的性能下降,尤其是在低比特情况下。具体来说,大多数没有批量归一化的最新SR模型具有较大的动态量化范围,这也是性能下降的另一个原因。为了解决这两个问题,我们提出了一种新的量化方案,称为参数化最大尺度(PAMS),该方案通过应用可训练的截断参数,自适应地探索量化范围的上限。最后,我们引入了结构化知识转移(SKT)损失来微调量化网络。大量实验表明,所提出的PAMS方案能够很好地压缩和加速现有的SR模型,例如EDSR和RDN。值得注意的是,8位的PAMS-EDSR在Set5基准测试中的PSNR从32.095dB提升到32.124dB,压缩比达到2.42倍,创下了新的最先进水平。

简介

之前就有压缩深度SR网络的方法,本质上,这种方法是通过量化方案来加速和压缩超分辨率(SR)网络,具体做法是将全精度权重、激活和梯度转换到低比特。

但作者认为之前的方法存在问题

量化范围不够普适,导致性能的下降:1. 使用固定编码长度量化权重和激活值,尤其是在低比特情况下;2. 大多数没有批量归一化的最新SR模型具有较大的动态量化范围。

使用全精度激活,计算复杂性仍然显著偏高。相比之下,直接将权重量化应用于激活值会导致一般SR任务中的准确性显著下降,尤其是在没有使用批量归一化的情况下,这主要是由于高动态量化范围造成的。

归一化特征会限制SR模型的表示能力。批量归一化层会使特征变得平滑,从而导致重建的高分辨率图像产生模糊和伪影。另一方面,但缺少批量归一化会引发严重的动态范围问题。例如简单地将激活的上限设置为其最大值,这在SR任务中导致性能显著下降。这是因为固定的最大尺度可能是作为上限的异常值。尽管Choi等人 [3] 提出了PACT,通过可学习参数来剪裁和量化激活值,但它仅关注正范围,忽略了负范围的梯度信息。此外,新型正则化项被添加来自动学习量化控制参数,从而获得准确的低精度模型,但这会增加额外的计算负担和内存占用,这在实际应用中对运行时不友好。

提出解决方法:

针对上述问题,提出了一种新的量化方案,称为参数化最大尺度(PAMS),用于压缩和加速超分辨率(SR)模型。

不同于以往固定方式量化激活值的方法,PAMS基于梯度使用可训练的截断函数自适应地探索量化范围的上限,从而显著提升了模型的普适性。此外,引入了结构化知识迁移(SKT),将全精度网络中的结构化知识转移到量化网络中,使后者具备更好的视觉感知能力。

首先,我们用PAMS块替换SR模型中的每个基本块。在每个PAMS块中,权重在与输入进行卷积之前被量化,激活值在卷积层输出后使用其可学习的最大尺度进行量化。为了进一步提高量化模型的性能,我们在像素之间对齐全精度模型和对应的低精度量化模型的高层特征。最后,我们采用随机梯度下降(SGD)方法最小化目标函数,该方法利用蒸馏损失对像素级损失进行优化。
在这里插入图片描述

fig1. 我们方法的框架。超分辨率操作被分为三个模块,即低层特征提取器、高层特征提取器和重建。在高层特征提取器的每个激活层中,我们应用了不同α的PAMS。quant表示量化操作,clamp代表量化的截断函数。虚线表示权重被量化到最大值。这里,我们以EDSR作为骨干网络进行说明。

在这里插入图片描述

Fig2. ImageNet 上不同层和 ResNet-18样本的激活最大值,EDSR w./wo. BN在DIV2K 数据集上。 BN 的缺失会导致 SR 模型出现更多动态范围问题。

方法

Parameterized Max Scale (PAMS)

在这里插入图片描述

优化

在这里插入图片描述
在这里插入图片描述

实验

数据集: DIV2K

四个标准基准数据集:Set5, Set14, BSD100, Urban100

评估指标: 在输出质量图像和原始 HR 图像之间的 Y 通道上使用 PSNR 和 SSIM

SR 模型和替代方法: 为了验证我们方法的优越性,选择 EDSR 和 RDN 作为主干,并对其使用 8 位和 4 位量化。由于大多数参数存在于高级特征提取模块中,因此我们不会量化低级特征提取和重建模块中的权重和激活,这确保了性能和模型大小之间的权衡。定性比较使用EDSR .

定量和定性结果

如表1所示,所提出的具有 8 位权重和激活的 PAMS 在不同骨干网上实 现了有竞争力甚至更好的结果。例如,8 位 PAMS-RDN 在比例因子为 ×2 和 ×4 的 Urban100上分别比全精度 RDN 提高了 0.178dB PSNR 和 0.074dB PSNR。与 全精度模型相比,4 位 PAMS-EDSR 在 BSD100上仅遭受 0.24dB PSNR 损失,比 例因子为 ×4。量化 RDN 比 8 位 EDSR 有了显着改进,这表明密集块可能会产生比残差块有更多的冗余。

在这里插入图片描述

Tab1. 在公开基准测试上,将EDSR [23]和RDN [40]量化后部署PAMS,以低比特权重和激活进行对比(PSNR(dB)/SSIM)。PSNR和SSIM值越高,表示方法的性能越好。EDSR基于残差块,而RDN基于密集块。RDN*表示基于我们实现的结果。

图 3 中的 8 位量化提供了更多定性评估。使用 PAMS 的模型比双三次插值生成的图像在视觉上更自然,并且与其全精度对应模型极其相似。考虑到基于残差的模型被广泛使用,结果也表明了该方法的通用性。

在这里插入图片描述
在这里插入图片描述

Fig3. 比例因子为 ×4 的 8 位模型和全精度模型之间的定性比较。 (a)和(b)分 别是Set˾́中"barbara"和"zebra"的结果。©是Urban100中"img055"的结果。请注意,使用 PAMS 的量化模型可生成与其全精度 对应模型极其相似甚至更好的 SR 图像,而前者显着降低了模型大小和计算 复杂性。

为了更好的比较,我们在 EDSR 上重新实现了 Dorefa、 Tensorflow Lite 和 PACT。我们使用与 PAMS-EDSR 相同的初始化方法并对每个残差块中的权重和激活进行量化。对于Dorefa ,为了公平比较,我们不量化梯度。桌子。图2显示了8位和4位EDSR的结 果。与所有基线相比,我们的方法实现了更好的性能。例如,8 位 PAMSEDSR 在 Set14和 Urban100上分别优于 8 位 Dorefa-EDSR 1.288dB PSNR 和 1.796dB PSNR。

在这里插入图片描述

Tab2. 在 ×4 超分辨率比例因子上使用不同位与最先进的量化方法进行比较。 EDSR是骨干网络。

重建结果进一步如图4所示。与其他方法相 比,使用PAMS的输出(SR图像)看起来更好,边缘清晰,细节丰富。综 上所述,具有可训练截断参数的 PAMS 依赖于后向,获得了更好的泛化能 力。

在这里插入图片描述

Fig4. 我们的方法与其他量化方法在 ×4 比例因子上的定性比较。

压缩比

EDSR 和 RDN 的模型大小和压缩比如表 3 所示。特别地,全精度网络使用单精度浮点表示。全精度网络的模型在量化后尺寸大大减小。请注意,我们仅量化高级特征提取器模块中的权重和激活,以便 根据网络的总参数和高级特征提取器中的参数计算压缩比。尽管 PAMS 引 入了可训练参数α,但它仍然产生 50%-90% 的压缩比,因为它直接取决于主干和位数。可以看出,4 位权重和激活比 8 位模型导致更多的性能下降。但较低比特量化的网络可以显着降低存储需求。

在这里插入图片描述

Tab3. BSD100上不同位的 EDSR 和 RDN 的比较。 W 和 A 分别表示权重和激活的位数。

α的收敛性

为了证明我们方法的收敛性,我们在训练期间直接验证 α 的收敛性。结果 如图 5 所示。第一列和第二列分别显示了 Block 8 和 Block 13 层上的 PAMS-EDSR 的 α。第三列和第四列分别显示了PAMS-RDN在RDB 0和 RDB 13中的α(RDB表示Residual Dense Block)。这说明不同层中的α 不仅具有不同的值,而且具有不同的演化方向。例如,PAMS -EDSR Block 8(图5(a))和PAMS-RDN RDB 0(图5(c))作用方向相同, 而PAMS-EDSR Block 13(图5(b))和PAMS-RDN RDB 13(图 5(d))的趋势相反。我们还发现α可以促进EDSR和RDN收敛到稳定值, 这表明了我们方法的有效性。
在这里插入图片描述

Fig5. 8 位 PAMS-EDSR 和 8 位 PAMS-RDN 的 α 收敛曲线。

消融实验

BN 在 SR 模型中的影响。为了研究量化归一化特征的效果,我们使用 PACT 来量化有 BN 和没有 BN 的 EDSR。如表4所示,不 带BN的量化EDSR之间的性能差距比带BN的量化EDSR更大。例如,不带 BN 的 8 位 PACT-EDSR 在 Urban100上的差距为 0.790dB PSNR,大于带 BN 的 PACT-EDSR(0.354 dB PSNR)。这表明,在较低精度的SR模型中,非归一化特征的性能下降更为明显,而且, PAMS-EDSR可以为非归一化权重和激活保存更多重要信息,从而大大缩小性能差距。可学习α的影响。我们将可学习最大尺度 (PAMS) 与量 化激活的固定最大值 (TF Lite) 进行比较。定量和定性结果示于表中。 分别如图2和图4。与 TF Lite-EDSR 相比,PAMS-EDSR 获得了更好 的分数,因为它产生更清晰的图像和更真实的纹理。这表明我们的方 法可以学习到更合适的量化范围,该范围包含更多关于全精度模型的 信息并减少量化误差。

在这里插入图片描述

Tab4. 单精度 EDSR、8 位PACT-EDSR 和 EDSR 之间的性能差距比较。 / 沃。 BN 和 8 位 PAMS wo。 国阵。 (PSNR(dB)/SSIM)。

α初始化的效果。我们使用 EDSR 上的随机初始 化(比例因子为 ×4)来评估 EMA 初始化。对于随机模式,我们在激活量化层中使用0到128之间的随机数来初始化α,这确保了α可以在不 同层中独立地初始化为更大的值。如表5所示EMA初始化在所有 基准数据集上取得了更好的性能。解释一下,EMA 通过 α 实现了更好 的统计分布,这可以进一步帮助提高 SR 性能。

在这里插入图片描述

Tab5. EDSR 上 α 的不同初始化方法与 ×4 比例因子 (PSNR(dB) / SSIM) 的结果。

研究 SKT 损失。为了 研究 SKT 的有效性,我们进一步比较了有和没有 SKT 的量化模型。如表6所示,使用 SKT 优化的 PAMS-EDSR 优于相应的同类产品。特别是,我们的 方法在较低位上获得了更好的性能。例如,与Urban100上不带LSKT 的PAMS-EDSR相比,带L SKT的4位PAMS-EDSR获得0.071dB PSNR,而具有相同优化的8位PAMS-EDSR仅获得0.032dB PSNR。它还表明全精度模型的特征图可以帮助低精度模型更好地捕获图像的空间相关性。

在这里插入图片描述

Tab6. PAMS-EDSR w./ wo.。 8 位和 4 位设置上的 LSKT(PSNR(dB)/SSIM)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/724985.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

HumanPlus——斯坦福ALOHA团队开源的人形机器人:融合影子学习技术、RL、模仿学习

前言 今天只是一个平常的日子,不过看到了两篇文章 一篇是《半年冒出近百家新公司,「具身智能」也有春天》 我看完之后转发到朋友圈,并评论道:让机器人翻一万个后空翻,不如让机器人打好一个螺钉,毕竟在目前…

Flutter第十三弹 路由和导航

目标: 1.Flutter怎么创建路由? 2.怎么实现路由跳转?页面返回? 一、路由 1.1 什么是路由? 路由(Route)在移动开发中通常指页面(Page),在Android中通常指一个Activity。所谓路由管…

什么是Linux挂载

首先先说一下在Linux中一切皆文件(硬件设备也是文件),所有文件都是存放在以根目录为树形目录结构中;下面来说说一下什么是挂载 挂载:指的就是将设备文件中的顶级目录连接到 Linux 根目录下的某一目录(最好是…

5.音视频基础 FLV

目录 简说FLV FLV Header FLV Body Tag Header ​编辑Tag Data Audio Data Video Data Script Data 简说FLV FLV格式可以包含音频、视频和文本数据,并且可以在网络上进行流媒体传输。优点是文件大小较小,压缩效率高,并且可以在较低…

深度解析ISO9001质量管理体系认证的核心优势

ISO9001质量管理体系认证是一项全球通用的标准,旨在帮助企业优化质量管理,提升市场竞争力。本文将详细解析ISO9001认证为企业带来的多重核心优势。 首先,ISO9001认证显著提升了企业的产品和服务质量。通过建立和实施系统化的质量管理流程&…

为数据安全护航,袋鼠云在数据分类分级上的探索实践

在大数据时代,数据具有多源异构的特性,且价值各异,企业需依据数据的重要性、价值指数等予以区分,以利采取不同的数据保护举措,避免数据泄露。故而,数据分类分级管理属于数据安全保护中极为重要的环节之一。…

小白速成AI大模型就看这份资源包

前言 在数字化浪潮席卷全球的今天,人工智能(AI)技术已成为推动社会进步的重要引擎。尤其是AI大模型,以其强大的数据处理能力和广泛的应用前景,吸引了无数人的目光。然而,对于初学者“小白”来说&#xff0…

面向AI时代的软件开发新范式

作为一名软件开发者,有幸站在了AI时代的风口浪尖。在这篇博客中,我将分享我的个人看法,一起走向AI时代软件开发新范式。 首先,我们要明确软件开发活动产生的各种制品,都是人类知识的载体,也是人类文明的高级…

22种常用设计模式示例代码

文章目录 创建型模式结构型模式行为模式 仓库地址https://github.com/Xiamu-ssr/DesignPatternsPractice 参考教程 refactoringguru设计模式-目录 创建型模式 软件包复杂度流行度工厂方法factorymethod❄️⭐️⭐️⭐️抽象工厂abstractfactory❄️❄️⭐️⭐️⭐️生成器bui…

【Linux】Xshell和Xftp简介_安装_VMware虚拟机使用

1、简介 Xshell简介 Xshell是一款强大的安全终端模拟软件支持SSH1、SSH2以及Microsoft Windows平台的TELNET协议。该软件通过互联网实现到远程主机的安全连接,并通过其创新性的设计和特色帮助用户在复杂的网络环境中高效工作。Xshell可以在Windows界面下访问远端不…

阿里云域名解析

阿里云域名控制台:https://dc.console.aliyun.com/next/index#/domain-list/all

【两数之和】

两数之和 一、题目二、暴力解法三、哈希表四、map字典1.基本方法.set()添加键值对.get()通过键获取值.has()判断map是否有这个键 2.map和set的联系和区别共同点共同点MapSet 一、题目 二、暴力解法 三、哈希表 解题思路:将nums的元素依次以键值对的方式存储在map字典…

Hadoop升级失败,File system image contains an old layout version -64

原始版本 Hadoop 3.1.3 升级版本 Hadoop 3.3.3 报错内容如下 datasophon 部署Hadoop版本 查看Hadoop格式化版本 which hadoop-daemon.sh/bigdata/app/hadoop-3.1.3/sbin/hadoop-daemon.sh删除原来的旧版本 rm -rf /bigdata/app/hadoop-3.1.3查看环境变量 env|grep HADOOPHAD…

VMware虚拟机三种网络模式设置 - Bridged(桥接模式)

一、前言 由于linux目前很热门,越来越多的人在学习linux,但是买一台服务放家里来学习,实在是很浪费。那么如何解决这个问题?虚拟机软件是很好的选择,常用的虚拟机软件有vmware workstations和virtual box等。 在使用虚…

五种HTTP数据传输方式

在前端开发过程中,后端主要提供 http 接口来传输数据,而这种数据传输方式主要有五种: url paramqueryform-urlencodedform-datajson 下面就让我们一起来了解一下在Nest.js中如何使用这五种HTTP数据传输方式: 一,创建项目 使用nest new 创建一个nest的项目 nest new 项目名称 …

基于IDEA的Maven(properties属性配置)

&#xff08;property &#xff1a;财产&#xff09;properties&#xff1a;它的复数。 同样也是基于上篇博客进行学习。&#xff08;具体的全部项目代码和结构可以去查看上篇...&#xff09; <properties><!--当前jdk版本 , 这一步可以完全省略--><maven.com…

找不到concrt140.dll无法继续执行代码的几种解决方法

在数字时代&#xff0c;电脑用户经常会遇到各种技术问题&#xff0c;其中DLL文件缺失是最常见的问题之一。今天&#xff0c;我们将重点介绍CONCRT140.DLL文件的重要性&#xff0c;以及当它丢失时对电脑的影响。同时&#xff0c;我们提供了五种解决方法和预防措施&#xff0c;帮…

vue3+ts 使用vue3-ace-editor实现Json编辑器

1、效果图 输入代码&#xff0c;点击格式化就出现以上效果&#xff0c;再点击压缩&#xff0c;是以下效果2、安装 npm i vue3-ace-editor 3、使用 新建aceConfig.js文件 // ace配置&#xff0c;使用动态加载来避免第一次加载开销 import ace from ace-builds// 导入不同的主…

从钉钉到跨境电商领域的技术演变,HHO如何通过NineData实现全球化业务布局

两氢一氧&#xff08;HHO&#xff09;是一家跨境出海电商平台&#xff0c;专注于通过数字化手段连接全球市场和中国优质供应链&#xff0c;致力于打造数字化时代的全球化新品牌。 创始人陈航&#xff0c;曾任钉钉 CEO 并成功打造行业领先的亿级活跃用户产品--钉钉。离开阿里后创…

Elasticsearch安装(windows)

先给出网址 elasticsearch&#xff1a;Download Elasticsearch | Elastic elasticKibana&#xff1a;Download Kibana Free | Get Started Now | Elastic Logstash&#xff1a;Download Logstash Free | Get Started Now | Elastic ik分词&#xff1a;Releases infinilabs/…