PanNet: A deep network architecture for pan-sharpening(ICCV 2017)


文章目录

  • Abstract
  • Introduction
    • 过去方法存在的问题
    • 我们提出新的解决方法
    • Related work
  • PanNet: A deep network for pan-sharpening(PanNet:用于泛锐化的深度网络)
    • Background and motivation
    • PanNet architecture
      • Spectral preservation
      • Structural preservation
      • Network architecture
  • Experiments
  • Conclusion

論文鏈接
源代码

Abstract

我们针对泛锐化问题提出了一种深度网络架构,称为PanNet。我们结合特定领域的知识来设计我们的PanNet架构,重点关注泛锐化问题的两个目标:光谱和空间保存
为了保持光谱,我们将上采样的多光谱图像加入到网络输出中,直接将光谱信息传播到重建图像中
为了保持空间结构,我们在高通滤波域而不是图像域训练网络参数
我们表明,训练后的网络可以很好地泛化来自不同卫星的图像,而无需再训练。实验表明,在视觉上和标准质量度量方面,比最先进的方法有了显著的改进

Introduction

多光谱图像在农业、矿业和环境监测等领域有着广泛的应用。由于物理限制,卫星通常只能测量一张高分辨率全色(PAN)图像(即灰度)和几张低分辨率多光谱(LRMS)图像.泛锐化的目标是将这些光谱信息和空间信息融合在一起,得到与PAN相同尺寸的高分辨率多光谱(HRMS)图像

过去方法存在的问题

随着近年来深度神经网络在图像处理应用中的进展,研究人员已经开始探索这种泛锐化的途径,例如,一个深度泛锐化模型假设关系HR/LR多光谱图像斑块之间的差值与对应的HR/LR全色图像斑块之间的差值相同,并利用这一假设通过神经网络学习映射,最先进的泛锐化模型,基于卷积神经网络,称为PNN[21],采用了先前提出的图像超分辨率架构
这两种方法都把泛锐化问题看作一个简单的图像回归问题。也就是说,尽管他们能够获得良好的结果,但他们没有利用泛锐化的特定目标——光谱和空间保存——而是将泛锐化视为一个黑盒深度学习问题。然而,对于泛锐化,很明显,保留空间和光谱信息是融合的主要目标,因此深度学习方法应该明确地关注这些方面

我们提出新的解决方法

这激发了我们提出的称为“PanNet”的深度网络,它具有以下特征:

  1. 我们将泛锐化的问题特定知识纳入深度学习框架。具体来说,我们使用上采样的多光谱图像在网络中传播光谱信息,我们将此过程称为“光谱映射”。为了重点研究PAN图像中的主体结构,我们在高通域而不是图像域训练网络
  2. 我们的方法是一个端到端系统,它完全从数据中自动学习映射。与之前的(非深度)方法不同,卷积允许我们捕获MS图像和PAN图像不同波段的内部相关性
    实验表明,PanNet与几种标准方法以及其他深度模型相比,实现了最先进的性能
  3. 由于成像值的范围不一致,大多数传统方法需要针对不同的卫星进行参数调整。然而,在高通域的训练消除了这个因素,允许在一个卫星上的训练很好地推广到新的卫星,这不是在图像域上训练的其他深度方法的特征

Related work

简要介绍下过去的work
近几十年来出现了各种各样的pan锐化方法。其中,最流行的是基于分量替换,包括强度色调饱和度技术(IHS)[5],主成分分析(PCA)[20]和Brovey变换[14]。这些方法简单而快速,但它们往往以引入光谱失真为代价,成功地接近了PAN中包含的HRMS图像的空间分辨率
为了解决这个问题,已经提出了更复杂的技术,例如自适应方法(例如,PRACS[8])和频段相关方法(例如,BDSD[13])。在多分辨率方法[19,22]中,PAN图像和LRMS图像被分解,例如使用小波或拉普拉斯金字塔,然后融合
其他基于模型的方法将PAN、HRMS和LRMS图像之间关系的信念编码为正则化目标函数,然后将融合问题视为图像恢复优化问题[3,4,7,9,12,18]。其中许多算法都取得了很好的效果。我们在这些方法中选择最好的方法进行实验比较

PanNet: A deep network for pan-sharpening(PanNet:用于泛锐化的深度网络)


图2显示了我们提出的泛锐化深度学习方法(称为PanNet)的高级概要。我们首先回顾了泛锐化问题的常见方法,然后在泛锐化的两个目标背景下讨论了我们的方法,即重建包含pan空间内容的高分辨率多光谱图像和低分辨率图像的光谱内容

Background and motivation

我们将期望的HRMS图像集表示为X,并设Xb为第b个波段的图像。对于观测数据,P为PAN图像,M为LRMS图像,Mb为第b波段。大多数最先进的方法将融合视为最小化形式的目标

其中f1 (X,P)项强制结构一致性,f2 (X,M)强制光谱一致性,f3 (X)对X施加期望的图像约束。例如,第一个变分方法P+XS让

ω是一个b维概率权向量

其他方法使用空间差分算子G来关注高频内容
为了光谱的一致性,许多方法定义

↑M b表示上采样M b与X b大小相同,通过与平滑核k卷积进行平滑。f3 (X)通常是总变异惩罚

对于泛锐化问题,一个直接的深度学习方法可以利用一个简单的网络架构来学习输入(P,M)和输出X之间的非线性映射关系

其中,fw代表一个神经网络,W代表其参数

PNN[21]使用了这一思想,它直接将(P,M)输入到一个深度卷积神经网络中来近似x。尽管这种直接的架构给出了很好的结果,但它没有利用已知的图像特征来定义输入或网络结构

PanNet architecture

与PNN一样,我们也使用卷积神经网络(CNN),但我们的具体结构与PNN不同,使用最近提出的ResNet结构作为我们的神经网络
卷积滤波器对于这个问题特别有用,因为它们可以利用多光谱图像不同波段之间的高相关性,这在SIRF算法[7]中被证明是有用的。与其他泛锐化方法一样,我们的深度网络旨在同时保留光谱和空间信息
High-level idea用图3所示的潜在网络结构序列表示

我们考虑的三种泛锐化模型结构的例子:(从左到右)ResNet [15],ResNet+光谱映射,以及最终提出的网络,称为PanNet。ResNet已被证明可以提高CNN在图像处理任务上的性能,但在泛锐化框架中存在缺点。第二种网络实现了光谱保存的目标,而最后一种网络同时捕获了空间和光谱信息。我们对这三种方法都进行了试验,但没有一种应用于泛锐化

Spectral preservation

为了融合频谱信息,我们对M进行了上采样,并在该形式的深层网络中添加了一个跳跃连接
↑M表示上采样LRMS图像,f W表示ResNet,这一项的动机与式(3)中表示的目标相同
正如我们将看到的,它强制X共享m的频谱内容。与变分方法不同,我们不将X与平滑核进行卷积,而是允许深度网络纠正高分辨率的差异。在我们的实验中,我们将此模型称为“光谱映射”,并使用ResNet模型进行fw;对应图3中的中间网络

Structural preservation

我们将PAN图像和上采样LRMS图像的高通内容输入到深度网络W中,修改后的模型为
为了获得由函数G表示的高通信息,我们从原始图像中减去使用平均滤波器找到的低通内容
对于LRMS图像,我们在获得高通含量后将样本提升到PAN的大小
我们观察到,由于↑M是低分辨率的,它可以被看作包含了X的低通光谱含量,这是↑M - X项模型。这使得网络f W可以学习映射,将PAN中包含的高通spa信息融合到x中。我们将↑G(M)输入到网络中,以了解PAN中的空间信息如何映射到x中的不同光谱波段。这个目标对应于图3中的PanNet

在图4中,我们展示了图3中左右网络的初步比较。HRMS和LRMS图像有8个光谱带,我们用灰度表示为平均年龄。图4©显示了(a)的ResNet重建的平均绝对误差(MAE)图像,而(d)显示了提出的PanNet的平均绝对误差(MAE)图像。很明显,光谱映射可以更好地模拟光谱内容(在较暗的光滑区域中很明显),而在高通域上训练网络可以保留边缘和细节,这些结论得到了我们大量定量实验的支持
正如引言中提到的,在高通域训练深度网络的另一个优点是消除PAN和HRMS图像在不同卫星上产生的不一致性

Network architecture

在保留光谱信息的同时恢复空间信息的目标激发了式(6)中提出的目标。此外,之前的变分方法试图通过使用先验图像假设[3,7]来提高性能,对应于式(1)中的f3。在这里,我们利用深度学习直接学习一个函数,该函数捕获了PAN和LRMS输入之间的关系,以及HRMS输出
我们采用带有卷积神经网络的ResNet结构作为方程(6)中的网络模型fw,卷积运算有助于多光谱图像不同波段间的耦合建模。因此,我们的网络结构通过以下操作表示

其中,W表示权重,b表示网络偏差,l = 1,…, L−2/2, Y l表示第l层的输出

因此,网络建模的是不包含在↑ M中的高频边缘信息。近似的惩罚是如式(6)所示的Frobenius范数

虽然我们架构的参数层遵循ResNet,但两者在光谱映射过程(底部方程)和网络的高通输入(顶部方程)方面是不同的。在我们的实验中,我们将这种PanNet框架与直接应用于图像域的ResNet进行了比较,以显示合并这种额外领域知识的明显优势。(我们再次回顾,这两种方法都没有应用于泛锐化问题。)我们还比较了最先进的PNN,它使用了与ResNet不同的深度CNN学习方法

Experiments

我们利用Worldview3卫星的数据进行了几次实验。该卫星的PAN分辨率为0.41m ~ 1.5m。我们使用随机梯度下降(SGD)来最小化方程(6)中的目标函数。在我们的实验中,我们提取了18,000个大小为64 × 64的PAN/LRMS/HRMS补丁对。我们将其分成90/10%用于训练/验证。我们比较了六种广泛使用的泛锐化方法:PRACS[8]、In- dusion[19]、PHLP[18]、BDSD[13]、SIRF[6,7]和PNN[21]。每个参数都使用了几个参数设置,并选择了最佳性能





Conclusion

我们提出了PanNet,这是一个基于泛锐化的两个目标:光谱和空间保存的深度模型
对于光谱保存,我们引入了一种称为“光谱映射”的技术,将上采样的LRMS图像添加到目标函数中,允许网络只关注图像中的细节
为了空间保存,我们在PAN和上采样LRMS图像的高通分量上训练网络参数
我们使用ResNet作为一个非常适合这项任务的深度模型,与目前最先进的方法(包括PNN和vanilla ResNet)相比,Pan-Net实现了更好的图像重建,并更好地推广到新卫星

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/135666.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

windows HOOK学习(一)

了解HOOK 一:HOOK是什么?二:HOOK的分类三:HOOK的原理?四:为什么全局钩子HOOK必须写到DLL中?五:HOOK的类型 一:HOOK是什么? hook就是我们平时听到的钩子&…

vue2 数字软键盘 封装 可拖动 使用简单

1、效果图 2、使用方式 <Keyboard v-if"show" close"show false" :inputDom"$refs.input" /> 封装的数字键盘 Keyboard.vue 组件代码 <template><divclass"keyboard"ref"keyboard":style"{ left: …

算法通关村第八关-白银挑战二叉树的深度和高度问题

大家好我是苏麟 , 今天说说几道二叉树深度和高度相关的题目 . LeetCode给我们造了一堆的题目&#xff0c;研究一下104、110和111三个题&#xff0c;这三个颗看起来挺像的&#xff0c;都是关于深度、高度的。 最大深度问题 描述 : 二叉树的 最大深度 是指从根节点到最远叶子…

SharePoint 是什么

SharePoint 平台使您能够以在线方式和本地方式轻松地管理和协调业务数据。因为其灵活性和易使用性&#xff0c;公司可以快速采用SharePoint来管理其业务数据。 SharePoint Microsoft 365 一种基于云的服务&#xff0c;由 Microsoft 托管&#xff0c;适用于各种规模的企业。 任何…

【Redis】redis-server和redis-cli

上一篇《redis 的下载和安装》 https://blog.csdn.net/m0_67930426/article/details/134341071?spm1001.2014.3001.5501 安装完之后开始使用 打开客户端之前需要先打开服务端 redis-server 直接使用该命令打开就行 然后在打开客户端 redis-cli 使用ping命令查看是否连接服…

云原生 黑马Kubernetes教程(K8S教程)笔记——kubernetes介绍。Master集群控制节点、Node工作负载节点、Pod控制单元

参考文章&#xff1a;kubernetes介绍 文章目录 1. Kubernetes介绍1.1 应用部署方式演变传统部署&#xff1a;互联网早期&#xff0c;会直接将应用程序部署在物理机上虚拟化部署&#xff1a;可以在一台物理机上运行多个虚拟机&#xff0c;每个虚拟机都是独立的一个环境&#xff…

如何提升管理组织能力?

组织能力能力属于管理能力中的一部分&#xff0c;所以也称之为管理组织能力&#xff0c;组织是将人和事物的组合&#xff0c;有效的梳理和导向结果的能力。每个人都有组织能力&#xff0c;只是能力和效率上存在较大的差异。 一人的组织能力从学生时代就能体现出来&#xff0c;…

华为ensp:vrrp双机热备负载均衡

现在接口ip都已经配置完了&#xff0c;直接去配置vrrp r1上192.168.1.100 作为主 192.168.2.100作为副 r2上192.168.1.199 作为副 192.168.2.100作为主 这样就实现了负载均衡&#xff0c;如果两个都正常运行时&#xff0c;r1作为1.1的网关&#xff0c;r2作为2.1网关…

springboot高校全流程考勤系统-计算机毕设 附源码 27637

Springboot高校全流程考勤系统 摘 要 本文针对高校考勤等问题&#xff0c;对其进行研究分析&#xff0c;然后开发设计出高校全流程考勤系统以解决问题。高校全流程考勤系统系统主要功能模块包括&#xff1a;考勤签到、课程信息、考勤情况、申请记录列表等&#xff0c;系统功能设…

OpenWRT浅尝 / 基于RAVPower-WD009便携路由文件宝的旁路网关配置

目录 前言需求分析手头的设备家庭网络拓扑图旁路网关配置OpenWRT固件选择OpenWRT固件刷入旁路网关配置流程 旁路网关的使用前置工作日常存储/关键备份内网穿透24小时待命下载器 前言 近期由于个人需求&#xff0c;需要一台OpenWRT设备实现一些功能。所以本文主要还是为了自己后…

堆的应用-----Top k 问题

目录 前言 Topk问题 1.问题描述 2.解决方法 3.代码实现&#xff08;C/C&#xff09; 前言 在人工智能算法岗位的面试中&#xff0c;TopK是问得最多的几个问题之一&#xff1a; 到底有几种方法&#xff1f; 这些方案里蕴含的优化思路究竟是怎么样的&#xff1f; 为啥T…

ARM Linux 基础学习 / 系统相关,文件系统,文件属性

编辑整理 by Staok。 本文部分内容摘自 “100ask imx6ull” 开发板的配套资料&#xff08;如 百问网的《嵌入式Linux应用开发完全手册》&#xff0c;在 百问网 imx6ull pro 开发板 页面 中的《2.1 100ASK_IMX6ULL_PRO&#xff1a;开发板资料》或《2.2 全系列Linux教程&#xf…

高性能收发原始数据包的框架(Netmap)

一、Netmap 简介 Netmap 是一个高性能收发原始数据包的框架&#xff0c;由 Luigi Rizzo 等人开发完成&#xff0c;其包含了内核模块以及用户态库函数。其目标是&#xff0c;不修改现有操作系统软件以及不需要特殊硬件支持&#xff0c;实现用户态和网卡之间数据包的高性能传递。…

链表的逆置

方法1&#xff1a; 依次将指针反向&#xff0c;最后令头指针指向尾元素。 逆置过程如下&#xff1a; 当q指针为空时&#xff0c;循环结束。 //试写一算法&#xff0c;对单链表实现就地逆置&#xff0c; void Reverse1(List plist)//太复杂,不用掌握 {assert(plist ! NULL);i…

大二第四周总结——用原生js封装一个分页器

用原生js封装一个分页器 起因&#xff1a;这次项目还是用原生的js来写的&#xff0c;我负责的是后台&#xff0c;分页是后台最常见的一个功能了&#xff0c;于是干脆封装一下,废话少说&#xff0c;直接上代码 这里是基本的样式 .pagination {display: flex;width: 600px;hei…

git的分支及标签使用结合全网最详细的情景演示

目录 一git的分支 ⭐⭐ 补充一个拓展知识&#xff1a; 1.1 git分支 1.2 git分支的增删查命令 1.3 情景演示 二.git标签 2.1 分支与标签的关系 2.2 git标签的基本命令 2.3 情景演示 一git的分支 ⭐⭐ 补充一个拓展知识&#xff1a; 软件开发中常见的四个环境&…

jdk21 虚拟线程原理及使用分享

虚拟线程概述 jdk21已于北京时间9月19日21点正式发布, 其中引人注目的就是虚拟线程(Virtual Thread)随之正式发布, 不再是此前jdk19、jdk20中的预览版本。 平台线程&#xff1a;java传统的线程是对系统线程的包装&#xff0c;为了区别于虚拟线程&#xff0c;因此将通过传统方式…

【Git】工作中的留痕:分支及标签的超神搭配

&#x1f973;&#x1f973;Welcome Huihuis Code World ! !&#x1f973;&#x1f973; 接下来看看由辉辉所写的关于Git的相关操作吧 目录 &#x1f973;&#x1f973;Welcome Huihuis Code World ! !&#x1f973;&#x1f973; 一.Git分支是什么 二.Git分支的使用 1.分…

HTTPS协议

目录 HTTPS概念加密是什么常见加密方式对称加密非对称加密数据摘要&&数据指纹数据签名 HTTP工作过程探究方案一&#xff1a;只使用对称加密方案二&#xff1a;只使用非对称加密方案三&#xff1a;双方都使用非对称加密方案四&#xff1a;非对称加密对称加密中间人攻击 …