【读论文】PSFusion

【读论文】Rethinking the necessity of image fusion in high-level vision tasks: A practical infrared and visible image fusion network based on progressive semantic injection and scene fidelity

  • 介绍
  • 解决的问题
  • 网络架构
    • 整体架构
    • 稀疏语义感知分支( sparse semantic perception branch)
    • 场景恢复分支(scene restoration branch )
  • 总结
  • 参考

论文: https://www.sciencedirect.com/science/article/pii/S1566253523001860

如有侵权请联系博主

更多红外与可见光图像融合的论文的具体的解读欢迎大家来到红外与可见光图像融合专栏,关于该领域的问题也欢迎大家私信或则公众号联系我。

介绍

好久没看过论文,今天刚好有空,又找了一篇information fusion的论文,咱们一起看看吧。
在这里插入图片描述
这篇论文和我们之前见到的论文不大一样,至于有啥不一样,咱们来看看吧。

解决的问题

  • 基于特征融合的高级视觉任务存在一些缺陷,例如单个特征提取分支会影响性能,两个独立分支会导致融合性能的下降。
  • 现有的方法往往都基于单个任务设计的,不能很好的推广至其他任务。
  • 证明了融合图像在多模态高级视觉任务的优越性

网络架构

整体架构

在这里插入图片描述
整体的架构如上图所示,给我的感觉就像第一次看到DIVFusion 的架构一样。

现在先不看特征提取部分的内容,先看下场景恢复分支(scene restoration branch )稀疏语义感知分支( sparse semantic perception branch) 这俩哈。

可以看到场景恢复分支最后有两个输出结果,但除了最后一部分不同,两个输出结果对应路径的前半部分是相同的。

其中DSRM的作用就是基于密集连接来实现图像恢复的,最终的就是在于这个SIM(语义注入模块) ,这一部分是干什么的, 我们接下来再说。我们先来看一下稀疏语义感知分支。

稀疏语义感知分支( sparse semantic perception branch)

在这里插入图片描述

现在看一下这个语义感知分支,可以看到的是,这个分支有三个结果了,好家伙!
在这里插入图片描述

我们再看回来哈,这个分支为什么要有三个结果呢?

作者在前面提到,以往的与高级视觉任务相结合的方法存在一个问题 都使用特定的模型来约束最终的结果,从而限制了对其他模型的适用性。 由于我对分割领域不是很了解,这里说一下我自己的观点。

该框架输出的三个输出分别对应三种任务,分别是边缘分割,二进制分割和语义分割,这三类输出公用一个S2PM是不是也就是说S2PM提取的语义信息要同时满足这三类任务,也就可以理解为S2PM提取的语义信息不是为了单个任务设计的,而是包含了多个任务通用语义信息这种通用的信息相比于针对单个具体任务提取的语义信息来说,更适合其他任务。

然后看一下这个网络架构,如果看文章参考的论文来说的话,其实二者存在一定的不一致,参考的网络如下图
在这里插入图片描述

可以看到的是,这篇论文中最深层的特征用于预测语义分割掩码,次深层特征用于提取二进制分割掩码,最后浅层特征用于预测边界分割结果。

如果用这个逻辑理解这个网络结构确实有些困难,但归根结底也都是深层特征预测语义分割和二进制分割。

场景恢复分支(scene restoration branch )

在这里插入图片描述

场景恢复分支放在稀疏语义感知分支之后来讲,是因为场景恢复分支要利用稀疏语义分支提取的语义信息,也就是说稀疏语义分支的S2PM的输出也会注入到SIM中

那么为什么要用稀疏语以分支提取的语义信息呢?

也就是说前面作者所提到的,现有的方法融合的图像并没有包含适合分割的语义特征信息,通过这种方式可以将语义信息注入到最终的融合图像中从而提高分割任务的性能。

这个注入的方式就很有意思了,这里用了一个SIM结构,不知道大家刚开始看的时候是什么感觉,反正我是真没看懂,这是干了啥。
在这里插入图片描述
但幸好在知乎上找到了答案,这里稍稍总结下。

我们可以简单想一下,用于分割的特征和用于图像融合的特征肯定会存在差别,毕竟是两个任务所需要的特征信息。这时候我们如果只是简单的对两类特征进行拼接,肯定会影响后续的处理。就像是,我要做一道菜,本来要的是一个切好的胡萝卜,结果你给我掺了点42号混凝土,这饭还怎么做?
图片由Copilot生成

**那就很清楚了,这个SIM就是用于消除因特征之间差异可能对后续处理产生的不良影响。**至于是怎么消除差异的,这里我就不献丑了,大家可以看看原论文。

图像还原部分就比较简单了,一方面使用下面这个路径来确保两类源图像中的信息得以充分提取。在这里插入图片描述
另一方面就是下面这个路径来生成我们需要的融合图像了
在这里插入图片描述

总结

损失函数这里就不说了,原论文介绍的很清晰,整个文章读下来,最惊艳的就是网络结构,很巧妙的将分割所需要的语义信息注入到融合图像中,同时也为图像融合正名,证明在多模态高级视觉任务中,基于多模态特征的高级视觉任务所能达到的高度,我们使用融合图像也可以达到。

其他融合图像论文解读
》红外与可见光图像融合专栏,快来点我呀《

【读论文】AT-GAN

【读论文】SwinFusion

【读论文】AttentionFGAN

【读论文】DIVFusion: Darkness-free infrared and visible image fusion

【读论文】RFN-Nest: An end-to-end residual fusion network for infrared and visible images

【读论文】DDcGAN

【读论文】Self-supervised feature adaption for infrared and visible image fusion

【读论文】FusionGAN: A generative adversarial network for infrared and visible image fusion

【读论文】DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs

【读论文】DenseFuse: A Fusion Approach to Infrared and Visible Images

参考

[1] Rethinking the necessity of image fusion in high-level vision tasks: A practical infrared and visible image fusion network based on progressive semantic injection and scene fidelity

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/264249.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Jmeter 性能测试 —— 评估一个系统TPS与并发数!

问题:性能压测,如何评估一个系统的TPS和并发数? 1、对于新系统 由业务部门或开发人员预估交易量和TPS指标 可以参考公式:并发用户 在线用户数 * 10%。 当一个系统还没有上线时,我们可以预判的是这个系统准备要给多…

PCL配置记录

PCL配置记录 1. Windows10vs2019pcl win10vs2019pcl 1.11.1 1.下载与安装 https://github.com/PointCloudLibrary/pcl/releases ) 双击exe安装 注意: ( ) 解压 “pcl-1.11.0-pdb-msvc2019-win64.zip”,将解压得到的文件夹中的内容添加“…\PCL…

云手机解决Tik Tok运营难题

对于海外营销的企业来说,Tik Tok是不可错过的宣传平台。本文将介绍Tik Tok运营过程中会遇到的几个问题,以及如何通过海外云手机解决。 Tik Tok运营的主要问题 1、高昂的硬件成本和封号风险 很多企业会选择矩阵式营销,但为了不封号每个账号都…

ansible的脚本:playbook剧本

(一)playbook的组成部分 tasks 任务,包含要在主机上执行的操作,使用模块定义这些操作,每一个任务都是一个模块的调用 variables 变量,存储和传递数据(和shell脚本中的变量是一个意思&#xf…

理解Java中锁的应用

一、死锁 1.1 定义: 当线程 A 持有独占锁a,并尝试去获取独占锁 b 的同时,线程 B 持有独占锁 b,并尝试获取独占锁 a 的情况下,就会发生 AB 两个线程由于互相持有对方需要的锁,而发生的阻塞现象&#xff0c…

雄雄的小课堂微信机器人流程图

大家好,我是雄雄,欢迎关注微信公众号:雄雄的小课堂。 最近改造了下微信机器人,新版本还未上线,预计下周一(12.25)左右能上线第一版。 下面是改造之后的流程图 大家可以看看,有疑问可…

【计算机视觉中的多视图几何系列】深入浅出理解针孔相机模型

温故而知新,可以为师矣! 一、参考资料 《计算机视觉中的多视图几何-第五章》-Richard Hartley, Andrew Zisserman. 二、针孔模型相关介绍 1. 重要概念 1.1 投影中心/摄像机中心/光心 投影中心称为摄像机中心,也称为光心。投影中心位于一…

Ubuntu及Docker 安装rabbitmq

安装ubuntu 前 先暴露端口: 5672 用于与mq服务器通信用 15672 管理界面使用的端口 docker命令:docker run -itd --name ubuntu -p 5672:5672 -p 15672:15672 ubuntu 进入docker : docker exec -it ubuntu /bin/bash 步骤: 1. 更新安装源…

算法学习系列(九):离散化

目录 引言一、离散化概念二、离散化模板三、例题四、测试 引言 这个离散化我的理解就是你如果要用到数组的下标进行存数,会有多个询问针对下标进行操作,然后这个下标特别的大,而且存的数也是特别的分散,举个例子就是有三个数&…

VScode 工作区配置 和 用户配置

一、工作区配置 通常不同的项目都有不同的配置,我一般都是使用eslint和prettier一起用,所以经常会有这几个文件: 这里简单介绍一下这几个文件的作用吧。 1.vscode文件夹下 一般有两个文件,extensions.json和settings.json。 e…

07 Vue3中的三元表达式

概述 三元表达式时JavaScript中比较常用的一种原生语法,能够在一行代码中实现if-else的分支逻辑。 在Vue的双大括号中,我们也可以使用三元表达式去实现一些简单的条件渲染。 基本用法 我们创建src/components/Demo07.vue,先尝试一下三元表…

【泛型中K T V E? Object等分别代表什么含 义】

✅ 泛型中K T V E? Object等分别代表什么含义 ✅ 典型解析✅代码示例 ✅ 典型解析 E - Element (在集合中使用,因为集合中存放的是元素) T-Type (Java 类) K- Key (键) V - Value (值) N - Number (数值类型) ? - 表示不确定的iava类型 (无限制通配符类型) …

linux 中 C++的环境搭建以及测试工具的简单介绍

文章目录 makefleCMakegdb调试 与 coredumpValgrind 内存检测gtest 单元测试 makefile 介绍 安装 : sudo apt install make makefile 的规则: 举例说明 包括:目标文件 、 依赖文件 、 生成规则 使用 : make make clean CMake : CMake是一个…

OpenHarmony 4.0 Release发布,同步升级API 10

不久之前,OpenHarmony 正式发布了4.0 版本,开发套件也同步升级到 API 10。相比 3.2 Release 版本,4.0 版本新增 4000 多个 ArkTS API,应用开发能力更加丰富;HDF 新增 200 多个 HDI 接口,硬件适配更加便捷&a…

浅谈在线监测系统与配电能效平台在供水水厂的应用

贾丽丽 安科瑞电气股份有限公司 上海嘉定 201800 【摘要】针对自来水厂工艺老化资金有限的问题,设计水厂在线监测系统,采用安科瑞,对原水滤后水、出厂水进行采样分析,并通过基于组态的上位机系统实现水质数据的实时监测。该系统…

听GPT 讲Rust源代码--src/tools(23)

File: rust/src/tools/clippy/rustc_tools_util/src/lib.rs 在Rust源代码中,rust/src/tools/clippy/rustc_tools_util/src/lib.rs文件的作用是为Clippy提供了一些实用工具和辅助函数。 该文件中定义了VersionInfo结构体,它有三个字段,分别为m…

opencv入门到精通——图像上的算术运算

目录 目标 图像加法 图像融合 按位运算 目标 学习图像的几种算术运算,例如加法,减法,按位运算等。 您将学习以下功能:cv.add,cv.addWeighted等。 图像加法 您可以通过OpenCV函数cv.add()或仅通过numpy操作res …

账号多、用户咨询量大无法及时回复?「互动管理」助力高效经营!

随着互联网行业不断向纵深发展,内容形态与营销场景也更加多元化。越来越多的品牌跑步入场,深耕社媒营销,建立多平台营销矩阵,借助社媒平台的全域态势助力品牌增长。 据云略《2023品牌新媒体矩阵营销洞察报告》显示,目前…

win11下配置visual studio 2022+PCL1.13.1

第一部分:visual studio2022 安装 vs官网网址如下:https://visualstudio.microsoft.com/zh-hans/vs/ 第一步:我们打开官网链接,按如下操作点击下载免费版本的exe文件 第二步:打开下载目录下的安装文件进行安装&#…

选择移动订货系统源码的四大原因

移动订货系统需要选择源码支持的厂家,有以下四个原因,其中第四个是比较重要的,大家点个关注点个赞,我们接着往下看。 1.可自行定制:支持源码的移动订货系统可以根据企业的具体需求进行定制开发,满足企业特定…