DAF-Net:一种基于域自适应的双分支特征分解融合网络用于红外和可见光图像融合

题目:DAF-Net: A Dual-Branch Feature Decomposition Fusion Network with Domain  

   Adaptive for Infrared and Visible Image Fusion

   作者:JianXu发表时间:2024年9月

面临的问题:红外图像擅长捕捉热辐射,特别是在低光或复杂环境下,如夜间监视

   和目标探测。可见图像保留了丰富的细节和色彩,提供了清晰的场景表现。融合这  

   些模式弥补了每种模式的局限性,实现了对环境更全面的理解。然而,由于两种模

   式之间的成像原理、分辨率和光谱响应存在显著差异,在融合过程中保留关键特征

   仍然是一个挑战。

现有的方法和存在的不足:

   1.传统方法:像素级特征级融合,依赖于简单的规则,使它们计算效率高,易

   于实现。然而,它们往往不能充分利用红外和可见光图像之间的互补信息,导致融

   合性能有限。因此难以捕获两种模式的所有细节,产生高质量的融合图像。

   2.变换域方法:小波变换拉普拉斯金字塔变换,将图像分解成不同的频率分量,

   在一定程度上保留了细节。尽管它们在捕获多频率细节方面很有效,但在重建过程

   中可能会丢失关键的模态特定特征,从而难以同时保留全局结构和精细纹理

   3.基于深度学习的方法:CNNGAN等技术学习模态之间的非线性关系,通过对

   模态交互进行有效建模,生成了具有较高视觉质量的融合图像。然而,深度学习方

   法通常需要大量的标记数据,可能存在数据稀缺的问题,并且仍然面临平衡全局结

   构和精细纹理的挑战

网络讲解:  

   为了更好地对齐红外和可见光图像的潜在特征空间,本文提出了一种域自适应的双

   分支特征分解融合网络(DAF-Net)。在基编码器中引入多核最大平均差异(MK-MMD),

   以更好地对红外和可见光图像的潜在特征进行匹配。基于Restormer网络的基础编

   码器捕获全局结构信息,并使用多核最大平均差异(MK-MMD)来减少全局特征级别

   的分布差异。基于可逆神经网络(INN)的细节编码器提取细节纹理信息,以保持每个

   模态的独特特征。多核最大平均差异(MK-MMD)仅应用于基本编码器,以确保全局

   特征一致性,避免局部细节的过度对齐和模态特定信息的丢失。这种结构使DAF-Net

   在全局结构和细节保留之间取得平衡。因此DAF-Net显著提高了视觉质量和跨数据

   集的融合性能。

   DAF-Net由一个编码器-解码器分支和一个基于混合核函数的域自适应层组成。网

   络具体结构下图所示,为了优化每个训练阶段的网络参数,引入了一种新的包含   

   域自适应损失的损失函数。

   A.1.编码器-解码器分支:编码器由三部分组成:基于Transformer的共享特征层、使用

   Restormer块的基本编码器和使用INN块构建的详细编码器。基本编码器捕获全局

   结构信息,而细节编码器提取精细纹理。这一部分结构图如下图所示。   

融合解码层结构如下图所示:

A.2.域自适应层:通过计算MK-MMD来减小红外和可见光图像特征的分布差异,实现跨模态传输。其核心思想是通过最小化共享特征空间中的分布差异来对齐特征。图像融合需要捕获复杂的非线性关系。因此需要评估卷积层中的分布差异,因为它们保留了更多的空间信息。在基本编码器的最后三个卷积层中引入域自适应层来校准全局特征,而细节编码器避免使用MK-MMD来保留局部细节。为了捕获全局和局部细节,论文结合了高斯核和拉普拉斯核得到混合内核。论文的目标是将红外特征FI和可见光特征FV映射到RKHS(再生希尔波特空间)中,并使用MK-MMD评估它们的分布距离。

B.两阶段训练:融合红外和可见光图像的一个关键挑战是缺乏有效真值,这使得监督学习方法无效。因此,我们使用两阶段学习方案来训练DAF-Net。

     B.1阶段1:编解码器分支训练

B.2阶段2:融合层训练

数据集与实验结果

定性结果

将其与SOTA进行比较:CDDFuse、RFNet、ReCoNet、DIF、SDNet、TrDal和SwinFusea。 DAF-Net确保一种图像的细节不会被另一种掩盖。将红外图像的热辐射数据与可见光图像的精细细节有效结合。 增强了黑暗区域中物体的可见度,从而更容易将前景目标与背景区分开来。定量结果

在TNO数据集上的结果见表一,在MSRS数据集上的结果见表二。 粗体表示最佳性能,下划线表示次优性能。 正如观察到的那样,DAF-Net在大多数指标上始终优于其他方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/899767.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

国家能源集团携手海康威视研发攻克融合光谱煤质快检技术

10月24日,在国家能源集团准能集团黑岱沟露天煤矿,安装于准能选煤厂785商品煤胶带机中部的煤质快检核心设备,正在对当天装车外运的商品煤煤质进行实时检测。仅两分钟后,涵盖发热量、水分、灰分、硫分等多项指标的数据信息已传输到到…

前端方案:播放的视频加水印或者文字最佳实践

前言: 很多时候,视频的转码工作在后端,我们前端是拿到可以播放的链接进行播放即可。但是总是会出现一些定制化的需求,比如在视频的某个区域贴上水印、标识或者文字。这个时候大部分是由前端来操作的。 直接去修改播放器里的东西…

c语言指针详解2

c语言指针详解2 1.数组名理解 数组名其实是地址,是数组首元素的地址(详解1有提及) 我们可以根据打印来确认 我们发现数组名和数组⾸元素的地址打印出的结果⼀模⼀样,数组名就是数组⾸元素(第⼀个元素)的地址。 但是上述结论有…

DataX简介及使用

目录 一、DataX离线同步工具DataX3.0介绍 1.1、 DataX 3.0概览 1.2、特征 1.3、DataX3.0框架设计 1.4、支持的数据元 1.5、DataX3.0核心架构 1.6、DataX 3.0六大核心优势 1.6.1、可靠的数据质量监控 1.6.2、丰富的数据转换功能 1.6.3、精准的速度控制 1.6.4、强劲的…

轻松清理 PC 微信文件,释放存储空间

软件介绍 微信在我们的日常生活中使用频率极高,但随着时间的推移,它占用的存储空间也越来越大。以一个使用了两年时间的微信为例,它可能会占用多达几十G的存储空间。其中大部分都是与自己无关的各大群聊中的文件、视频、图片等内容&#xff…

java导出带图形的word

先看效果图:方法都是一样的,所以数据只做了前两组 第一步需要准备模版: 新建一个word插入图表,选择想要的图表。 编辑图表:营业额表示数字,季度表示文字。其他的样式编辑可根据自己的需求更改,…

从 Vue 2 到 Vue 3:全面升级指南

​🌈个人主页:前端青山 🔥系列专栏:Vue篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来Vuet篇专栏内容:Vue-从 Vue 2 到 Vue 3:全面升级指南 前言 随着前端技术的不断发展,Vue.j…

基于大型语言模型的智能网页抓取

Google Gemini 是 Google AI 创建的大型语言模型 (LLM) 系列,可提供最先进的 AI 功能。Gemini 模型包括: Gemini Ultra — 最大、最强大的模型,擅长处理编码、逻辑推理和创意协作等复杂任务。可通过 Gemini Advanced(原名 Bard&a…

FreeRTOS任务状态_改进播放控制 任务管理与调度 空闲任务及其钩子函数 两个Delay函数

任务状态_改进播放控制 FreeRTOS源码概述(内存管理,入口函数,数据类型和编程规范)创建任务(声光色影,使用任务参数)删除任务(使用遥控器控制音乐)-CSDN博客https://blog…

网络信息安全工程师证2024年如何报考?了解这几点让你轻松考证!收藏这一篇就够了

网络信息安全工程师是一种专门从事网络安全工作的职业。随着互联网的快速发展和普及,网络安全问题也日益突出,因此网络信息安全工程师的需求也越来越大。 网络信息安全工程师主要负责保护网络系统和数据的安全,防止黑客攻击、病毒侵入、数据泄…

2.3 塑性力学—等效应力

个人专栏—塑性力学 1.1 塑性力学基本概念 塑性力学基本概念 1.2 弹塑性材料的三杆桁架分析 弹塑性材料的三杆桁架分析 1.3 加载路径对桁架的影响 加载路径对桁架的影响 2.1 塑性力学——应力分析基本概念 应力分析基本概念 2.2 塑性力学——主应力、主方向、不变量 主应力、主…

qt生成uuid,转成int。ai回答亲测可以

// 生成一个随机的UUID QUuid uuid QUuid::createUuid(); // 将UUID转换为字符串 QString uuidStr uuid.toString(QUuid::WithoutBraces);// 计算MD5哈希值 QByteArray hash QCryptographicHash::hash(uuidStr.toUtf8(), QCryptographicHash::Md5);// 提取前8个字节并转换为…

设计模式——装饰者模式(8)

一、定义 指在不改变现有对象结构的情况下,动态地给该对象增加一些职责(即增加其额外功能)的模式。我们先来看一个快餐店的例子。快餐店有炒面、炒饭这些快餐,可以额外附加鸡蛋、火腿、培根这些配菜,当然加配菜需要额…

高翔【自动驾驶与机器人中的SLAM技术】学习笔记(十二)拓展图优化库g2o(一)框架

【转载】理解图优化,一步步带你看懂g2o框架 文章来源:理解图优化,一步步带你看懂g2o框架 小白:师兄师兄,最近我在看SLAM的优化算法,有种方法叫“图优化”,以前学习算法的时候还有一个优化方法…

BigFoot BigDebuffs

BigFoot BigDebuffs 大脚插件调整目标DOT图标大小,其目标就是让我们自己的DOT图标大一些,而团队其他人小一点,区别开。 178新版魔兽插件站-大脚插件站-178.com BigDebuffs-v41.zip 2024.10.24下载的版本 解压文件后,得到一堆的…

算法魅力-双指针之滑动窗口的叛逆

#1024程序员节#征文 目录 1.滑动窗口的定义 2.算法实战 2.1 长度最小的子数组 算法思路 2.2 无重复字符的最长子串 算法思路 2.3 最大连续 1 的个数 III 算法思路 哈希表的简要补充 结束语 祝大家1024程序节快乐!!! 1.滑动窗口的定…

操作系统笔记(二)进程,系统调用,I/O设备

什么是进程? 一个正在执行的程序一个包含运行一个程序所需要的所有信息的容器进程的信息保存在一个进程表中( Process Table)。进程表中的每一项对应一个进程,称为进程控制块(Process control block,PCB)。 PCB信息包括: 用户ID(UID)、进程ID(PID)…

【开源免费】基于SpringBoot+Vue.JS在线视频教育平台(JAVA毕业设计)

本文项目编号 T 027 ,文末自助获取源码 \color{red}{T027,文末自助获取源码} T027,文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析 六、核心代码6.1 新…

黑马JavaWeb-day03

文章目录 Ajax前后端分离开发前端工程化环境准备Vue项目Vue项目开发流程 Vue组件库ElementVue路由打包部署 Ajax Ajax:Asynchronous JavaScript And XML,异步的JavaScript和XML 作用: 数据交换:通过Ajax可以给服务器发送请求,并获取服务器相应的数据异步交互:可以在不重新加载…

1971. 寻找图中是否存在路径

有一个具有 n 个顶点的 双向 图,其中每个顶点标记从 0 到 n - 1(包含 0 和 n - 1)。图中的边用一个二维整数数组 edges 表示,其中 edges[i] [ui, vi] 表示顶点 ui 和顶点 vi 之间的双向边。 每个顶点对由 最多一条 边连接&#x…