HCLR-Net: 混合对比学习正则化与局部随机扰动用于水下图像增强

论文地址:https://doi.org/10.1007/s11263-024-01987-y

源码:https://github.com/zhoujingchun03/HCLR-Net

摘要:

由于水下环境复杂多样,导致光吸收、散射和色彩失真等严重退化现象,因此水下图像增强是一项重大挑战。更重要的是,为这些场景获取配对训练数据是一项具有挑战性的任务,这进一步阻碍了增强模型的泛化性能。为了解决这些问题,提出了一种新方法--混合对比学习正则化(HCLR-Net)。此方法建立在一种独特的混合对比学习正则化策略之上,其中包含一种构建负样本的独特方法。这种方法能使网络形成更稳健的样本分布。值得注意的是,HCLR-Net对正样本和负样本都采用了非配对数据,并利用局部斑块扰动创新性地重建了负样本。这一策略克服了仅依赖配对数据的限制,提高了模型的泛化潜力。HCLR-Net 还集成了自适应混合注意力模块和细节修复分支,分别用于有效的特征提取和纹理细节修复。

贡献:

1)提出了一种用于水下图像增强的创新型混合对比学习模型,以解决水下场景中普遍存在的成像质量不理想的问题。独特贡献在于开发了一种处理负样本的新策略,既保留了负样本的统计特性,又防止网络过度剖析这些样本中的特征信息。这种平衡确保了网络的学习能力不会减弱,从而为在水下图像中突出复杂特征这一复杂挑战提供了稳健的解决方案。
2)设计了一种新颖的双分支网络架构来应对水下退化因素的复杂耦合。该架构包含一个自适应混合注意力(AHA)模块,作为提高模型性能的基础组件。我们创新的定向特征编码策略可捕捉长程依赖性和准确的位置信息,有效辨别不同的退化程度。此外,细节修复分支(DRB)专门用于恢复模糊的纹理细节,为水下图像难题提供了简洁而全面的解决方案。
3)提出的 HCLR-Net 模型是第一个在 UIE 任务中应用混合对比学习的模型(提出了使用非配对数据进行对比学习的创新方法。在每一轮训练中随机引入非配对负样本,避免过度拟合,促进稳健学习)。深入研究了各种损失函数的相互作用,强调了混合对比学习的重要性。

网络框架

特征提取分支和自适应混合注意力(AHA)模块旨在通过精确的位置信息捕捉长距离依赖关系。为了弥补细节的损失,我们设计了一个细节修复分支(DRB),重点关注像素级纹理细节。最后,通过对混合对比学习正则化进行了全面解释。

在特征提取模块中,采用了编码器-解码器结构。之所以采用这种结构,是因为我们需要在清晰域和劣化域中挖掘潜在特征,从而重建图像的上下文信息。编码器从输入图像中提取高级语义信息,解码器通过增强编码器的低分辨率特征图来重建细节。细节修复模块包含一个残差块,旨在增强纹理结构信息。该模块能有效捕捉并还原复杂的纹理细节,这些细节在水下图像中经常会因为苛刻的照明和散射条件而减弱或模糊。为了进一步提高网络的鲁棒性和泛化能力,引入了非配对对比正则化模块。利用非配对数据,该模块有助于学习更稳健的水下图像分布,从而增强模型处理各种水下条件的能力。

特征提取分支

特征提取分支包括三个 2× 下采样模块、六个 FE 模块和三个 2× 上采样模块,每次卷积结束时都会添加 AHA 模块。为了确保所学特征之间的全面互动,我们采用了高斯误差线性单元(GELU)非线性激活函数。GELU 在计算效率和表征能力之间取得了平衡。每次卷积后,我们都会引入一个自适应混合注意力(AHA)模块来完善所获得的特征。AHA 模块是我们网络架构的关键组成部分。它使模型能够捕捉长距离依赖关系和详细的位置信息,从而有效处理水下图像在不同方向和位置的不均匀退化。


特征提取(FE)模块是基本的构建模块。如图 4 所示,FE 模块由 AHA 模块、并行 1 × 1 和 3 × 3 卷积以及残差连接组成。最终,我们将相应的 8 倍上采样操作与 3 × 3 卷积结合起来,生成初步的增强图像。此外,我们还添加了跳转连接,以充分利用可用的特征信息。

自适应混合注意力模块(AHA)


        自适应混合注意力模块主要采用两种不同的定向池操作对特征进行混合编码。这些编码后的特征会被输入后续的自适应注意机制,以捕捉准确的位置信息和长距离空间交互特征。
        AHA 模块利用垂直方向上的 Avgpool 和水平方向上的 Maxpool 来捕捉远程依赖关系和准确的位置信息,从而有效确定不同方向上的特征退化。此外,我们还利用 Mixup 根据深空中的位置信息对特征进行自适应融合,生成特征图。

细节复原分支

连续的降采样和升采样操作可能会导致图像细节的丢失,从而严重影响最终增强水下图像的质量。构建了一个独立于特征增强分支(FEB)的新的简单分支,称为细节修复分支(DRB)。如图 2 所示,DRB 由两个卷积层和五个残差增强块组成。卷积层作为一对编码器-解码器,促进了低维和高维特征之间的转换。如图 6 所示,残差增强模块包含卷积和挤压激励(SE)模块,旨在捕捉降级特征。


SE 模块能够对不同通道的特征之间的关系进行建模,而在标准卷积过程中,这种关系经常被忽略。通过根据每个通道特征的重要性对模型进行加权,我们可以增强富含上下文信息的通道,从而获得更准确、更详细的特征表示。这一过程最终会在样本中形成更优化的特征分布,从而产生更好的结果。

混合对比学习正则化

       对比学习策略通常旨在最小化正样本之间的欧氏距离,使预测图像更接近理想图像,同时最大化负样本与预测图像之间的距离,使它们进一步远离非理想表征。

       设计了一种新颖的混合对比学习正则化(HCLR)方法,将水下原图像的相应清晰图像作为正样本。同时,采用局部斑块扰动(LPP)策略的非配对原始图像可作为负样本,从而有助于积极探索与正负样本相关的特征空间。如图 2 所示,我们的策略是在未配对降解图像的局部区域引入随机斑块扰动。这会破坏相邻像素之间的潜在相关性,从而干扰网络提取准确特征的能力。

损失函数

为了有效提高增强结果与地面实况之间的相似度,我们采用了 l1 损失 Ll1、感知损失 L per 和混合对比损失 L HCLR 的线性组合。总优化损失 Ltotal 表示为

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/524971.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Day108:代码审计-PHP模型开发篇MVC层动态调试未授权脆弱鉴权未引用错误逻辑

目录 案例1-Xhcms-动态调试-脆弱的鉴权逻辑 案例2-Cwcms-动态调试-未引用鉴权逻辑 案例3-Bosscms-动态调试-不严谨的鉴权逻辑 知识点: 1、PHP审计-动态调试-未授权安全 2、PHP审计-文件对比-未授权安全 3、PHP审计-未授权访问-三种形态 动态调试优点: 环境配置&…

Embedding:跨越离散与连续边界——离散数据的连续向量表示及其在深度学习与自然语言处理中的关键角色

Embedding嵌入技术是一种在深度学习、自然语言处理(NLP)、计算机视觉等领域广泛应用的技术,它主要用于将高维、复杂且离散的原始数据(如文本中的词汇、图像中的像素等)映射到一个低维、连续且稠密的向量空间中。这些低…

1111111111111111111111111

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起学习和分享Linux、C、C、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关领域的知识和…

活动图高阶讲解-15

1 00:00:00,000 --> 00:00:07,200 目前来说,这个菱形到底是分还是合 2 00:00:07,200 --> 00:00:13,600 这个是靠入边出边的数量来判断的 3 00:00:13,600 --> 00:00:22,560 有的方法学,它可能会这样搞一些花样 4 00:00:22,560 --> 00:00:2…

Adobe InDesign 2024 v19.3 (macOS, Windows) - 版面设计和桌面出版软件

Adobe InDesign 2024 v19.3 (macOS, Windows) - 版面设计和桌面出版软件 Acrobat、After Effects、Animate、Audition、Bridge、Character Animator、Dimension、Dreamweaver、Illustrator、InCopy、InDesign、Lightroom Classic、Media Encoder、Photoshop、Premiere Pro、Ad…

室友打团太吵?一条命令让它卡死

「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:更多干货,请关注专栏《网络安全自学教程》 SYN Flood 1、hping3实现SYN Flood1.1、主机探测1.2、扫描端…

鸿蒙(HarmonyOS)APP开发实战课程(入门到精通)

2024培训课程 2024技术交流群 CSDN在线课程地址: https://edu.csdn.net/course/detail/39448 推荐阅读 鸿蒙Harmony OS核心架构 鸿蒙内核源码分析(系统调用篇) 鸿蒙(HarmonyOS)APP开发培训课程 鸿蒙(HarmonyOS)APP开发实战课程 鸿蒙系统(HarmonyOS&#xff0…

KNN课堂(分类课堂(可用kd树/特征归一化提高精度)))

实验代码: # 导入所需要的库 import numpy as np import pandas as pd from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier # 导入数据集 df pd.…

【Java集合进阶】LinkedList和迭代器的源码分析泛型类、泛型方法、泛型接口

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收藏 …

ElasticSearch索引库操作

文章目录 1、简介2、mapping映射属性3、索引库的CRUD3.1、创建索引库和映射3.2、查询索引库3.3、修改索引库3.4、删除索引库3.5、总结 ​🍃作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,专注于Java领域学习,…

信息系统项目管理师——第1章信息化发展

从23年下半年的考情来看,本章节的分值明显下降,十四五相关的知识1分未考。可能是因为首次机考降低了难度, 也有可能是考情发生了变化。这章节按照综合题的备考方式来备考即可,考试大纲案例和论文部分不包括本章节。 本章知识点多且…

模块十 面向对象

模块十 重点 知道继承的好处会使用继承知道继承之后成员变量以及成员方法的访问特点会方法重写以及知道方法重写的使用场景会使用 this 关键字调用当前对象中的成员会使用super关键字调用父类中的成员会定义抽象类方法以及抽象类会重写抽象方法 第一章 继承 1.1 什么是继承 …

simulink 的stm32 ADC模块输出在抽筋,不知为何

% outtypecast(uint16(1000),uint8) % 10003E8,E8232,out232 3 function [y,len] myfcn(u1) headuint8([255 85]);%帧头 out1typecast(uint16(u1),uint8); % out2typecast(uint16(u2),uint8); y[head,out1]; lenuint16(length(y)); 2023b版本,stm32硬件支持…

vscode为什么设置不了中文?

VSCode中文插件安装 在VSCode中设置中文的首要步骤是安装“Chinese (Simplified) Language Pack for Visual Studio Code”扩展插件。这一过程十分简单,只需打开VSCode,进入扩展市场,搜索“ Chinese (Simplified) Language Pack ”然后点击…

MySQL的基本查询

📟作者主页:慢热的陕西人 🌴专栏链接:MySQL 📣欢迎各位大佬👍点赞🔥关注🚓收藏,🍉留言 本博客主要内容介绍了mysql的基本查询部分的知识,包括Crea…

42.基于SpringBoot + Vue实现的前后端分离-服装销售平台管理系统(项目 + 论文)

项目介绍 随着计算机技术的发展以及计算机网络的逐渐普及,互联网成为人们查找信息的重要场所,二十一世纪是信息的时代,所以信息的交换和信息流通显得特别重要。因此,开发合适的服装销售平台成为企业必然要走的一步棋。开发合适的服…

腾讯云流量怎么计算的?轻量服务器流量价格表

腾讯云轻量应用服务器套餐带流量包,就是有月流量限制的意思,超出轻量套餐的流量需要另外支付流量费,轻量服务器地域不同超额流量费用也不同,北京上海广州等中国内地地域流量价格是0.8元每GB,中国香港地域流量价格是1元…

数字人解决方案——Champ单个视频单张图像生成可控且一致的人体视频生成

概述 Champ是阿里巴巴集团、南京大学和复旦大学的研究团队共同提出了一种创新的人体动画生成技术,Champ能够在仅有一段原始视频和一张静态图片的情况下,激活图片中的人物,使其按照视频中的动作进行动态表现,极大地促进了虚拟主播…

微信小程序实现滚动标签

使用scroll-view标签可实现组件滚动标签 1、list中 list.wxml代码如下: <!--pages/list/list.wxml--> <navigation-bartitle"小程序" back"{{false}}"color"black" background"#FFF"></navigation-bar><scroll-…

文章解读与仿真程序复现思路——电力系统自动化EI\CSCD\北大核心《考虑灵活爬坡产品的虚拟电厂两阶段分布鲁棒优化运营策略》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…