当CNN遇上Mamba,高性能与高效率通通拿下!

传统视觉模型在处理大规模或高分辨率图像时存在一定限制,为解决这个问题,研究者们就最近依旧火热的Mamba,提出了Mamba结合CNN的策略。

这种结合可以让Mamba在处理长序列数据时既能够捕捉到序列中的时间依赖关系,又能够利用CNN的局部特征提取能力来加速处理过程,实现计算效率与模型性能的双赢,因此被广泛应用于各大领域。

比如在医学图像分割领域的应用中,Weak-Mamba-UNet等网络架构通过结合两者优势,有效地解决了医学图像中复杂的结构和模式识别问题,准确率高达99.63%。

另外还有HC-Mamba、InsectMamba等,都是最新提出的效果nice的结合成果。为帮助大家快速了解并掌握前沿,我挑选并整理了2024新发表的9篇Mamba+CNN高质量工作,可参考的创新点都提炼好了,开源代码已附。

论文原文+开源代码需要的同学看文末

HC-MAMBA: VISION MAMBA WITH HYBRID CONVOLUTIONAL TECHNIQUES FOR MEDICAL IMAGE SEGMENTATION

方法:论文提出了新型医学图像分割模型HC-Mamba。HC-Mamba基于Mamba结合了多种为医学图像优化的卷积技术,包括扩张卷积和深度可分离卷积。这些技术的结合使得HC-Mamba能够在保持高性能的同时,以更低的计算成本处理大规模医学图像数据。

HC-Mamba模型在医学图像分割任务中表现出色,实验结果显示其具有高准确率(94.84%)、mIoU(80.72%)和DSC(89.26%)的有效性,证明了其在医学图像分割领域的有效性和实用性。

创新点:

  • 提出了一种用于医学图像分割的混合卷积 Mamba 模型(HC Mamba),它结合了多种针对医学图像优化的卷积方法,以提高模型的感受野并减少模型的参数。

  • 引入了 HC-Mamba 模型中的扩张卷积技术,让模型能够在不增加计算成本的情况下捕捉更广泛的上下文信息,通过扩展卷积核的感知域来增强模型对不同尺度图像结构的感知能力。

InsectMamba: Insect Pest Classification with State Space Model

方法:论文介绍了一个名为InsectMamba的新型方法,它结合了SSMs、CNNs、多头自注意力机制以及MLPs。InsectMamba通过在Mix-SSM块中整合这些不同的视觉编码策略,来提取更全面的视觉特征,用于昆虫害虫分类任务。论文还提出了一个选择性模块,用于自适应地聚合不同编码策略中的特征,增强模型识别害虫特征的能力。

创新点:

  • 首次尝试将基于SSM的模型应用于昆虫害虫分类,提出了InsectMamba模型。

  • 提出了一种选择性聚合模块,可以自适应地组合来自不同编码策略的视觉特征,从而使模型能够选择用于分类的相关特征。

  • 实验结果显示,InsectMamba在准确率、精确度、召回率和F1分数等评价指标上均优于现有模型,特别是在农业害虫数据集上达到了91%的准确率。

Weak-Mamba-UNet: Visual Mamba Makes CNN and ViT Work Better for Scribble-based Medical Image Segmentation

方法:论文介绍了一个名为Weak-Mamba-UNet的新型弱监督学习框架,它结合了CNN、ViT以及最新的视觉Mamba架构,用于基于涂鸦(scribble-based)注释的医学图像分割。其在公开可用的MRI心脏分割数据集上表现出色,Dice系数达到0.9171,准确率达到0.9963。

创新点:

  • Weak-Mamba-UNet是一种创新的弱监督学习框架,通过结合CNN、ViT和VMamba的特征学习能力,显著降低了注释所需的成本和资源。

  • 该框架采用多视角交叉监督学习方法,增强了不同网络架构的适应性,使它们能够相互受益。

Large Window-based Mamba UNet for Medical Image Segmentation: Beyond Convolution and Self-attention

方法:论文介绍了一个名为LMa-UNet的新型网络结构,用于2D和3D医学图像分割。LMa-UNet利用了Mamba进行长距离依赖建模,并且结合了大窗口的优势,以实现局部空间建模和全局建模的高效性。论文中还设计了一种新颖的分层和双向Mamba块(LM块),以进一步增强Mamba在全局和邻域空间建模能力。

创新点:

  • 提出了一种用于2D/3D医学图像分割的大内核Mamba UNet模型(LKM-UNet)。

  • 通过给SSM层分配大内核,实现了大感受野的空间建模能力。

  • 设计了一种双向和分层的Mamba模块,增强了SSM的局部和全局特征建模能力。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“曼巴CNN”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/786965.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

工业一体机为数字化工厂带来高效作业指导

随着工业4.0的浪潮席卷全球,数字化工厂的概念深入人心。在这一背景下,工业一体机作为数字化转型的重要一环,凭借其强大的功能和灵活的应用,为工厂实现高效作业指导提供了强大的助力。 一、工业一体机的优势:赋能数字化…

3102. 最小化曼哈顿距离——leetcode

给你一个下标从 0 开始的数组 points ,它表示二维平面上一些点的整数坐标,其中 points[i] [xi, yi] 。 两点之间的距离定义为它们的曼哈顿距离。 请你恰好移除一个点,返回移除后任意两点之间的 最大 距离可能的 最小 值。 示例&#xff1…

计算机的核心工作机制

前言 本篇不介绍代码,主要是理解计算机的一些核心工作机制。想了解更多请跳转-->【【计算机科学速成课】[40集全/精校] - Crash Course Computer Science】 冯诺依曼体系结构 由计算机之父之一冯诺依曼提出的计算机内部构造的基本组成,而现在大多数…

向github远程仓库中push,要求使用token登录

Support for password authentication was removed on August 13, 2021. Please use a personal access token instead. 如上,当向github远程仓库push时,输入github的用户名和密码出现如上错误,要求使用token登录,此时只需要用户…

智慧光伏一站式解决方案

光伏电站智慧化管理平台,将现代先进的数字信息技术、通信技术、互联网技术、云计算技术、大数据挖掘技术与光伏技术高度融合而形成。可以满足光伏企业对电站的高发电量、低初始投资、低运维成本等需求,从开发到运维的25年生命周期内,实现高收…

短视频矩阵搭建,用云微客获客更方便

你的同行都爆单了,你还在问什么是矩阵?让我来告诉你。短视频矩阵是短视频获客的一种全新玩法,是以品牌宣传、产品推广为核心的一个高端布局手段,也是非常省钱的一种方式。 1.0时代,一部手机一个账号;2.0时代…

【多媒体】Java实现MP4和MP3音视频播放器【JavaFX】【更多功能的播放器】【音视频播放】

在Java中播放视频可以使用多种方案,最常见的是通过Swing组件JFrame和JLabel来嵌入JMF(Java Media Framework)或Xuggler。不过,JMF已经不再被推荐使用,而Xuggler是基于DirectX的,不适用于跨平台。而且上述方案都需要使用第三方库。…

Linux系统备份工具TimeShift

Linux系统备份 Linux系统备份工具TimeShift Linux系统备份工具TimeShift 0. 前言1. 安装2. 启动3. 使用法一、图形界面操作(方便)法二、终端命令操作(高端) Linux系统备份工具TimeShift Linux系统备份工具TimeShift 0. 前言 Time…

SpringMVC--获取请求参数

1、通过的ServletAPI获取 只需要在控制器的方法的形参位置设置HTTPRequest request 类型的形参就i可以在控制器方法种使用request对象获取请求参数 RequestMapping("/servletAPI")public String getByServletAPI(HttpServletRequest request){HttpSession session…

【论文速读】| 用于安全漏洞防范的人工智能技术

本次分享论文:Artificial Intelligence Techniques for Security Vulnerability Prevention 基本信息 原文作者:Steve Kommrusch 作者单位:Colorado State University, Department of Computer Science, Fort Collins, CO, 80525 USA 关键…

硬盘分区读不出来的危机与数据拯救指南

在数字时代,硬盘作为我们存储珍贵数据的“保险箱”,其稳定性和可访问性至关重要。然而,当硬盘分区突然读不出来时,这份安全感瞬间化为泡影,让人心急如焚。本文将深入探讨硬盘分区读不出来的原因、提供两种实用的数据恢…

物流工业三防平板实时跟踪货物位置和状态

在当今全球化和高度数字化的商业环境中,物流行业的高效运作对于企业的成功和经济的繁荣至关重要。货物的准确、实时跟踪不仅能提高物流效率,还能增强客户满意度,降低运营成本。物流工业三防平板的出现,为实现货物位置和状态的实时…

短剧新风潮:海外制作的艺术与技术

海外短剧新风潮在艺术与技术两个维度上都展现出了显著的创新与进步。 艺术层面 1、内容创新: (1)多元化与包容性:海外短剧在内容创新上更加注重多元化和包容性,将不同地域、民族的文化元素融入创作中,展现丰…

从资金到未来:技术融资如何重塑IT顾问在AI与网络安全的角色?

一方面是人工智能 (AI) 和机器学习 (ML) 的双引擎,另一方面是网络安全和数据泄露威胁中不断变化的威胁形势,IT 格局正在经历翻天覆地的变化。这场数字革命对 IT 顾问来说既是挑战也是机遇,但要成…

解读‘‘不要卷模型,要卷应用‘‘

前言 2024 年 7 月 4 日,世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海世博中心举行。百度创始人李彦宏在产业发展主论坛上发言,呼吁不要卷模型,要卷应用。 目录 四个要点 积极的观点 不合理性 总结 四个要点 李彦宏的呼吁…

【matlab】周期性信号分析

目录 信号预处理 周期性特征提取方法 频谱分析 傅里叶变换 快速傅里叶变换(FFT) 周期图法 Welch法 自相关分析 时频分析 基于模型的方法 时间序列分解 应用实例 提取信号的周期性特征是一个在信号处理领域广泛应用的技术,特别是在…

C#桌面应用开发:番茄定时器

C#桌面应用开发:番茄定时器 1、环境搭建和工程创建: 步骤一:安装visual studio2022 步骤二:新建工程 2、制作窗体部件 *踩过的坑: (1)找不到工具箱控件,现象如下:…

化妆品3D虚拟三维数字化营销展示更加生动、真实、高效!

随着人们越来越追求高速便捷的生活工作方式,企业在营销市场也偏国际化,借助VR全景制作技术,将企业1:1复刻到云端数字化世界,能带来高沉浸式的逼真、震撼效果。 通过我们独特的漫游点自然场景过渡技术,您将置身于一个真…

AWS无服务器 应用程序开发—第十七章 Application Composer

Application Composer 是 AWS 提供的一种可视化工具,用于设计和构建无服务器应用程序。它通过拖放界面简化了无服务器架构的创建过程,使开发者能够更直观地设计和配置应用程序的各个组件。 主要功能 可视化设计 通过拖放界面,开发者可以轻松地添加和配置 AWS 资源,如 L…

NVIDIA RTX 4090解析:卓越的性能表现带来全新的AI探索高度

前言 NVIDIA GeForce RTX 4090 在性能、效率和 AI 驱动的图形领域实现了质的飞跃。这款 GPU 采用 NVIDIA Ada Lovelace 架构,配备 24 GB 的 GDDR6X 显存。此外,RTX 4090还引入了多项创新技术。例如,它支持 DirectX12Ultimate,能够…