交叉注意力一脚踹进医学图像分割!新成果精度、效率表现SOTA

为解决传统方法的局限性,研究者们提出了将交叉注意力机制应用于医学图像分割。

交叉注意力机制能更有效地整合来自不同模态/尺度的特征,让模型同时捕捉全局和局部信息,加速学习并减少干扰。这样不仅可以提高分割的精度,还可以减少训练时间,提高分割的效率。

因此这种策略成为了目前医学图像领域的重要研究方向,为我们实现更高的综合性能提供了新的解决思路。

本次分享8种最新的用交叉注意力做医学图像分割的创新方案,开源代码已附,论文创新点做了简单提炼,供大家参考学习寻找灵感。

论文原文以及开源代码需要的同学看文末

Dual Cross-Attention for Medical Image Segmentation

方法:论文介绍了一种用于医学图像分割的基于U-Net的架构中加强跳跃连接的Dual Cross-Attention (DCA)方法。DCA包括通道交叉注意力(CCA)和空间交叉注意力(SCA)模块,分别在通道和空间维度上捕捉远距离依赖关系。

创新点:

  • 提出了Dual Cross-Attention (DCA)机制,通过顺序捕捉通道和空间维度上的长程依赖关系,加强了U-Net-based架构中的跳跃连接。

  • 在融合策略上,通过比较三种融合策略(求和、串联和顺序融合),发现顺序融合策略的性能最好。顺序融合策略先进行CCA,再进行SCA,能够更好地提升性能。

  • 在补丁嵌入方面,通过比较简单的2D平均池化和卷积补丁嵌入,发现2D平均池化在性能上稍微优于卷积补丁嵌入。此外,卷积补丁嵌入需要额外的参数,而2D平均池化是无参数的,并且与1×1深度卷积投影结合时效果更好。

BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image Segmentation

方法:本文提出了一种新的医学图像分割结构BEFUnet,BEFUnet包含三个主要模块:局部交叉注意力特征融合模块、双层融合模块和双分支编码器,实现了边缘分割的鲁棒性和精确性。BEFUnet模型能够准确地分割边界模糊、不规则和受干扰的器官区域,并具有强大的泛化能力。

创新点:

  • 引入了像素差异卷积的概念,将传统边缘编码器和深度CNN的优势结合起来。这种整合使得边缘分割更加稳健和精确。

  • 提出了一种名为BEFUnet的新型医学图像分割结构,该结构提取了身体和边缘特征,并有效地将它们集成在一起以增强分割性能。

CKD-TransBTS: Clinical Knowledge-Driven Hybrid Transformer With Modality-Correlated Cross-Attention for Brain Tumor Segmentation

方法:论文提出了一种新颖的基于临床知识驱动的脑肿瘤分割模型CKD-TransBTS。模型结构由双分支混合编码器和特征校准解码器组成。设计了一个具有所提出的模态相关交叉注意力块的双分支混合编码器来提取多模态图像特征。双分支混合编码器利用Transformer和CNN的优势,通过Modality-Correlated Cross-Attention模块进行跨模态特征提取。

创新点:

  • 提出了一种根据影像学原理对不同MRI序列进行重新分组的方法,将相关的图像模态组合在一起,使模型能够学习到更好的跨模态特征表示。

  • 提出了一种混合编码器的设计,将Transformer和CNN的优势相结合,通过引入卷积层在Transformer模型中实现归纳偏置和更好的局部特征表示。

  • 设计了一种特征校准解码器,通过Trans&CNN特征校准模块来弥合Transformer和CNN提取的特征之间的差距,从而获得更精确的分割结果。

CSAM: A 2.5D Cross-Slice Attention Module for Anisotropic Volumetric Medical Image Segmentation

方法:论文比较不同模型在医学图像分割中的性能,并提出了一种新的2.5D交叉切片注意机制(CSAM),该机制在前列腺分区分割中表现出优越性能,并且具有更少的参数。

创新点:

  • 引入了CSAM,该机制可以有效地学习和利用3D图像体积中的跨切片信息,从而改善体积分割的性能。

  • CSAM可以方便地插入到现有的2D CNN网络中,实现体积图像分割。通过对前列腺、胎盘和心脏MRI分割的广泛验证研究,证明了CSAM模型在性能上优于相应的2D、3D和之前最先进的2.5D方法。

 

关注下方《学姐带你玩AI》🚀🚀🚀

回复“注意力医学”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/731174.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

IMU用于飞行坐姿校正

为了提升长途飞行的舒适度并预防乘客因不良坐姿导致的身体不适,来自荷兰上海两所大学的研究团队携手开发出一种创新的“舒适穿戴”设备,专为识别飞行中的坐姿设计。 研究团队制作了两种原型设备:一种追求极致舒适,另一种为紧身设…

(vue3)引入组件标红,...has no default export 组件没有默认导出

(vue3)引入组件标红,…has no default export 组件没有默认导出 一、项目背景: 创建的vitevue3ts项目页面有标红,但程序不报错 二、原因 由于之前安装了 Vetur 插件,Vetur 默认使用 eslint-plugin-vue,并且强制 export default …

有没有屏幕悬浮翻译软件?打开窗口即可实时翻译

随着#高考结束该出发看世界了#这一话题的火热,对于不能远行的朋友,网上冲浪是了解世界的好方式。 然而,面对外语网页、资料或视频,英语不流利的小伙伴可能会有些困扰。别急,悬浮翻译软件能帮你将屏幕上的外语文字即时…

为什么伦敦金新手不能用一小时图及以下的时间周期?

刚进入伦敦金市场的投资者,一般不建议使用较低的时间周期,如1小时图或以下。不仅如此,新手或者兼职投资者会被要求使用较高的时间周期交易,如4小时图或日线图,这有什么道理呢?下面我们就来讨论一下。 新手的…

增加attention的seq2seq和transformer有什么区别

1.seq2seq是什么 seq2seq 是一个Encoder–Decoder 结构的网络,它的输入是一个序列,输出也是一个序列。Encoder 中将一个可变长度的信号序列变为固定长度的向量表达,Decoder 将这个固定长度的向量变成可变长度的目标的信号序列。   很多自然…

C# Winform 开源UI库

WinForms,作为微软.NET框架下的一个桌面应用程序开发工具,自1999年首次亮相以来,已经走过了二十多年的发展历程。它以其简单直观的拖拽式界面设计和丰富的控件库,成为了大众喜爱的入门学习编程工具。由于它是比较基础的开发工具&a…

宠物健康顾问系统的设

计 管理员账户功能包括:系统首页,个人中心,顾问管理,用户管理,健康知识管理,管理员管理,论坛管理,公告管理 顾问账户功能包括:系统首页,个人中心&#xff0…

带颜色的3D点云数据发布到ros1中(通过rviz显示)python、C++

ros中发布点云数据xyz以及带颜色的点云数据xyzrgb ros中发布点云数据xyz可以直接用python来做或者C(看个人偏好) ros中发布带颜色的点云数据xyzrgb环境1.新建ROS工作空间2.创建功能包 ros中发布点云数据xyz 可以直接用python来做或者C(看个人偏好) 在这里我们带有颜色的点云数…

Unity【入门】光源、物理、音效系统

核心系统 文章目录 核心系统1、光源系统基础1、光源组件2、光面板相关 2、物理系统之碰撞检测1、刚体 RigidBody2、碰撞器 Collider3、物理材质4、碰撞检测函数5、刚体加力 3、音效系统1、音频文件导入2、音频源和音频监听器脚本3、代码控制音频源4、麦克风输入相关 1、光源系统…

【单片机毕业设计选题24018】-基于STM32和阿里云的农业大棚系统

系统功能: 系统分为手动和自动模式,上电默认为自动模式,自动模式下系统根据采集到的传感器值 自动控制,温度过低后自动开启加热,湿度过高后自动开启通风,光照过低后自动开启补 光,水位过低后自动开启水泵…

C++初学者指南第一步---11.字符串(基础)

C初学者指南第一步—11.字符串(基础) 文章目录 C初学者指南第一步---11.字符串(基础)1. std::string2. char std::string的元素类型3. std::string字符串操作4. 字面量4.1 C风格字符串字面量4.2 "std::string 字面量"s…

openEuler 22.03 (LTS-SP1)服务器用ntpd同步GPS时间服务器的案例

本文记录了openEuler 22.03 (LTS-SP1)的二级时间服务器用chronyd不能自动同步GPS时间服务器,改用ntpd同步GPS时间服务器成功的案例 一、环境简述 1、本环境中有两台GPS一级时间服务器,IP如下: 192.168.188.66 192.168.188.74 2、有一台o…

交易中的特殊存在

在交易的广袤天空中,有一群特殊的存在——他们,是Eagle Trader。 他们以鹰眼般的洞察力,捕捉市场的微妙变化,每一次决策都如同猎食者般精准;他们运用策略,如同雄鹰在风中翱翔,利用风向&#xf…

3dsMax怎样让渲染效果更逼真出色?三套低中高参数设置

渲染是将精心构建的3D模型转化为逼真图像的关键步骤。但要获得令人惊叹的渲染效果,仅仅依赖默认设置是不够的。 实现在追求极致画面效果的同时,兼顾渲染速度和时间还需要进行一些调节设置,如何让渲染效果更加逼真? 一、全局照明与…

AI播客下载:The Gradient-AI前沿见解

The Gradient 是一个致力于让更多人轻松了解人工智能,并促进人工智能社区内讨论的组织。我们目前开展的项目包括 The Gradient 杂志、The Gradient 播客、The Update 通讯以及 Mastodon 实例 Sigmoid Social。 我们是一个由来自不同机构和公司的研究生、研究人员及…

【Ubuntu下 qmqtt6.2编译及使用】

这里写自定义目录标题 一、编译二、使用 背景:最近用QT编写简单的HMI软件,mqtt通信,记录下编译过程,供参考。 一、编译 QT6.5.3 qmqtt6.2(源码地址:https://github.com/qt/qtmqtt/tree/6.5.3) …

E84-晶圆载具交接自动化

E84是一种通讯协议,它的核心作用在于为通讯传感器/设备的开发提供基础架构。 E84协议详细阐述了晶圆载具(如FOUP/POD等)在工厂自动化物料搬运系统(AMHS)与机台装载端口(LP)之间,如何…

c++ 里构造函数的形参与数据成员的同名问题

如题,这时,或许在 java 里,会报语法错误。但在 c vs2019 开了 c20语法规范。这不再是错误。这样的好处是解决了咱们的起变量名的麻烦:重名现在已不是错误,编译器可以解决了。测试如下: 我们看看 c 编译器是…

Android studio中如何下载sdk

打开 file -> settings 这个页面, 在要下载的 SDK 前面勾上, 然后点 apply 在 platforms 中就可以看到下载好的 SDK: 如果sdk下载失败是不是硬盘没有权限,管理员权限从启android studio运行下载sdk

鸿蒙开发:【组件启动规则(FA模型)】

组件启动规则(FA模型) 启动组件是指一切启动或连接应用组件的行为: 启动PageAbility、ServiceAbility,如使用startAbility()等相关接口。连接ServiceAbility、DataAbility,如使用connectAbility()、acquireDataAbili…