SvANet:微小医学目标分割网络,增强早期疾病检测

SvANet:微小医学目标分割网络,增强早期疾病检测

    • 提出背景
      • 前人工作
        • 医学对象分割
        • 微小医学对象分割
        • 注意力机制
    • SvANet 结构图
      • SvANet 解法拆解
        • 解法
        • 逻辑链

 


论文:SvANet: A Scale-variant Attention-based Network for Small Medical Object Segmentation

代码:https://github.com/anthonyweidai/SvANet

提出背景

一种新型神经网络,名为SvANet,该网络专为图像中小型医疗对象的分割而设计,这对于早期疾病检测和准确诊断至关重要。

  1. 问题背景:早期检测和诊断疾病可以显著提高治疗效果。当疾病表现为医学图像中的小感染区域时,这一点尤为重要,因为这些小区域难以准确检测。

  2. 当前挑战:传统的深度学习模型,如卷积神经网络(CNNs),在小对象分割方面常常遇到困难,因为它们通过重复的处理步骤(如卷积和池化)丢失了重要细节。随着模型对图像数据更深层的处理,这个问题会加剧。

  3. SvANet解决方案:提出的SvANet通过以下方式解决这些挑战:

    • 蒙特卡罗注意力:此组件在不同的尺度上生成注意力图,帮助网络了解在图像中应该关注的位置。
    • 尺度变化注意力:这可能允许网络对图像中不同大小的特征给予不同程度的关注,这对检测小对象至关重要。
    • 视觉变压器:结合传统的卷积方法和视觉Transformer,以捕获图像中的局部和更全局的特征。
       
      这种模型以一种类似于Transformer处理序列的方式处理图像,可能更好地捕捉全局上下文。
  4. 性能:SvANet在多种类型的医学图像中分割小医疗对象方面表现出色,通过在几个数据集上的高分表现得到证明,非常接近医生的诊断结果。

    这些数据集包括肾肿瘤、皮肤病变、肝肿瘤、视网膜等图像,其中感兴趣的对象与整个图像大小相比非常小。

SvANet是一种复杂的工具,旨在增强医学成像中微小、可能表明疾病的异常的检测,从而支持更好的早期诊断实践。

前人工作

这段内容主要讨论了医学图像分割中几个关键的研究领域和技术进展,特别是如何处理小尺寸的医疗对象。我来为你简化解释每一部分:

医学对象分割
  • 基础技术: 使用编码器-解码器结构进行医学图像分割。这种结构首先通过编码器提取特征,然后通过解码器生成分割掩码,以区分图像中的不同医学对象。
  • U形结构: 通过使用卷积层连接编码器和解码器的分支,这种结构帮助信息在网络中有效传播,用于更好地分割图像中的对象,如肿瘤细胞等。
微小医学对象分割
  • 挑战: 深度学习中的卷积和池化操作可能会压缩输入数据,损害医学对象的形态特征。
  • 解决方案: 提出多种方法来改善小尺寸对象的分割效果,包括使用空洞卷积、跳跃连接、特征金字塔、多列结构和注意力机制等,这些技术有助于提取和放大图像中的小对象特征。
注意力机制
  • 应用: 在语义分割中广泛使用注意力机制来突出重要特征。
  • 技术创新: 结合通道注意力和空间注意力,提高多维特征的学习能力和分割精度。还引入了反向注意力和自注意力技术,以提取更细致的边界信息和增强输入数据内部的依赖关系。

 

SvANet 结构图

在这里插入图片描述

这张图是一个复杂的神经网络架构图,称为SvANet,用于医学图像的小物体分割。

  1. 输入图像: 最左侧展示了不同医学成像方式的小医疗对象的图片,包括全幅成像(WSI)、眼科成像(Oph)、皮肤科成像(Derm)、结肠镜检查(COL)、磁共振成像(MRI)、计算机断层扫描(CT)、和显微镜成像(MSCP)。

  2. MCAtn(蒙特卡罗注意力)模块: 在左上方的虚线框内,这部分通过使用不同规模的池化输出大小来生成注意力图,从而在单一阶段内学习小物体的空间信息和对象关系。

  3. SvAttn(尺度变化注意力)模块: 在顶部中间的虚线框内,此模块生成基于逐步压缩的特征图的注意力图,从而捕捉小医疗对象的位置和形态本质。

  4. AssemFormer: 在右上角的虚线框中,这部分结合了卷积和视觉变换器,通过组装张量来融合局部空间层次和片间表示,提供图像数据的全面理解。

  5. 卷积与池化操作: 图中展示了多阶段的卷积和池化操作,这些都是深度学习中常用的技术,用于提取特征和降低维度。

  6. ASPP(空洞空间金字塔池化): 在预测步骤之前,这一模块用于捕捉图像中的上下文信息,有助于改善分割的准确性。

  7. 预测输出: 图的右下角展示了不同成像方式的医学图像分割结果。

整体来看,这个架构通过结合传统的卷积神经网络和最新的视觉变换器技术,旨在更有效地检测和分割医学图像中的小型对象,特别是在复杂和信息丰富的医疗图像处理场景中。

 

以视网膜图像分割为例:

  1. 输入图像: 在此例中,输入图像为视网膜成像(Oph),如图中左侧部分所示。视网膜图像通常用于诊断各种眼病,如糖尿病性视网膜病变等。

    视网膜图像的分辨率和细节要求极高,因为需要精确地识别和分割出细微的血管和病变区域。

  2. MCAtn(蒙特卡罗注意力): 这一模块处理视网膜图像,通过不同规模的池化来创建注意力图,这有助于模型在不同大小的结构上聚焦,特别是小而重要的细节,如微小血管或早期病变。

  3. SvAttn(尺度变化注意力): 在处理视网膜图像时,这个模块通过分析不同尺度的特征图来更好地理解图像的深层结构。

    它帮助模型在不同层次上了解视网膜的复杂结构,特别是在图像中较难观察到的部分。

  4. AssemFormer: 这个部分将卷积层和视觉变换器的优势结合起来,通过组装张量,提供对视网膜图像局部和全局特征的深入理解。

    它有效地整合了视网膜图像中的局部细节和整体结构信息,有助于提高分割的准确性和鲁棒性。

  5. 预测输出: 最终,模型预测视网膜图像中的关键特征,如图中右下角的示例。

    这可以包括分割血管、识别病变区域等,这些信息对于后续的诊断和治疗规划至关重要。

通过这种高级别的网络架构,SvANet能够处理复杂的视网膜图像,并执行精确的医学图像分割任务,从而支持眼科医生更好地诊断和治疗眼部疾病。

这样的技术进步对于提早诊断和治疗许多潜在严重的眼部疾病具有重要意义。

SvANet 解法拆解

目的:提高对医学图像中小型医疗对象的分割和识别精度。

问题

  1. 小型医疗对象在图像中的特征不明显,易被忽略。
  2. 多尺度的特征捕捉困难,导致在不同尺寸和深度的特征识别上存在局限性。
  3. 传统的卷积网络在处理极小对象时信息丢失严重。
解法

消融实验:蒙特卡洛注意力 (MCAttn) 和 交叉尺度引导是提高预测精度的关键组件,而AssemFormer和MCBottleneck对提高阳性诊断(有某种疾病存在)的准确性至关重要。

  1. 蒙特卡洛注意力 (MCAttn)
    • 特征:使用随机采样的池化操作生成尺度不依赖的注意力图,允许模型在不同尺度上捕捉关键信息。
    • 原因:传统的全局平均池化在捕获跨尺度相关性方面能力有限。
    • 例子:在处理含有细小血管的视网膜图像时,MCAttn 能够增强模型对这些微小结构的识别能力。

处理特征提取过程中的尺度不变性,强化模型在处理小尺度特征时的表现。

与传统的全局注意力机制相比,MCAttn在特定的池化层中实施,直接增强了小对象特征的识别率,减少了背景噪声的干扰。

在这里插入图片描述

图显示了使用不同注意力机制的MCBottleneck和跨尺度引导(Cross-scale Guidance)生成的输出特征图。

  • (a) 输入图像:原始的医学图像。
  • (b) 地面真实情况(Ground Truth):标注了正确的医学对象位置和形态。
  • ©, (d), (e), (f):不同注意力机制(如SE、CBAM、CoorAttn)下的输出特征图,展示了模型如何处理输入图像并突出不同特征。
  • (g) 单元格代表使用蒙特卡洛注意力机制的输出特征图

通过对比 (b)、(g),这些图表展示了SvANet和其他模型如何在处理细小和微小医学对象方面的不同,特别是在保留细节和精确定位方面的能力。

  1. 跨尺度特征引导
    • 特征:利用早期模型阶段的高分辨率特征来指导后续阶段的特征学习。
    • 原因:小型医疗对象的信息内容随对象尺寸减小而显著减少,需要额外的引导来增强特征的学习。
    • 例子:在处理多层次的皮肤癌图像时,跨尺度特征引导帮助模型在深层学习小癌症区域的同时,不丢失浅层的高分辨率细节。

通过跨不同阶段的特征引导来增强模型对细节的捕捉能力。

利用高分辨率特征来指导模型在后续阶段更好地学习小尺度医疗对象的特征。

  1. 尺度变化注意力 (SvAttn)
    • 特征:处理全局特征表示有局限性,通过跨多个尺度处理全局依赖性。
    • 原因:需要在保持长距离相关性的同时克服单一尺度特征的局限。
    • 例子:在处理MRI图像中的小肿瘤时,SvAttn 允许模型在不同的尺度上有效分辨肿瘤和正常组织。

使模型能在不同尺度上动态调整,从而更精准地识别和分割小尺度医疗对象。

  1. 与视觉变换器结合的卷积 (AssemFormer)

    • 特征:结合了卷积和变换器的优势,同时学习局部和全局特征。
    • 原因:变换器缺乏归纳偏见,需要与卷积结合来增强特征学习。
    • 例子:在处理复杂的脑部图像时,AssemFormer能够同时捕捉到精细的局部结构(如血管和神经纤维)和整体的脑区分布。

     
    结合了卷积和变换器操作,同时学习输入医学图像的局部和全局特征。

    通过融合两种技术的优势,增强模型对医疗对象形态、深度和颜色分布的全局信息捕捉能力。

逻辑链

这些子解法构成一个网络式的逻辑链,其中每个子解法相互支持,共同解决小型医疗对象识别和分割的问题:

  • 蒙特卡洛注意力 提供了跨尺度的特征识别能力。
  • 跨尺度特征引导 利用高分辨率特征强化后续学习。
  • 尺度变化注意力 进一步增强跨尺度特征的全局依赖处理。
  • 与视觉变换器结合的卷积 结合局部与全局特征学习,确保详细和全面的对象分割。

这种方法能够显著提高对医学图像中小型和超小型对象的分割精度,对提早发现和诊断疾病至关重要。

在这里插入图片描述
这张图展示了在不同数据集(ATLAS、KiTS23和SpermHealth)中对各种医学对象(如肿瘤、囊肿和精子)的分割结果。

这些示例反映了不同模型在处理超小对象、小对象和超过10%面积的对象时的效果:

  • (a) 输入图像:原始医学扫描图。
  • (b) 地面真实情况(Ground Truth):用不同颜色标记的医学对象,例如绿色代表肝脏,红色代表肿瘤。
  • © HRNet的预测结果。
  • (d) TransNetR的预测结果。
  • (e) SvANet的预测结果(即本文提出的方法)。

图中显示SvANet在定位和识别医学对象方面通常比其他方法更为准确和详细,特别是在细节和边界的识别上。

视网膜血管分割:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/797902.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PHP7.4安装使用rabbitMQ教程(windows)

(1),安装rabbitMQ客户端erlang语言 一,erlang语言安装 下载地址1—— 下载地址2——https://www.erlang.org/patches/otp-27.0 二,rabbitMQ客户端安装 https://www.rabbitmq.com/docs/install-windows &#xff08…

Python+wxauto=微信自动化?

Pythonwxauto微信自动化? 一、wxauto库简介 1.什么是wxauto库 wxauto是一个基于UIAutomation的开源Python微信自动化库。它旨在帮助用户通过编写Python脚本,轻松实现对微信客户端的自动化操作,从而提升效率并满足个性化需求。这一工具的出现&…

【Linux】重定向 | 为什么说”一切皆文件?“

目录 前言 1.文件描述符分配规则 2.dup2 重定向接口 3.重定向 3.1>输出重定向 3.2>>追加重定向 3.3<输入重定向 3.4 shell 模拟实现< > 3.5 理解> 4. 理解“Linux 下一切皆文件” 前言 问&#xff1a;fd 为什么默认从 3 开始&#xff0c;而不是…

深度学习-6-自编码器和去噪自动编码器和变分自编码器

参考keras基于自编码器的语音信号降噪 参考今天来介绍一下什么是去噪自动编码器(DenoisingAutoencoder) 1 keras实现自编码器图像去噪 自编码器是一种简单的人工神经网络 (ANN),经过训练可以学习输入数据的编码表示,这种无监督机制不需要标签。自编码器由两个神经网络组…

【练习】分治--归并排序

&#x1f3a5; 个人主页&#xff1a;Dikz12&#x1f525;个人专栏&#xff1a;算法(Java)&#x1f4d5;格言&#xff1a;吾愚多不敏&#xff0c;而愿加学欢迎大家&#x1f44d;点赞✍评论⭐收藏 目录 归并排序 代码实现 交易逆序对的总数 题目描述 ​编辑 题解 代码实…

前端Vue组件化实践:打造灵活可维护的地址管理组件

随着前端技术的不断演进&#xff0c;复杂度和开发难度也随之上升。传统的一体化开发模式使得每次小小的修改或功能增加都可能牵一发而动全身&#xff0c;严重影响了开发效率和维护成本。组件化开发作为一种解决方案&#xff0c;通过模块化、独立化的开发方式&#xff0c;实现了…

云计算【第一阶段(29)】远程访问及控制

一、ssh远程管理 1.1、ssh (secureshell)协议 是一种安全通道协议对通信数据进行了加密处理&#xff0c;用于远程管理功能SSH 协议对通信双方的数据传输进行了加密处理&#xff0c;其中包括用户登录时输入的用户口令&#xff0c;建立在应用层和传输层基础上的安全协议。SSH客…

SQL 多变关联使用子查询去重

不去重状态 select a.*,b.recon_amt from free_settlement_first aleft join free_settlement_second b on a.settlement_first_id b.settlement_first_id 有2条数据出现了重复 使用子查询去重 select a.*,b.recon_amt from free_settlement_first aleft join free_settlem…

谈谈软件交互设计

谈谈软件交互设计 交互设计的由来 交互设计(Interaction Design)这一概念,最初是由IDEO创始人之一Bill.Moggridge(莫格里奇)1984年在一次会议上提出。他设计了世界上第一台笔记本电脑Compass,并写作出版了在交互设计领域影响深远的《Designing Interactions》一书,被称…

Azcopy Sync同步Azure文件共享

Azcopy Sync同步Azure文件共享 一、工作原理二、安装 AzCopy在 Windows 上在 Linux 上 三、资源准备1. 创建源和目标 Azure 存储账户2. 创建源和目标文件共享3. 确定路径4. 生成源和目的存储账户的共享访问签名&#xff08;SAS&#xff09;令牌配置权限示例生成的 URL 四、Azco…

AI算法14-套索回归算法Lasso Regression | LR

套索回归算法概述 套索回归算法简介 在统计学和机器学习中&#xff0c;套索回归是一种同时进行特征选择和正则化&#xff08;数学&#xff09;的回归分析方法&#xff0c;旨在增强统计模型的预测准确性和可解释性&#xff0c; 正则化是一种回归的形式&#xff0c;它将系数估…

课程的概述

课程概述 课程类型 课程理论流派 制约课程开发的因素 课程设计的概念及两种模式 课程内容 课程评价 新课程改革理念

前一段时间比较火的刷网课平台源码,带数据库和教程

前一段时间比较火的刷网课平台源码&#xff0c;带数据库和教程。 好在疫情已经结束了&#xff0c;希望今后世上再无网课。 这个代码免费提供给大家学习开发用吧&#xff0c;作为一个php的入门学习案例用用还可以。 使用办法 网站根目录解压 打开nginx.htaccess文件&#x…

社交App iOS审核中的4.3问题:深入分析与解决策略

社交App审核中的4.3问题&#xff1a;深入分析与解决策略 在iOS应用开发和审核过程中&#xff0c;开发者经常会遇到苹果审核4.3问题。这一问题往往涉及应用的设计和内容重复性&#xff0c;导致应用被拒绝上架。为了帮助开发者更好地理解和解决这一问题&#xff0c;本文将对4.3问…

FPGA设计之跨时钟域(CDC)设计篇(1)----亚稳态到底是什么?

1、什么是亚稳态? 在数字电路中,如果数据传输时不满足触发器FF的建立时间要求Tsu和保持时间要求Th,就可能产生亚稳态(Metastability),此时触发器的输出端(Q端)在有效时钟沿之后比较长的一段时间都会处于不确定的状态(在0和1之间振荡),而不是等于数据输入端(D端)的…

集训 Day 3 总结 虚树 + dfs tree + 基环树

虚树 虚树&#xff0c;顾名思义是 只关注原树上的某些 关键点&#xff0c;在保留原树祖孙关系的前提下建出的一棵边数、点数大大减少的树 适用于优化某些在整棵树上进行 d p dp dp、 d f s dfs dfs 的问题 通常是题目中出现多次询问&#xff0c;每次给出树上的一些关键点&a…

taro小程序terser-webpack-plugin插件不生效(vue2版本)

背景 最近在做公司内部的小程序脚手架&#xff0c;为了兼容老项目和旧项目&#xff0c;做了vue2taro,vue3taro两个模板&#xff0c;发现terser-webpack-plugin在vue2和vue3中的使用方式并不相同&#xff0c;同样的配置在vue3webpack5中生效&#xff0c;但是在vue2webpack4中就…

【C++】哈希(散列)表

目录 一、哈希表的基本概念1.哈希的概念2.哈希冲突2.1 哈希函数2.2 哈希冲突的解决办法2.2.1 闭散列2.2.2 开散列 二、哈希表的实现1.闭散列的实现1.1 闭散列的结构1.2 闭散列的插入1.3 闭散列的删除1.4 闭散列的查找 2.开散列的实现2.1 key值不能取模的情况2.2 开散列的结构2.…

编译x-Wrt 全过程

参考自;​​​​​​c编译教程 | All about X-Wrt 需要详细了解的小伙伴还请参看原文 ^-^ 概念&#xff1a; x-wrt&#xff08;基于openwrt深度定制的发行版本&#xff09; 编译系统: ubuntu22.04 注意&#xff1a; 特别注意的是&#xff0c;整个编译过程&#xff0c;都是用 …

线程池笔记

笔记梳理 前言.PHONYC标准库头文件C/C通用或C特有头文件mkdirc_str()snprintfvsnprintfumaskopen函数可变参数列表va_startva_endfunctionalstatic_castpthread_cond_init_threads.emplace_backstd::bindstd::placeholdersThreadPool(const ThreadPool<T> &tp) dele…