MMUNet:形态学特征增强网络在结肠癌病理图像分割中的应用

MMUNet: Morphological feature enhancement network for colon cancer segmentation in pathological images.

发表在:Biomedical Signal Processing and Control2024--影响因子:3.137

南华大学的论文

论文地址:main.pdf (sciencedirectassets.com)

代码地址:https://github.com/Yuanhaojun513/MMUNet

目录

一、摘要

二、介绍

三、方法框架

3.1改变卷积块MCNB和MCNEAB

3.2侵蚀膨胀模块EDM

 3.3边缘特征模块EFM

3.4损失函数

四、实验和结果

4.1实验

4.2结果

五、结论


一、摘要

结肠图像分析是诊断结肠癌的重要步骤,由于病理切片中细胞形状和边界的多样性,故存在困难。在本文中,我们提出了一种u型结肠癌分割网络,将深度可分卷积和形态学方法相结合,减少了模型参数的数量,有效提高了分割精度。我们利用序列卷积和外部焦点作为模型的底层架构,提高了全局和局部特征的能力。我们设计了跳跃连接,以形态学的方式融合编码器的特征,以增强形态学特征。引入边缘增强模块,利用形态学方法提取轮廓信息增强边缘特征。

二、介绍

结肠癌已被证明可以通过细胞的形状、密度和位置来预测临床结果。传统的结肠癌图像分割方法,有些方法取得了一定的成功。然而,它们需要在面对不规则形状时更具竞争力,只适用于某些类型的图像,并且不是很健壮

通过构建融合低级语义和高级语义的编码器-解码器结构,然而,这项工作没有考虑形态学信息的影响,形态学信息对于不规则的病理切片非常重要。连续的下采样和上采样可以获得丰富的语义信息,但会丢失一些目标信息,影响边缘的纹理特征。此外,卷积的局限性导致该网络只关注局部特征而忽略了远程依赖。全局特征和局部特征相辅相成,有利于增强模型提取特征的能力。因此,许多研究者将transformer引入到视觉任务中,以减轻卷积的局域性,增加远程依赖性,但这带来了巨大的计算压力。研究者发现,外部注意(EA)可以以较低的复杂性获得远程依赖的能力。 

因此本文提出了一种形态学方法UNet(MMUNet)来解决病理图像中结肠癌分割中形状不规则和边缘不准确的问题。改进了ConvNeXt的基本模块,使其适合于结肠癌的分割。

我们使用改进的块构造一个多尺度卷积模块(MCNB)来提取多尺度特征。我们构建了一个多尺度卷积外部注意块(MCNEAB),使用MCNB和EA相结合来提取局部和全局特征。其次,利用侵蚀膨胀模块(EDM)对编码器特征进行形态学融合,增强形态学特征;最后,利用边缘特征模块(Edge Feature Module, EFM)提取编码器基特征和解码器基特征,增强边缘特征 。

主要贡献:

1. 构建侵蚀膨胀模块(EDM)和边缘特征模块(EFM),分别引入形态学方法融合编码器特征和提取轮廓,进一步增强形态学特征和边缘特征

2. 我们提出了多尺度卷积块(MCNB)和多尺度卷积外部注意块(MCNEAB),增强了提取全局和局部特征的能力

3. 我们在三个结肠癌数据集上进行了广泛的实验来验证我们方法的有效性。

三、方法框架

它是一个结合卷积神经网络和形态学方法的u形网络,包括由多尺度卷积块和外部注意(EA)组成的基本架构,边缘特征模块(EFM)和使用侵蚀和膨胀的编码器特征融合模块(EDM)。我们仅在前三层使用多尺度卷积块(MCNB),在后两层使用多尺度卷积外部注意块(MCNEAB),从而降低了复杂性并提高了捕获上下文信息的能力。对于EFM,我们使用编码器的前两层和解码器的最后一层的特征信息提取边缘特征。对于EDM,形态学方法将在编码器特征上进行操作,以增强形态学特征。

3.1改变卷积块MCNB和MCNEAB

基于改进的ConvNeXt块,将7 × 7深度卷积分成4个部分。第一部分执行卷积核大小为3,第二部分执行卷积核大小为5,第三部分执行卷积核大小为7。最后一部分保存原始信息,第二部分接收第一次卷积后的结果,第三部分接收第二部分进行卷积后的结果。MCNB用于提取多尺度特征。然后,将MCNB与EA连接起来,得到远程依赖关系,称为多尺度卷积外部注意块。

 EA论文地址:https://arxiv.org/pdf/2105.02358

     ConvNeXt论文地址:https://arxiv.org/abs/2201.0354

EA使用一个外部矩阵M来建模第i个像素和第j行之间的相似性,且M是可学习的、大小可变的,同时,M还可以随着训练过程的进行建模整个数据集不同样本间的联系 在实际应用中,M分为两个:M_k、M_v,分别对应SA中的K和V:A  = Norm(FM_K^T);Fout = AM_v

3.2侵蚀膨胀模块EDM

侵蚀使图像更平滑,并去除小噪声点。膨胀增强了图像的细节,填补了小洞。我们通过侵蚀和膨胀过程融合编码器特征。该方法的优点是去除了噪声并保留了足够的形态学信息。

利用SoftMax对编码器特征映射X进行二值化。使用MaxPooling(内核大小为7,步长为1,填充为3)实现侵蚀和扩展,因为更大的内核捕获更多的上下文信息并扩展接受域。

对编码器特征X1进行并行腐蚀和扩展,对扩展后的特征映射进行Tanh计算加权。一方面,对腐蚀特征图进行Sigmoid加权,并与膨胀特征图相乘计算相似矩阵; 另一方面,利用Sigmoid算法将腐蚀后的特征图与原始地图融合,计算权值,得到原始地图的相似度矩阵。最后对两个相似矩阵信息进行融合。

 3.3边缘特征模块EFM

错误的边界会产生许多错误的病变区域。标准的卷积神经网络提取附加特征来补充边缘特征,但单个特征会丢失边缘信息。由于底层特征具有足够的边缘信息,我们使用编码器的下两层特征和解码器的最后一层特征。EFM对两个输入分别提取轮廓,去除图像中的噪声和不规则部分,得到更准确的边缘信息。

编码器第一层的特征X1直接通过形态学方法计算边缘,得到X1_edge。X2使用第二层编码器特征,通过上采样DwConv和形态学方法提取边缘信息。X1_edge和X2_edge沿通道方向连接,两部分信息融合得到更精确的边缘。最后对编码器特征X和边缘特征求和:

3.4损失函数

由于病理图像的复杂性和多样性,我们选择Dice系数和交叉熵损失来训练我们的网络,它可以关注分割区域的匹配程度和每个像素点的分类精度来提高分割性能。

其中Y_i代表真实值,P_i代表预测值

四、实验和结果

4.1实验

 数据集:三个结肠癌数据进行了广泛的实验,如下数据内容信息。

评价指标:五个评估指标包括Jaccard, Dice系数,Precision, Sensitivity和Specificity。

其中TP (TN)描绘了正确预测的标记为正(负)的病变像素。相反,FP (FN)描述了被标记为正(负)的错误预测的病变像素。

tip 我们的网络使用PyTorch实现,并在具有48G显存的A6000显卡上进行训练。我们选择AdamW作为优化器,学习率设置为0.0015,批大小设置为4,训练epoch设置为400。 我们的数据增强方法包括随机调整大小、随机裁剪、水平翻转和垂直翻转。由于三个数据集具有不同的图像分辨率大小,我们将图像随机裁剪为224 × 224像素。

4.2结果

三种数据集与其他模型进行比较

 消融实验

对比实验

损失函数以及卷积大小选择

五、结论

结肠病理图像是病理学家诊断癌症的重要标准之一,计算机辅助医学诊断对于结肠癌的初步筛查至关重要。本文提出了一种基于MMUNet的结肠癌病理切片病变区域自动分割方法。我们提出的模型在三个结肠癌数据集上得到了验证。首先,我们利用先进的卷积结构来增强模型的特征提取能力,并利用卷积模块与外部关注进行串行化,以获取远程依赖关系,降低模型复杂度。其次,引入形态学方法,重新设计跳跃连接以校正来自编码器的特征,增加形态学信息的重要性。最后,使用形态学方法直接计算边缘,方便模型学习边界特征。实验结果表明,本文提出的方法优于其他竞争方法。在未来的工作中,我们将探索如何设计和使用更多的形态学方法来获得更好的结果,适用于更多的分割任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/680750.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

大数据基础问题:在Hive中如何实现全增量统一的UDTF、内置函数、聚合、Join等计算引擎常见算子?

仁者见仁智者见智,每个程序员的方法都不一样,老的程序员和新的程序员之间的思维差距很大,新入公司的和老员工的代码差距也很大。 在Apache Hive中,实现全增量统一的用户定义表生成函数(UDTF)、内置函数、聚…

算法:101. 对称二叉树

对称二叉树 给你一个二叉树的根节点 root , 检查它是否轴对称。 示例 1: 输入:root [1,2,2,3,4,4,3] 输出:true示例 2: 输入:root [1,2,2,null,3,null,3] 输出:false提示: 树中节…

什么是OCR转写服务?

OCR(Optical Character Recognition,光学字符识别)转写服务是一种技术,用于将图像或扫描文档中的文字转换为可编辑的文本格式。这项服务通过识别图像中的文字,并将其转换成计算机可读的文本形式,从而使得用…

详解51种企业应用架构模式

导读:企业应用包括哪些?它们又分别有哪些架构模式?世界著名软件开发大师Martin Fowler给你答案 一、什么是企业应用 我的职业生涯专注于企业应用,因此,这里所谈及的模式也都是关于企业应用的。(企业应用还…

动态组件 commponted 怎么使用

优点: 提高代码复用性:通过将通用组件了逻辑封装在动态组件中,可以在多个地方重复使用,减少代码冗余。增强灵活性:动态组件可以根据不同的条件或状态动态切换显示内容,使用应用更加灵活和可定制。实现动态…

【外汇天眼】正确投资理念与心态:持续赚钱的秘诀

许多人心怀迅速致富的梦想,但同时又希望通过踏实的努力实现这一目标。他们既觉得为他人工作赚取收入过于辛苦,又认为自己创业当老板太过劳累。 实际上,赚钱的方式有很多种。有人凭借智慧和知识创造财富,有人依靠勤劳和技术赚取收…

当了程序员,才敢说的大实话(小白如何学好it)

📢只有我真正当了程序员,才敢说出来的大实话。今天的内容,写给想学计算机和计算机专业的朋友们: . 🍀数学课要学好,否则搞算法、AI的时候弄不好得再学一遍 🍀计算机基础知识很重要,只…

在无GPU的windows上运行ChatTTS

如果你在安装的过程中出现了下面的错误,不妨先看看这些安装步骤: cl: 命令行 error D8021 :无效的数值参数“/Wno-register” error: command C:\ windows ERROR: Failed building wheel for pynini 卷完了文本,卷图片,卷完了图…

MySQL——覆盖索引

覆盖索引介绍 理解方式一:索引是高效找到行的一个方法,但是一般数据库也能使用索引找到一个列的数据,因此它不必读取整个行。毕竟索引叶子节点存储了它们索引的数据;当然通过读取索引就可以得到想要的数据,那就不需要…

【python】成功解决“SyntaxError: can’t assign to function call”错误的全面指南

成功解决“SyntaxError: can’t assign to function call”错误的全面指南 在Python编程中,语法错误(SyntaxError)是初学者和经验丰富的开发者都可能遇到的问题。其中,“SyntaxError: can’t assign to function call”这个错误常…

软件三班20240605

文章目录 1.创建工程和模块2.添加 web支持3.创建前端代码4.添加servlet 依赖5. 代码6.案例2 1.创建工程和模块 2.添加 web支持 方法1 方法2 3.创建前端代码 4.添加servlet 依赖 5. 代码 <!DOCTYPE html> <html lang"en"> <head><meta c…

被斯坦福抄作业了?在线体验下:国产大模型确实越来越棒啦!

抄袭&#xff1f; 这里不做评价了&#xff1a; 官方仓库 地址&#xff1a;miniCPM-Llama3-V-2_5 免费在线体验地址 链接&#xff1a;Llama3-V-2_5 模型能力&#xff1a; 模型实际体验 问他什么模型&#xff1a;&#xff08;可能用了它的数据集吧&#xff09; 图片分析…

星创编辑器在投放业务中的落地|得物技术

搭建一个落地页需要涉及到多方合作&#xff0c;需要不断地进行沟通协调。繁杂的流程需要耗费很多的时间&#xff0c;因此我们推动产品重新搭建了一个专门服务于软广投放流程的编辑器——星创&#xff0c;完成广告搭建在投放业务各系统中的闭环。 一、落地页技术架构 名词解释…

数据新生态:Web3如何重新定义个人数据权利

随着数字化时代的不断深入&#xff0c;个人数据已经成为了现代社会中最宝贵的资源之一。然而&#xff0c;传统互联网时代下&#xff0c;个人数据往往被大型科技公司垄断、滥用&#xff0c;个人数据权利常常受到侵犯。而随着Web3技术的崛起&#xff0c;人们开始期待一种全新的数…

这几年一直有人在问:软件行业现在环境好不好?(俩张图告诉你答案)IT还有机会回暖吗?

这几年一直有人在问:软件行业现在环境好不好?(俩张图告诉你答案)IT还有机会回暖吗? 近几年软件行业确实是不太景气,身边很多朋友都面临找工作难的景象.it培训行业也是对老师进行裁员,砍掉大部分学科, 大家可以在下方评论发表自己的看法,认为IT还有机会回暖吗?

Vue进阶之Vue无代码可视化项目(四)

Vue无代码可视化项目 左侧栏第一步LeftPanel.vueLayoutView.vuebase.css第二步LayoutView.vueLeftPanel.vue编排引擎smooth-dnd安装创建文件SmoothDndContainer.tsutils.tsSmoothDndDraggable.tsLeftPanel.vue左侧栏 第一步 创建LeftPanel LeftPanel.vue <script setup…

第15章 面向服务架构设计理论实践

服务是一个由服务提供者提供的&#xff0c;用于满足使用者请求的业务单元。服务的提供者和使用者都是软件代理为了各自的利益而产生的角色。 在面向服务的体系结构(Service-Oriented Architecture,SOA)中&#xff0c;服务的概念有了延伸&#xff0c;泛指系统对外提供的功能集。…

Python文档生成工具库之alabaster使用详解

概要 在编写文档时,美观和易读性是两个重要的方面。Sphinx 是一个广泛使用的文档生成工具,而 Alabaster 是 Sphinx 默认的主题。alabaster 主题以其简洁优雅的设计和易用的配置选项受到广大用户的欢迎。本文将详细介绍 alabaster 库,包括其安装方法、主要特性、基本和高级功…

php质量工具系列之PHPCPD

PHPCPD 用于检测重复代码&#xff0c;直观的说就是复制粘贴再稍微改改 该工具作者已经 停止维护 安装 composer global require --dev sebastian/phpcpd执行 phpcpd --log-pmd phpcpd_result.xml ./app参数介绍 --log-pmd 将结果保存在phpcpd_result.xml 中 ./app 是phpcpd扫…

【传知代码】偏标记学习+图像分类(论文复现)

前言&#xff1a;偏标记学习&#xff0c;顾名思义&#xff0c;就是在训练数据集中&#xff0c;每个样本的标签不是完全确定的&#xff0c;而是由多个可能的标签组成的集合。这种学习范式更加贴近现实世界的场景&#xff0c;因为在很多情况下&#xff0c;我们无法为图像提供精确…