U-Net: Convolutional Networks for Biomedical Image Segmentation--论文笔记

U-Net: Convolutional Networks for Biomedical Image Segmentation

资料

1.代码地址

2.论文地址

https://arxiv.org/pdf/1505.04597

3.数据集地址

论文摘要的翻译

人们普遍认为,深度网络的成功训练需要数千个带注释的训练样本。在本文中,我们提出了一种网络和训练策略,该策略依赖于数据增强的强大使用,以更有效地使用可用的注释样本。该体系结构包括捕获上下文的收缩路径和支持精确定位的对称扩展路径。我们表明,这样的网络可以从很少的图像中进行端到端训练,并且在ISBI挑战中优于先前的最佳方法(滑动窗口卷积网络),以分割电子显微镜堆栈中的神经元结构。使用在透射光显微镜图像(相位对比和DIC)上训练的相同网络,我们在这些类别中以很大的优势赢得了2015年ISBI细胞跟踪挑战赛。此外,网络速度很快。在最新的GPU上,512x512图像的分割需要不到一秒的时间。

1背景

卷积网络的典型用途是分类任务,其中图像的输出是单个类标签。然而,在许多视觉任务中,特别是在生物医学图像处理中,期望的输出应该包括定位,即,应该为每个像素分配一个类标签。此外,成千上万的训练图像在生物医学任务中通常是遥不可及的。
因此,Ciresan等人。==在滑动窗口设置中训练网络,通过在像素输入周围提供局部区域(patch)来预测每个像素的类标签。==首先,这个网络可以本地化。其次,以patch为单位的训练数据量远大于训练图像的数量。
较大的patch需要更多的最大池化层,这会降低定位精度,而较小的patch只允许网络看到很少的上下文。
在本文中,在本文中,我们构建了一个更优雅的架构,即所谓的“全卷积网络”。我们修改和扩展了这种架构,使其适用于很少的训练图像,并产生更精确的分割;具体架构看图1
在这里插入图片描述
中的主要思想是通过连续的层来补充通常的收缩网络,其中池化算子被上采样算子取代。因此,这些层增加了输出的分辨率。为了定位,从收缩路径的高分辨率特征与上采样输出相结合。然后,连续的卷积层可以根据这些信息学习组装更精确的输出。
我们架构中的一个重要修改是,在上采样部分,我们也有大量的特征通道,这允许网络将上下文信息传播到更高分辨率的层。因此,扩张路径或多或少与收缩路径对称,并产生u形建筑。网络没有任何完全连接的层,只使用每个卷积的有效部分,即分割映射只包含像素,在输入图像中可以获得完整的上下文。

该策略允许通过重叠贴图策略对任意大的图像进行无缝分割(见图2)。为了预测图像边界区域的像素,通过镜像输入图像来推断缺失的上下文。这种平铺策略对于将网络应用于大型图像非常重要,因为否则分辨率将受到GPU内存的限制。
在这里插入图片描述
对于我们的任务,可用的训练数据很少,我们通过对可用的训练图像应用弹性变形来使用过度的数据增强。这允许网络学习这种变形的不变性,而不需要在注释的图像语料库中看到这些转换。

在许多细胞分割任务中的另一个挑战是同一类触摸物体的分离;参见图3。为此,我们建议使用加权损失,其中触摸单元之间的分离背景标签在损失函数中获得较大的权重。
在这里插入图片描述

2论文的创新点

  • 我们构建了一个全卷积神经网络架构我们修改和扩展了这种架构,使其适用于很少的训练图像,并产生更精确的分割;

3 论文方法的概述

3.1 网络架构

网络体系结构如图1所示。

  • 收缩路径(左侧)
    两个3x3卷积(不填充)的重复应用组成,每个卷积后面都有一个整流线性单元(ReLU)和一个2x2 max池化操作,步幅为2,用于下采样。每一次下采样我们将特征通道的数量加倍。下采样结构图如下。
    在这里插入图片描述
    扩张路径(右侧)
    特征映射的上采样,然后进行2x2卷积(“上卷积”),将特征通道的数量减半,与收缩路径中相应裁剪的特征映射进行连接,以及两个3x3卷积,每个卷积后面都有一个ReLU。扩张路径结构图如下。
    在这里插入图片描述
    在最后一层,使用1x1卷积将每个64个组件的特征向量映射到所需的类数量。这个网络总共有23个卷积层。

3.2 训练

输入图像及其相应的分割图用于使用随机梯度下降实现来训练网络,由于没有填充卷积,输出图像比输入图像小一个恒定的边界宽度。为了最小化开销并最大限度地利用GPU内存,我们倾向于使用较大的批处理大小,从而将批处理减少到单个图像。因此,我们使用高动量(momentum=0.99),使得大量之前看到的训练样本决定当前优化步骤中的更新。
energy function 是通过结合交叉熵损失函数在最终特征映射上的逐像素softmax来计算的。softmax函数: p k ( x ) = exp ⁡ ( a k ( x ) ) / ( ∑ k ′ = 1 K exp ⁡ ( a k ′ ( x ) ) ) p_{k}(\mathbf{x})=\exp(a_{k}(\mathbf{x}))/\left(\sum_{k^{\prime}=1}^{K}\exp(a_{k^{\prime}}(\mathbf{x}))\right) pk(x)=exp(ak(x))/(k=1Kexp(ak(x))) 其中 a k ( x ) a_{k}(\mathbf{x}) ak(x) 表示 x ∈ Ω \mathbf{x}\in\Omega xΩ 在 通道 k k k中的激活 Ω ⊂ Z 2 . K \Omega\subset\mathbb{Z}^2.K ΩZ2.K表示类的数量and p k ( x ) p_k(\mathbf{x}) pk(x) 是最大似然函数。
当最大激活时的 k k k p k ( x ) ≈ 1 p_{k}(\mathbf{x})\approx1 pk(x)1
其他k时 a k ( x ) a_k(\mathbf{x}) ak(x) and p k ( x ) ≈ 0 p_k(\mathbf{x})\approx0 pk(x)0
我们预先计算每个地面真值分割的权重图,以补偿训练数据集中某类像素的不同频率,并迫使网络学习我们在触摸单元之间引入的小分离边界(见图3c和d)

在这里插入图片描述
使用形态学操作计算分离边界。然后,权重映射计算为 w ( x ) = w c ( x ) + w 0 ⋅ exp ⁡ ( − ( d 1 ( x ) + d 2 ( x ) ) 2 2 σ 2 ) w(\mathbf{x})=w_c(\mathbf{x})+w_0\cdot\exp\left(-\frac{(d_1(\mathbf{x})+d_2(\mathbf{x}))^2}{2\sigma^2}\right) w(x)=wc(x)+w0exp(2σ2(d1(x)+d2(x))2)其中 w c : Ω → R w_c:\Omega\to\mathbb{R} wc:ΩR 为平衡类频率的权值图, d 1 : Ω → R d_1:\Omega\to\mathbb{R} d1:ΩR为到最近单元格边界的距离, d 2 : Ω → R d_2:\Omega\to\mathbb{R} d2:ΩR 为到第二最近单元格边界的距离。在我们的实验中,我们设置 w 0 = 10 w_0=10 w0=10 σ ≈ 5 \sigma\approx5 σ5 .像素。

3.3 数据增强

当只有很少的训练样本可用时,数据增强对于教会网络所需的不变性和鲁棒性是必不可少的。
移位旋转不变性以及对变形灰度值变化的鲁棒性。特别是训练样本的随机弹性变形似乎是训练具有很少注释图像的分割网络的关键概念。我们在粗糙的3 × 3网格上使用随机位移向量生成平滑变形。位移从具有10个像素标准差的高斯分布中采样。然后使用双三次插值计算逐像素位移。收缩路径末端的退出层执行进一步的隐式数据扩充。

4 论文实验

我们演示了u-net在三种不同的分割任务中的应用。第一个任务是在电子显微镜记录中对神经元结构进行分割。图2显示了数据集和我们获得的分割的示例。我们提供完整的结果作为补充材料
该数据集由EM分割挑战提供,该挑战始于ISBI 2012,并且仍然对新的贡献开放。训练数据是一组30张(512x512像素)的果蝇一龄幼虫腹侧神经索(VNC)连续切片透射电镜图像。每张图像都带有相应的完整注释的细胞(白色)和膜(黑色)的地面真值分割图。测试集是公开可用的,但其分割映射是保密的。通过将预测的膜概率图发送给组织者,可以获得评估结果。评估是通过对10个不同级别的地图进行阈值化,并计算“warping error”、“Rand error”和“pixel error”来完成的。
u-net(输入数据的7个旋转版本的平均值)在没有任何进一步的预处理或后处理的情况下实现了0.0003529的翘曲误差(新的最佳分数,见表1)和0.0382的随机误差。
在这里插入图片描述
我们还将u-net应用于光显微图像的细胞分割任务。该分割任务是2014年和2015年ISBI细胞跟踪挑战的一部分。第一个数据集“PhC-U373”2包含聚丙烯酰亚胺底物上的胶质母细胞瘤-星形细胞瘤U373细胞,通过相差显微镜记录(见图4a,b和Supp. Material)。它包含35个部分注释的训练图像。在这里,我们实现了92%的平均IOU(“交集/联合”),明显优于第二优算法的83%(见表2)。第二个数据集“DIC-HeLa”3是通过差干涉对比(DIC)显微镜记录的平板玻璃上的HeLa细胞(见图3、图4c、d和Supp. Material)。它包含20个部分注释的训练图像。在这里,我们实现了77.5%的平均IOU,这明显好于第二好的算法(46%)。
在这里插入图片描述
在这里插入图片描述

5论文内一些重要的图

  • 可以和一些实验、方法进行呼应,帮助你以后快速回忆起这篇论文内容核心。
  • 你的论文方法概述也可以围绕这个图讲

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/680047.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

“GPT-4o深度解析:技术演进、能力评估与个人体验综述“

文章目录 每日一句正能量前言对比分析模型架构性能应用场景用户体验技术创新社区和生态系统总结 技术能力语言生成能力语言理解能力技术实现总结 个人感受关于GPT-4o的假设性观点:关于当前语言模型的一般性观点: 后记 每日一句正能量 又回到了原点&#…

【前端】display:none和visibility:hidden两者的区别

😎 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。公粽号:洲与AI。 🤓 欢迎大家关注我的专栏,我将分享Web前后端开发、…

电机行业MES生产管理系统--助力电机企业数字化转型

电机行业 MES 系统是一个综合生产管理系统, 融合了工厂企业必要的销售、 物 流和制造管理等全公司基础业务以及生产计划和现场监测管理。 一、传统机电行业的管理难题: 1、 产品标准化程度较低, 制造工艺复杂, 生产周期较长&#…

day50 动态规划 198.打家劫舍 213.打家劫舍II 337.打家劫舍III

198.打家劫舍 当前房屋偷与不偷取决于 前一个房屋和前两个房屋是否被偷了。 动规五部曲 1.确定dp数组(dp table)以及下标的含义 dp[i]:考虑下标i(包括i)以内的房屋,最多可以偷窃的金额为dp[i]。 2.确…

结构体+结构体内存对齐+结构体实现位段

结构体内存对齐实现位段 一.结构体1.结构体的声明2.结构体变量成员访问操作符3.结构体传参4.匿名结构体5.结构的自引用 二.结构体内存对齐1.对齐规则2.为什么存在内存对齐?3.修改默认对齐数 三.结构体实现位段1.什么是位段2.位段的内存分配3.位段的跨平台问题4.位段…

SELinux深度解析:安全增强型Linux的探索与应用(上)

🐇明明跟你说过:个人主页 🏅个人专栏:《Linux :从菜鸟到飞鸟的逆袭》🏅 🔖行路有良友,便是天堂🔖 目录 一、引言 1、SELinux概述 2、SELinux诞生背景 3、SELinux …

Django 视图探秘:FBV与CBV注册方式的异同,揭秘as_view()的执行魔法

文章目录 一、FBV、CBV注册方式及其区别FBVCBV 二、as_view()函数查看对应的view函数具体内容,最终返回的是dispatch方法查看dispatch方法 一、FBV、CBV注册方式及其区别 FBV FBV:path(index/,views.index) 通过调用函数方式,views.index是一…

打印机扫描工具V2.1发布

打印机扫描工具V2.1发布 从打印机扫描工具发布1.4版本以来,大家反馈了一些问题,目前就比较集中的问题,做了一些优化,做了一些大的调整,发布了2.1版本。 优化问题: 进一步优化安装包太大问题,…

上海亚商投顾:深成指、创业板指均涨超1%,电力股午后集体走强

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 沪指昨日低开后震荡反弹,深成指、创业板指均涨超1%,黄白二线依旧分化。电力、电网股午…

CHATGPT升级plus(已有账号前提下)

注册wildcard(虚拟卡) 注册号账号后先进行充值,充值后选择CHATGPT一键升级按照他的流程来即可 Wildcard网址:Wildcard跳转注册 填写邀请码充值时少两美金合计14¥ 邀请码:OL3QXTRH

挑战你的数据结构技能:复习题来袭【6】

1. (单选题)设无向图的顶点个数为n,则该图最多有()条边 A. n-1 B. n(n-1)/2 C. n(n1)/2 D. 0 答案:B 分析: 2. (单选题)含有n个顶点的连通无向图,其边的个数至少为()。 A. n-1 B. n C. n1 D. nlog2n 答案:A…

10 数据封装与层次对应关系

一、TCP/IP模型 二、封装与解封装 (一)数据的封装 (二)数据的解封装 三、协议、数据与设备 (一)对应层次协议 结构协议应用层HTTP / FTP / TFTP / SMTP / SNMP/ DNS传输层TCP / UDP网络层ICMP / IGMP / …

使用记事本或者写字板打开中文乱码问题

最近下载一个开源的公共的文件,下载下来是xml格式的文本文件,然后我尝试打开,使用记事本打开文件,内容显示正常,但是因为是xml文件,使用记事本打开的时候没有换行,不方便看,然后就使…

信息系统项目管理师0143:过程概述(9项目范围管理—9.2项目范围管理过程—9.2.1过程概述)

点击查看专栏目录 文章目录 9.2 项目范围管理过程9.2.1 过程概述 9.2 项目范围管理过程 9.2.1 过程概述 项目范围管理过程包括: 规划范围管理:为了记录如何定义、确认和控制项目范围及产品范围,创建范围管理计划。收集需求:为了…

文章自动排版

文字太多了不想看怎么办?想快速提取并罗列文章的重点要如何操作?今天给大家介绍一下如何把复杂的文章总结为一个个观点 使用说明 打开智游剪辑(zyjj.cc),搜索文字排版 我们输入要排版的文章,点击立即生成就…

心链9----组队功能开发以及请求参数包装类和包装类实现

心链 — 伙伴匹配系统 组队功能开发 需求分析 理想的应用场景 我要跟别人一起参加竞赛或者做项目,可以发起队伍或者加入别人的队伍 用户可以 创建 一个队伍,设置队伍的人数、队伍名称(标题)、描述、超时时间 P0 队长、剩余的人数…

安防综合管理系统EasyCVR视频汇聚平台GA/T 1400协议中的关键消息交互示例

在当今的信息化时代,公共安全防范日益成为保障社会和谐稳定的关键。视频监控系统作为现代安全防范的重要手段,正不断在公安、交通、城市管理等领域发挥着越来越重要的作用。而GA/T 1400协议视图库,作为公安视频图像信息应用系统的标准&#x…

使用 TinyEngine 低代码引擎实现三方物料集成

本文由体验技术团队 TinyEngine 项目成员炽凌创作,欢迎大家实操体验,本体验内容基于 TinyEngine 低代码引擎提供的环境,介绍了如何通过 TinyEngine 低代码引擎实现三方物料集成,帮助开发者快速开发。 知识背景 1.1 TinyEngine 低…

江苏省汽车及零部件产业协作配套对接会在苏州举行

5月28日,江苏省汽车及零部件产业协作配套对接会暨“百场万企”大中小企业融通对接活动在苏州举办。本次活动以“深化整零协作,促进大中小企业融通发展”为主题,由江苏省工业和信息化厅、中国中检所属中国汽车工程研究院股份有限公司&#xff…

Linux系统Docker部署Apache Superset并实现远程访问详细流程

目录 前言 1. 使用Docker部署Apache Superset 1.1 第一步安装docker 、docker compose 1.2 克隆superset代码到本地并使用docker compose启动 2. 安装cpolar内网穿透,实现公网访问 3. 设置固定连接公网地址 前言 作者简介: 懒大王敲代码&#xff0…