【扩散模型:医学影像中的调查】

🚀 作者 :“码上有前”
🚀 文章简介 :深度学习
🚀 欢迎小伙伴们 点赞👍、收藏⭐、留言💬

请添加图片描述

去噪扩散模型

去噪扩散模型是一类生成模型,最近在各种深度学习问题中引起了极大的兴趣。扩散概率模型定义了一个正向扩散阶段,在这个阶段中,输入数据通过加入高斯噪声在几个步骤中逐渐受到扰动,然后学习反向扩散过程以从有噪声的数据样本中检索所需的无噪声数据。

扩散模型因其强大的模式覆盖率和生成样本的质量而广受欢迎,尽管它们已知的计算负担。利用计算机视觉的进步,医学成像领域也观察到对扩散模型的兴趣日益增长。
在这里插入图片描述

在这里插入图片描述

过去十年

在过去十年中,使用神经网络的生成建模一直是深度学习的主导力量。自其出现以来,生成模型在图像[1,2]、音频[3,4]、文本[5]和点云[6]等各个领域产生了巨大的影响。从概率建模的角度来看,生成模型的关键定义特征是,它以这样一种方式进行训练,使其样本x ~ pθ(x )来自与训练数据分布x ~ pd(x)相同的分布。

基于能量的模型(EBMs)通过定义状态空间上的非规范化概率密度来实现这一点;然而,这些方法在训练和推理过程中都需要马尔可夫链蒙特卡罗(MCMC)采样,这是一个缓慢的迭代过程[7]。

过去几年

在过去的几年里,由于一般深度学习架构的发展,人们对生成模型的兴趣重新燃起,揭示了视觉保真度和采样速度的提高。具体来说,已经出现了生成对抗网络(GANs)[8]、变分自编码器(VAEs)[9]和归一化流[10]。

除此之外,基于扩散过程的生成模型为现有的VAEs、EBMs、gan和规范化流提供了一种替代方案,这些模型不需要对后验分布进行对齐、估计难以处理的配分函数、引入额外的判别器网络或分别放置网络约束。

迄今为止,已经发现扩散模型在许多领域都很有用,从生成建模任务(如图像生成[11]、图像超分辨率[12]、图像绘制[13])到判别任务(如图像分割[14]、分类[15]和异常检测[16])。

最近,医学影像领域基于扩散的技术数量呈指数级增长(见图1)。如图1所示,大量研究致力于扩散模型在不同医学成像场景中的应用。由于扩散模型最近受到了研究界的极大关注,因此该方向的文献正在大量涌入。我们希望这项工作将指出新的路径,为研究人员提供路线图,并激发视觉社区进一步的兴趣,以利用扩散模型在医学领域的潜力。

2 扩散理论

我们进一步将扩散模型分为两个主要视角:变分视角和分数视角。我们深入研究了它们的细节,并强调了属于它们的特定模型,例如变分视角中的ddpm和分数视角中的ncsn和sde。最后,我们提供了对这些方法背后的潜在理论的全面理解。

2.1扩散模型在哪里适合生成式学习?

随着可用数据集的显著激增,以及一般深度学习架构的进步,生成建模发生了革命性的范式转变。具体来说,三种主流生成框架包括、VAEs和归一化流[10]。生成模型通常包含在现实问题中采用的关键要求。这些要求包括(i)高质量采样,(ii)模式覆盖和样本多样性,以及(iii)快速执行时间和计算成本低廉的采样(参见图3)。
在这里插入图片描述

GANs

生成模型经常在这些标准之间做出调整。具体而言,gan能够快速生成高质量的样本,但其模式覆盖率较差,并且容易缺乏采样多样性。相反,尽管在覆盖数据模式中看到了VAEs和归一化流,但它们仍受到低样本质量的固有特性的影响。

gan由两个模型组成:一个生成器和一个评论家(鉴别器),它们相互竞争同时让彼此变得更强大。生成器试图捕获真实示例的分布,而鉴别器(通常是二元分类器)估计来自真实数据集的给定样本的概率。

它可以作为一个批评家,并经过优化以识别合成样品和真实样品。gan的一个常见问题是其训练动态被认为是不稳定的,导致模态崩溃、梯度消失和收敛等缺陷[27]。因此,巨大的兴趣也影响了gan的研究方向,以提出更有效的变体。

VAEs

VAEs通过最大化证据下限(ELBO)来优化数据的对数似然。尽管取得了显著的成就,但由于一些理论和实践上的挑战,如平衡问题[30]和变量崩溃现象[31],VAEs的行为仍然远远不能令人满意。通过一系列可逆变换构造了一个基于流的生成模型。具体来说,归一化流通过应用一系列可逆变换函数将简单分布转换为复杂分布,其中可以使用变量变换定理获得最终目标变量的期望概率分布。

GANs和VAEs

与gan和vae不同,这些模型明确地学习数据分布;因此,它们的损失函数就是负对数似然[32]。

尽管设计可行,但这些生成模型有其特定的缺点。由于基于可能性的方法必须构造一个归一化的概率模型,因此必须使用特定类型的体系结构(自回归模型、流模型),或者在VAE的情况下,不直接为生成的概率分布计算ELBO等替代Loss。

相比之下,由于GAN的对抗性损失的性质,GAN的学习过程本身是不稳定的。最近,扩散模型[33,34]已经成为强大的生成模型,展示了计算机视觉领域的主要主题之一,因此研究人员和从业者可能会发现跟上创新速度是一项挑战。

扩散模型

扩散模型是一类强大的概率生成模型,用于学习复杂的数据分布。这些模型通过利用两个关键阶段:正向扩散过程和反向扩散过程来实现这一点。

前向扩散过程在输入数据中加入噪声,逐渐提高噪声水平,直到数据转化为纯高斯噪声。这个过程系统地扰乱了数据分布的结构。然后应用反向扩散过程,也称为去噪,从扰动数据分布中恢复数据的原始结构。该过程有效地消除了前向扩散过程引起的降解。结果是一个高度灵活和易于处理的生成模型,可以准确地模拟随机噪声中的复杂数据分布。

其次,生成器利用先验输入来增强样本生成性能。©变分自编码器(VAE)[24]是一个独立的网络,它遵循编码器从数据样本到低维潜在空间的投影,并通过解码器路径从数据样本中采样产生。(d)归一化流(Normalizing flow, NF)[25]利用可逆流函数将输入转换为潜在空间,生成具有逆流函数的样本。(e)扩散模型在连续的步骤中将噪声与输入混合,直到它成为噪声分布,然后应用反向过程来中和采样过程中每一步的噪声添加。

变分视角包括使用变分推理来近似目标分布的模型,通常是通过最小化近似分布和目标分布之间的Kullback-Leibler散度来实现的。去噪扩散概率模型(Denoising Diffusion Probabilistic Models, ddpm)[33,34]就是这类模型的一个例子,因为它们使用变分推理方法来估计扩散过程的参数。

2.3评分视角评分

视角模型依赖于基于最大似然的估计方法,使用数据的对数似然的评分函数来估计扩散过程的参数。噪声条件评分网络(ncsn)[35]和随机微分方程(SDEs)[36]都属于这一类的子类别。ncsn侧重于估计不同噪声水平下受扰动数据分布的对数密度函数的导数,而SDEs是先前方法的推广,包括ddpm和ncsn的特征。下面我们将详细阐述每个子类别的细节

2.3.1噪声条件评分网络(ncsn)

某些数据分布p(x)的评分函数定义为对数密度相对于输入的梯度∇x log p(x)。为了估计这个分数函数,我们可以训练一个带有分数匹配的共享神经网络。具体来说,分数网络sθ是一个参数化为θ的神经网络,通过最小化以下目标来训练近似p(x) (sθ(x)≈x log p(x))的分数:

2.3.2随机微分方程(SDEs)

与上述两种方法类似,基于分数的生成模型(SGMs)[36]将数据分布q (x0)转换为噪声。然而,通过将噪声尺度的数量推广到无穷大,可以将以前的概率模型视为SGM的离散化。我们知道,许多随机过程,如扩散过程,都是随机微分方程(SDE)的解,其形式如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/401788.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++ Primer 笔记(总结,摘要,概括)——第3章 字符串、向量和数组

目录 3.1 命名空间的using声明 3.2 标准库类型string 3.2.1 定义和初始化string对象 3.2.2 string对象上的操作 3.2.3 处理string对象中的字符 3.3 标准库类型vector 3.3.1 定义和初始化vector对象 3.3.2 向vector对象中添加元素 3.3.3 其他vector操作 3.4 迭代器介绍 3.4.…

力扣102 二叉树的层序遍历 Java版本

文章目录 题目描述思路代码 题目描述 给你二叉树的根节点 root ,返回其节点值的 层序遍历 。 (即逐层地,从左到右访问所有节点)。 示例 1: 输入:root [3,9,20,null,null,15,7] 输出:[[3],[…

深度学习发展里程碑事件2006-2024

2006-2024年,深度学习发展经历众多的里程碑事件,一次次地刺激着人们的神经,带来巨大的兴奋。电影还在继续,好戏在后面,期待…… 2006年 深度信念网络(DBNs):Geoffrey Hinton与他的学…

爬虫基础(下)

requests模块可以用来获取网络数据; 那么对于爬虫来说,要获取下图网页中的内容,就需要网页的URL。 复制链接方法是,打开网页,点击链接框,右键选择复制。 requests.get()函数可用于模拟浏览器请求网页的过…

软件测试机构与开发人员在软件测试上有什么区别?

软件测试是在软件开发过程中对软件进行功能、性能、安全等方面进行评估和验证的过程。在软件测试中,软件测试机构和开发人员起着不同的作用,有着不同的职责和优势。 从角色定位上来说,软件测试机构是专门从事软件测试服务的组织,…

教你零基础制作产品画册,打开线上市场

​ 随着市场竞争的日益激烈,越来越多的企业开始注重产品的宣传和推广。而产品画册作为产品宣传的重要手段之一,也越来越受到企业的关注。今天,分享一个零基础制作产品画册的方法,帮助你打开线上市场的大门 1.选择合适的企业宣传…

【C++练级之路】【Lv.8】【STL】list类的模拟实现

快乐的流畅:个人主页 个人专栏:《C语言》《数据结构世界》《进击的C》 远方有一堆篝火,在为久候之人燃烧! 文章目录 引言一、结点二、迭代器2.1 成员变量与默认成员函数2.2 operator*2.3 operator->2.4 operator2.5 operator- …

openGauss学习笔记-225 openGauss性能调优-系统调优-配置向量化执行引擎

文章目录 openGauss学习笔记-225 openGauss性能调优-系统调优-配置向量化执行引擎 openGauss学习笔记-225 openGauss性能调优-系统调优-配置向量化执行引擎 openGauss数据库支持行执行引擎和向量化执行引擎,分别对应行存表和列存表。 一次一个batch,读…

安装及使用Nginx

目录 一、编译安装Nginx 1、关闭防火墙,将安装nginx所需要软件包传到/opt目录下 2、安装依赖包 3、创建运行用户、组 4、编译安装nginx 5、创建软链接后直接nginx启动 6、创建nginx自启动文件 6.1 重新加载配置、设置开机自启并开启服务 二、yum安装 一、编…

【论文解读】transformer小目标检测综述

目录 一、简要介绍 二、研究背景 三、用于小目标检测的transformer 3.1 Object Representation 3.2 Fast Attention for High-Resolution or Multi-Scale Feature Maps 3.3 Fully Transformer-Based Detectors 3.4 Architecture and Block Modifications 3.6 Improved …

fatal error: costmap_2d/keepOutZone.h

fatal error: costmap_2d/keepOutZone.h: No such file or directory 7 | #include "costmap_2d/keepOutZone.h" 解决: #include "costmap_plugins/keepOutZone.h"代码中搜索 costmap_2d,全部替换成costmap_plugins&#xff1b…

MySQL高可用架构探秘:主从复制剖析、切换策略、延迟优化与架构选型

MySQL高可用的基石 在分布式系统中,单机节点在发生故障时无法提供服务,这可能导致长期的服务不可用,从而影响其他节点的运作,导致的后果非常严重 为了满足服务的高可用,往往是通过节点冗余(新增相同功能的…

ABAQUS 软件在土木工程中的应用研究

摘要 随着土木工程的不断复杂化以及工程实践对土木工程分析计算要求越来越高,有限元技术在土木工程中的应用也越来越广泛。本文主要介绍国际大型通用有限元软件ABAQUS在土木工程中的应用,主要包括在建筑工程、桥梁工程、岩土工程中的应用,以期为相关工程…

【webrtc】m77 PacedSender

mediasoup是m77的代码,m77的代码并没有paced controller ,而且与paced sender 的逻辑混在了一起。结合大神们的代码分析,对照m77 进行 理解。m77 有ProbeController。给pacersender 更新飞行数据:PacedSender::InsertPacket(size_t bytes) 对应的是 PacingController::OnPa…

2023年12月 Python(五级)真题解析#中国电子学会#全国青少年软件编程等级考试

Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,共50分) 第1题 下面代码的输出结果是?( ) dict1 = {1: 10, 2: 20, 3: 30} dict2 <

XML的写法

下面我将以如下代码来解释下XML的写法 <?xml version"1.0" encoding"UTF-8" ?> <Steam><steam id"1"><zhanghao>admin</zhanghao><mima>123</mima><num>120</num></steam><st…

学习数仓工具 dbt

DBT 是一个有趣的工具&#xff0c;它通过一种结构化的方式定义了数仓中各种表、视图的构建和填充方式。 dbt 面相的对象是数据开发团队&#xff0c;提供了如下几个最有价值的能力&#xff1a; 支持多种数据库通过 select 来定义数据&#xff0c;无需编写 DML构建数据时&#…

色彩搭配:打造视觉吸引力与用户体验的关键

title: 色彩搭配&#xff1a;打造视觉吸引力与用户体验的关键 date: 2024/2/22 12:01:11 updated: 2024/2/22 12:01:11 tags: 网站色彩搭配视觉吸引力品牌形象用户体验设计色彩心理学配色技巧色轮互补 在当今数字化时代&#xff0c;网站已经成为了人们获取信息、进行交流和进行…

嵌入式学习之Linux入门篇——使用VMware创建Unbuntu虚拟机

目录 主机硬件要求 VMware 安装 安装Unbuntu 18.04.6 LTS 新建虚拟机 进入Unbuntu安装环节 主机硬件要求 内存最少16G 硬盘最好分出一个单独的盘&#xff0c;而且最少预留200G&#xff0c;可以使用移动固态操作系统win7/10/11 VMware 安装 版本&#xff1a;VMware Works…

Jmeter内置变量 vars 和props的使用详解

JMeter是一个功能强大的负载测试工具&#xff0c;它提供了许多有用的内置变量来支持测试过程。其中最常用的变量是 vars 和 props。 vars 变量 vars 变量是线程本地变量&#xff0c;它们只能在同一线程组内的所有线程中使用&#xff08;线程组内不同线程之间变量不共享&#…