一文详解去噪扩散概率模型(DDPM)

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。

针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。

合集:

《AIGC 面试宝典》已圈粉无数!


去噪扩散概率模型(DDPM)是一种新颖的高质量图像生成方法。现在事实证明,扩散模型可以轻松超越标准生成对抗网络(GAN)。

我们有一个正向过程和一个反向过程。前向过程向图像添加高斯噪声。这将导致均值和单位方差为零的高斯分布。在相反的过程中,我们尝试从高斯噪声分布​​中重新创建图像。

正向和反向过程是参数化的随机马尔可夫链,我们在其中重复应用转换内核。转变以逐步的方式发生。每一步仅依赖于上一步。

在这里插入图片描述

DDPM的前向和后向过程

转发过程

我们可以将扩散过程定义为随机微分方程。它包含确定性部分和随机部分。论文中,这与朗之万动力学有关。

前向过程定义如下。

我们可以通过以下方式重新参数化和离散化上述方程。

假设 t=T 是最后一个时间步。我们可以通过以下方式简化时间步 T 的分布。

现在,我们可以考虑收敛标准来推导出以下结果。

这意味着重复使用上述重新参数化最终会导致零均值单位方差高斯分布。

我们不使用固定方差 β,而是使用方差表 βₜ。我们随时间改变方差。

方差项定义了从一个样本到另一个样本的跳跃。在相反的过程中,在最初的步骤中,我们可以快速改变(我们有非常嘈杂的图像)。因此,我们使用更大的方差。然而,在最后的步骤中,我们必须小心地改变图像。因此,我们使用较小的方差。

然而,这是一个递归过程。如果我们想要计算 t=1000 时的分布,我们必须递归执行上述方程 1000 次。我们可以简化算法,直接计算任意时间步的分布。

我们可以使用上面的等式来避免递归。

在这里插入图片描述

逆向过程

我们想要从随机高斯噪声生成图像。这也是具有高斯转移的随机马尔可夫链。我们可以用下面的方式来写。

这是一个极其困难的问题。计算均值和方差涉及处理整个图像。因此,我们使用变分推理。由于后验分布的复杂性,我们将其描述为优化问题。现在,均值和方差是可学习的参数。

我们正在尝试近似反向分布。这类似于变分自动编码器中使用的方法。

变分自动编码器(VAE)

我们没有尝试优化对数概率,而是尝试最小化下限。

变分自编码器和 DDPM 有许多相似之处。然而,DDPM 以逐步的方式执行正向和反向过程。因此,我们可以用稍微不同的方式重新计算DDPM的优化过程。

现在我们可以使用马尔可夫链属性来进一步简化这一点。

所有项看起来都像 KL 散度,我们希望将它们最小化。最后一项包含解释相反过程的类似术语。第一项和第二项是常数。我们使用第三项来计算损失。

将上式乘以-1,我们可以推导出下式。

现在我们将通过以下方式进一步简化散度项。

所得分布也是高斯分布。我们可以重写,

我们可以用类似的方式编写反向步骤的参数化版本。我们使用与上面相同的方差。

在本文中,我们计算了我们的模型对噪声的近似程度。因此,损失略有不同。

现在,我们可以忽略常数项,并将损失定义为噪声之间的差异。

现在我们可以定义我们的训练算法。

我们向神经网络输入带有高斯噪声的图像。所得噪声必须接近真实噪声。

对于图像生成,我们执行相反的过程。这个过程类似于朗之万动力学。

在这里插入图片描述

CelebA-HQ 256 × 256 生成的样本

参考

Ho, J.、Jain, A. 和 Abbeel, P. (2020)。去噪扩散概率模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/739435.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

恒远世达:把握现在,高考后逆袭,开启日本留学之路!

一年一度的高考已经落幕,马上就要出高考分数了,有人欢喜有人忧,奋斗学习了这么多年,就为了考上一所理想的大学,一旦没考上,心情会非常的低落。 在传统心态中,高考失利意味着人生重大失败&#…

VS Code SSH 远程连接服务器及坑点解决

背景 Linux服务器重装了一下,IP没有变化,结果VS Code再重连的时候就各种问题,导致把整个流程全部走了一遍,留个经验帖以备查看 SSH 首先确保Windows安装了ssh,通过cmd下ssh命令查看是否安装了。 没安装,…

CAD平台大模型场景显示性能优化分析总结

1.性能瓶颈原因 图元过于复杂 (1)图元内的三角形面片过多。对于CAD平台大场景,单帧三角面片数量达到5000万。 (2)图元的各种计算过多。 过多的图元。例如土建场景:将近20万的构件,绘制次数将…

原装GUVCL-T10GD韩国GENICOM光电二极管紫外线传感器原厂代理商

深圳市宏南科技有限公司是韩国GenUV公司的原厂代理商,所售紫外线传感器均来自于原始生产厂商直接供货,非第三方转售。 GUVCL-T10GD 韩国GENICOM光电二极管光传感器 / 低亮度 / 紫外线 UV-C传感器 GUVCL-T10GD 采用基于氮化铟的材料 肖特基型 光电二极管…

生产环境安装odoo

odoo可以在多平台运行,但是在生产环境下官方不建议在Windows平台部署。在Windows下可能不能很好的支持一服务多worker的形式,更推荐在Linux下部署。 常见的Linux如Ubuntu、Debian等Debian系或Redhat系都能执行官网的包安装。 地址:Download |…

C# Web控件与数据感应之数据返写

目录 关于数据返写 准备视图 范例运行环境 ControlInducingFieldName 方法 设计与实现 如何根据 ID 查找控件 FindControlEx 方法 调用示例 小结 关于数据返写 数据感应也即数据捆绑,是一种动态的,Web控件与数据源之间的交互,数据…

Docker(七)-Docker容器数据卷

1.容器数据卷是什么 卷就是目录或者文件,存在于一个或者多个容器中,由docker挂载到容器,不属于容器内(类似于笔记本电脑外的一个移动硬盘)。 卷的设计目的就是数据持久化,完全独立于容器的生存周期,因此Docker不会在容…

博图随机生成俄罗斯方块程序

一、程序结构 1.定义基础数据,俄罗斯方块图形共19中,使用WORD编码存储在数组内 2.添加随机生成int数值的FC函数块,生成1-19 的随机数 3.查找数组内图形显示在HMI画面上 二、程序 1.生成1-19 的随机数,并显示当前图形样式 2.生成按…

网页设计软件Bootstrap Studio6.7.1

Bootstrap Studio是一个适用于Windows的程序,允许您使用流行的fre***orca Bootstrap创建和原型网站。您可以将现成的组件拖动到工作区并直观地自定义它们。该程序生成干净和语义的PDF、CSS和JS代码,所有Web浏览器都支持这些代码。 Bootstrap Studio有一个漂亮而强大的界面,它…

Microsoft Edge浏览器安装crx拓展插件教程

1、首先打开edge浏览器,点击顶部地址栏。 2、在地址栏中输入"edge://flags/#extensions-on-edge-urls"并按下回车。2、在地址栏中输入"edge://flags/#extensions-on-edge-urls"并按下回车。 3、进入后,将图示选项改为“已禁用”。 …

邮件群发推送的方法技巧?有哪些注意事项?

邮件群发推送的策略如何实现?邮件推送怎么评估效果? 电子邮件营销是现代企业进行推广和沟通的重要工具。有效的邮件群发推送不仅能提高客户参与度,还能促进销售增长。AokSend将探讨一些关键的邮件群发推送方法和技巧,以帮助企业优…

现在本科录取率最高已达79%了。。。

郭震原创,手撸码字1035 你好,我是郭震 高考今天陆续出分,查了下去年高考本科录取率,排名第一的上海,已达到79.19%: 不知道诸位看到这个数字,有何感想? 1 本科含金量 1977年本科录取率…

ONLYOFFICE 桌面编辑器 8.1华丽登场

简介:全新ONLYOFFICE 桌面编辑器 8.1解锁全新PDF编辑、幻灯片优化与本地化体验,立即下载! 前言:在数字化时代,高效的办公协作工具是企业和个人不可或缺的利器。ONLYOFFICE,作为一款功能强大的云端和桌面办公…

Ubuntu 20.04.3 LTS 安装打印服务器 局域网发现系统服务 共享给 windows 10/11 使用

ubuntu安装部署打印服务器可参考: Ubuntu 20.04.3 LTS 安装hp 1020 plus 打印机 通过cups共享给 windows 10/11 使用-CSDN博客 1 windows 10 ,局域网搜索不到共享的hp1020打印机 2 Ubuntu使用Avahi进行局域网服务发现和设备发现,安装avahi-daemon sudo apt-updat…

uniapp小程序button按钮去掉黑色线条

文章目录 导文去除方法 导文 在uniapp的button按钮中有一个莫名其妙的黑色线条 去除方法 button::after{border: none; }该问题并不是所有的手机机型都有,最好添加一下,以防用户手机端样式有问题。 您好,我是肥晨。 欢迎关注我获取前端学习…

AI绘画Stable Diffusion 超强一键去除图片中的物体,免费使用!

大家好,我是设计师阿威 在生成图像时总有一些不完美的小瑕疵,比如多余的物体或碍眼的水印,它们破坏了图片的美感。但别担心,今天我们将介绍一款神奇的工具——sd-webui-cleaner,它可以帮助我们使用Stable Diffusion轻…

【数据分享】2006-2023《中国贸易外经统计年鉴》

公众号新功能 目前公众号新增以下等功能 1、处理GIS出图、Python制图、区位图、土地利用现状图、土地利用动态度和重心迁移图等等 2、核密度分析、网络od分析、地形分析、空间分析等等 3、地理加权回归、地理探测器、生态环境质量指数、地理加权回归模型影响因素分析、计算…

什么是“渠道精酿”?从FENDI CLUB看渠道改变

在我国消费市场上,最早喝上精酿啤酒的群体分别是留洋的学生、工厂酿酒师傅以及能够买到进口啤酒的爱好者,他们既是第一批接触精酿的人,也成为了中国精酿啤酒文化的传播者。可以说精酿是从小众到大众,从概念热到了渠道热。 “渠道精…

puppet运维自动化

在现代信息技术管理中,自动化运维工具的应用已成为企业提升效率、降低成本的关键手段之一。Puppet作为一种强大的运维自动化工具,因其高效、灵活和可扩展的特点,受到越来越多企业的青睐。本文将探讨Puppet在运维自动化中的应用,包…

跨平台数据库工具DataGrip v2024.1全新发布——升级数据处理功能

DataGrip 是一个跨平台的数据库工具可在Windows,OS X 和 Linux上使用。同时支持多种数据库,包含了SQL Server,Oracle,PostgreSQL,MySQL,DB2,Sybase,SQLite,Derby&#xf…