【生成模型之七】Classifier-free diffusion guidance

论文:classifier-free diffusion guidance

一、Background

分类器引导是一种最近引入的方法,用于在训练后的条件扩散模型中权衡样本丰富度和样本保真度,其思想与其他类型生成模型中的低温采样或截断相同。

分类器引导将扩散模型的分数估计与图像分类器的梯度相结合,因此需要训练与扩散模型分离的图像分类器。这也提出了一个问题,即是否可以在没有分类器的情况下进行指导。

我们证明,在没有这样的分类器的情况下,引导确实可以通过纯生成模型来执行:在我们所谓的无分类器引导中,我们联合训练一个条件和一个无条件的扩散模型,并将得到的条件和无条件的分数估计结合起来,以实现样本质量和多样性之间的权衡,类似于使用分类器引导获得的结果。

 Diffusion models beat GANs on image synthesis提出了分类器引导,这是一种使用额外训练的分类器来提高扩散模型样本质量的技术。由于分类器引导在采样过程中将分数估计与分类器梯度混合在一起,因此分类器引导的扩散采样可以被解释为试图将图像分类器与基于梯度的对抗攻击混淆。这就提出了一个问题,即分类器指导是否能够成功地提高基于分类器的指标,如FID和Inception分数(is),仅仅是因为它对这些分类器是对抗性的。

为了解决这些问题,我们提出了无分类器引导,我们的引导方法完全避免了任何分类器。无分类器引导不是在图像分类器的梯度方向上采样,而是将条件扩散模型和联合训练的无条件扩散模型的分数估计混合在一起。通过sweep混合权重,我们获得了类似于分类器引导所获得的FID/IS trade-off。我们的无分类器引导结果表明,纯生成扩散模型能够合成其他类型生成模型可能具有的极高保真度样本。

在条件生成建模的情况下,数据x与条件信息c一起绘制,即用于类条件图像生成的类标签。对模型的唯一修改是,逆过程函数逼近器接收c作为输入,如εθ(zλ,c)。

二、Guidance

某些生成模型(如GAN和基于流的模型)的一个有趣特性是能够通过在采样时减小生成模型的噪声输入的方差或范围来执行截断或低温采样。预期的效果是降低样本的多样性,同时提高每个样本的质量。例如,BigGAN中的截断(Brock等人,2019)分别在低截断量和高截断量下产生FID得分和Inception得分之间的权衡曲线。Glow的低温采样(Kingma&Dhariwal,2018)也有类似的效果。

不幸的是,在扩散模型中实现截断或低温采样的直接尝试是无效的。例如,在反向过程中缩放模型分数或降低高斯噪声的方差会导致扩散模型生成模糊、低质量的样本(Dhariwal&Nichol,2021)。

  

三、Calssifier-free guidance 

无分类器引导是一种修改εθ(zλ,c)的替代方法,其效果与分类器引导相同,但没有分类器。如上图所示。

我们没有训练单独的分类器模型,而是选择训练一个通过分数估计器εθ(zλ)参数化的无条件去噪扩散模型pθ(z)以及通过εθ(zλ,c)参数化了的条件模型pθ。我们使用单个神经网络对两个模型进行参数化,其中对于无条件模型,我们可以在预测分数时为类标识符c简单地输入一个空标记∅,即εθ(zλ)=εθ(zλ,c)。我们共同训练无条件和条件模型只需将c随机设置为无条件类标识符∅,并将其设置为超参数。zλ = αλx + σλε。然后,我们使用以下条件和无条件score estimates分数估计的线性组合进行采样

四、实验

在这两个极端之间,我们看到感知质量的这两个指标之间存在明显的权衡,FID随w单调递减,IS随w单调递增。

 

五、结论

我们的无分类器引导方法最实用的优点是它极其简单:在训练过程中只需更改一行代码即可随机丢弃条件反射,在采样过程中只需要混合条件和无条件的分数估计。相比之下,分类器引导使训练pipeline复杂化,因为它需要训练额外的分类器。该分类器必须在噪声zλ上进行训练,因此不可能插入标准的预训练分类器。

由于无分类器引导能够在不需要额外训练的分类器的情况下权衡IS和FID类分类器引导,我们已经证明引导可以用纯生成模型来执行。

无分类器制导的一个潜在缺点是采样速度。一般来说,分类器可以比生成模型更小更快,因此分类器引导的采样可能比无分类器引导更快,因为后者需要运行扩散模型的两个正向过程,一个用于条件得分,另一个用于无条件得分。通过改变架构以在网络后期注入条件,可以减轻运行多遍扩散模型的必要性,但我们将这一探索留给未来的工作。

最后,任何以牺牲多样性为代价提高样本保真度的指导方法都必须面对降低多样性是否可接受的问题。部署的模型可能会产生负面影响,因为在某些数据部分在其余数据的上下文中代表性不足的应用程序中,保持样本多样性非常重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/941521.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【LeetCode每日一题】——415.字符串相加

文章目录 一【题目类别】二【题目难度】三【题目编号】四【题目描述】五【题目示例】六【题目提示】七【解题思路】八【时空频度】九【代码实现】十【提交结果】 一【题目类别】 字符串 二【题目难度】 简单 三【题目编号】 415.字符串相加 四【题目描述】 给定两个字符…

Why SAP TM?

最近发现跟 SAP TM 的集成越来越多了,并且发现这模块还挺大,很难一下子理解。TM(Transportation Management)- 顾名思义就是“运输管理”。起初很难想象为啥 SAP 会浪费大量的时间和精力开发“运输管理”,从而只是为了…

开源鸿蒙 5.0 正式版发布

在2024年的开放原子开发者大会上,开源鸿蒙5.0版本正式发布啦!这个版本是一个比较大的升级,性能和功能都上了一个新台阶,让我们一起来看看都有哪些亮点。 首先,开源鸿蒙这个项目,从最初的700万行代码&#x…

直流有刷电机多环控制(PID闭环死区和积分分离)

直流有刷电机多环控制 提高部分-第8讲 直流有刷电机多环控制实现(1)_哔哩哔哩_bilibili PID模型 外环的输出作为内环的输入,外环是最主要控制的效果,主要控制电机的位置。改变位置可以改变速度,改变速度是受电流控制。 实验环境 【 &…

Odrive源码分析(四) 位置爬坡算法

Odrive中自带一个简单的梯形速度爬坡算法&#xff0c;本文分析下这部分代码。 代码如下&#xff1a; #include <cmath> #include "odrive_main.h" #include "utils.hpp"// A sign function where input 0 has positive sign (not 0) float sign_ha…

电视大全 1.3.8|汇聚多频道资源,秒切换流畅播放

电视大全TV版是一款功能丰富的TV端直播软件&#xff0c;由悠兔电视的同一开发者打造。最新版本更新了更多频道&#xff0c;包括央视、卫视和地方频道等&#xff0c;提供了多线路流畅播放体验&#xff0c;并支持节目回看、线路选择、开机自启等功能。该应用免登录且无购物频道&a…

JAVAweb学习日记(二)JavaScript

一、概念 二、JavaScript引入方式 三、JavaScript书写语法 输出语句&#xff1a; 变量&#xff1a; 数据类型、运算符、流程控制语句&#xff1a; 数据类型&#xff1a; 运算符&#xff1a; 字符串如果是 数字字符构成&#xff0c;先把读到的数字转为数字类型&#xff0c;后续…

深圳龙岗戴尔dell r730xd服务器故障维修

深圳龙岗一台DELL POWEREDGE R730XD服务器系统故障问题处理&#xff1a; 1&#xff1a;客户工厂年底产线整改&#xff0c;时不时的会意外断电&#xff0c;导致服务器也频繁停机&#xff0c; 2&#xff1a;多次异常停机后导致服务器开机后windows server系统无法正常启动了&…

Ansible 批量管理华为 CE 交换机

注&#xff1a;本文为 “Ansible 管理华为 CE 交换机” 相关文章合辑。 使用 CloudEngine - Ansible 批量管理华为 CE 交换机 wsf535 IP 属地&#xff1a;贵州 2018.02.05 15:26:05 总体介绍 Ansible 是一个开源的自动化运维工具&#xff0c;AnsibleWorks 成立于 2012 年&a…

2024年Python最新下载安装教程,附详细图文,持续更新

大家好&#xff0c;我是Python老安&#xff0c;今天为大家带来的是Windows Python3下载、安装教程&#xff0c;适用于 Python3 所有版本&#xff0c;包括 Python3.7,Python33.8,Python33.10 等版本。希望对大家有所帮助 Python目前已支持所有主流操作系统&#xff0c;在Linux,…

《点点之歌》“意外”诞生记

世界是“点点”的&#xff0c;“点点”是世界的。 (笔记模板由python脚本于2024年12月23日 19:28:25创建&#xff0c;本篇笔记适合喜欢诗文的coder翻阅) 【学习的细节是欢悦的历程】 Python 官网&#xff1a;https://www.python.org/ Free&#xff1a;大咖免费“圣经”教程《 …

网络安全检测

实验目的与要求 (1) 帮助学生掌握木马和入侵的防护和检测方法、提高学习能力、应用能力和解决实际问题的能力。 (2) 要求学生掌握方法, 学会应用软件的安装和使用方法, 并能将应用结果展示出来。 实验原理与内容 入侵检测是通过对计算机网络或计算机系统中若干关键点收集信…

c++------------------函数

函数定义 语法格式 函数定义包括函数头和函数体。函数头包含返回类型、函数名和参数列表。函数体是用花括号{}括起来的代码块&#xff0c;用于实现函数的功能。例如&#xff0c;定义一个计算两个整数之和的函数&#xff1a; int add(int a, int b) {return a b; }这里int是返回…

Java WEB:从起源到现代的传奇之旅

Java Web 起源于上世纪 90 年代&#xff0c;随着网络和浏览器的飞速发展&#xff0c;Java 为应对动态处理网页的需求&#xff0c;推出了 Servlet 技术。 1. Servlet 出现之前 在 Servlet 出现之前&#xff0c;用户请求主要是静态资源&#xff0c;如 html、css 等。此时的网络…

社区管理系统:实现社区信息数字化管理的实践

3.1可行性分析 开发者在进行开发系统之前&#xff0c;都需要进行可行性分析&#xff0c;保证该系统能够被成功开发出来。 3.1.1技术可行性 开发该社区管理系统所采用的技术是vue和MYSQL数据库。计算机专业的学生在学校期间已经比较系统的学习了很多编程方面的知识&#xff0c;同…

DataV的安装与使用(Vue3版本)

1、DataV(vue3)地址&#xff1a;DataV Vue3TSVite版 | DataV - Vue3 2、使用 npm install kjgl77/datav-vue3 安装 3、全局引入。 4、此时就可以按需使用了~

隐藏指定文件/文件夹和自动提示功能消失解决方案

一. 隐藏指定文件/文件夹 Idea中隐藏指定文件或指定类型文件 Setting → File Types → Ignored Files and Folders输入要隐藏的文件名&#xff0c;支持*号通配符回车确认添加 二. 自动提示功能消失解决方案 指定SpringBoot配置文件 File → Project Structure → Facets选…

springboot474基于web的垃圾分类回收系统(论文+源码)_kaic

摘 要 如今社会上各行各业&#xff0c;都喜欢用自己行业的专属软件工作&#xff0c;互联网发展到这个时候&#xff0c;人们已经发现离不开了互联网。新技术的产生&#xff0c;往往能解决一些老技术的弊端问题。因为传统垃圾分类回收系统信息管理难度大&#xff0c;容错率低&am…

最优二叉搜索树【东北大学oj数据结构10-4】C++

题面 最优二叉搜索树是由 n 个键和 n1 个虚拟键构造的二叉搜索树&#xff0c;以最小化搜索操作的成本期望值。 给定一个序列 Kk1​,k2​,...,kn​&#xff0c;其中 n 个不同的键按排序顺序 &#xff0c;我们希望构造一个二叉搜索树。 对于每个关键 ki​&#xff0c;我们有一个…

jsp-servlet开发

STS中开发步骤 建普通jsp项目过程 1.建项目&#xff08;非Maven项目&#xff09; new----project----other----Web----Dynamic Web Project 2.下载包放到LIB目录中,如果是Maven项目可以自动导包&#xff08;pom.xml中设置好&#xff09; 3.设置工作空间&#xff0c;网页…