论文学习—VAE

VAE----Auto-Encoding Variational Bayes

  • 2024年12月17日-2024年12月18日
    • 摘要
    • 引言
    • 方法
    • 例子:变分自动编码器

2024年12月17日-2024年12月18日

从今天开始,我准备记录自己学习的内容以此来检验我每天的学习量,菜鸡一枚,希望能够与大家进行沟通交流。我的第一篇论文学习选择的是VAE,因为我对于这种生成模型比较感兴趣。
论文链接: Auto-Encoding Variational Bayes
https://blog.csdn.net/a312863063/article/details/87953517

摘要

摘要告诉我们,作者引入了一种随机变分推理和学习的算法用于解决难以拟合后验分布的问题,即作者通过利用概率表述潜在空间进而拟合后验模型。
贡献: Our contributions are two-fold. First, we show that a reparameterization of the variational lower bound
yields a lower bound estimator that can be straightforwardly optimized using standard stochastic gradient methods. Second, we show that for i.i.d. datasets with continuous latent variables per datapoint, posterior inference can be made especially efficient by fitting an approximate inference model (also called a recognition model) to the intractable posterior using the proposed lower bound estimator. Theoretical advantages are reflected in experimental results.
摘自原文,一般来说论文会在两个地方写自己的贡献:摘要和引言,但是这篇论文只在摘要提到了自己的贡献,可能是因为觉得必要写吧。不愧是大神
作者的贡献表明,他们从理论上证明了变分下界的重新参数化会产生了一个下界估计量,它可以直接使用标准的随机梯度方法进行优化。而且对于对于每个数据点具有连续潜变量的数据集来说,他们通过使用所提出的下界估计量将近似推理模型可以拟合到难以处理的后验模型。

引言

这篇论文引言很短,只有两段话,第一段介绍了目前的研究希望可以拟合棘手的后验分布,但是目前的工作却难以解决,所以作者发现变分下界的重新参数化会产生下界的一个简单的可微无偏估计量,利用这个估计量可以拟合后验分布并且很容易进行优化。第二段则是简单介绍了他们提出的算法(AEVB)。(我觉得没什么东西,只是说了一下他们的方法可以只对少量数据抽样就可以进行学习然后拟合后验模型从而完成各种任务。)

方法

这部分涉及到了证明,如果感兴趣的同学可以仔细研究一下论文内容,我只做简单介绍,我这里就不再赘述了。(主要是我懒而且菜鸡不喜欢也学不会这种数学证明)
这篇论文确实挺奇怪,一般引言后面介绍是相关工作,但是作者直接开始讲方法却把相关工作放在了第四部分。可能是想让大家直接知道他们是怎么做的。(我猜的,毕竟大神的想法我这个菜鸡怎么懂
方法部分主要是用于推导各种具有连续潜变量的有向图形模型的下界估计量,即证明部分也是作者提到自己的第一个贡献点,他们选择每个数据点具有潜在变量的数据集。
在这里插入图片描述
这个图介绍了基于潜在变量的生成模型的流程,正如作者所示实线表示生成模型,虚线表示难以处理的后验的变分近似。
2.1介绍了问题定义,没什么东西,就是介绍采用什么变量表示什么内容,目前遇到的一些问题以及如何进行一些简化。我觉得大家可以重点读一下最后一段了解一些编码器和解码器就行。
2.2变分边界 这个涉及了对于下界估计量的推导,文中是一个简单的版本只是告诉我们最终的推导结果。
在这里插入图片描述

2.3 SGVB估计器和AEVB算法 介绍了整个算法的推导流程以及数学证明,作者通过推导告诉我们如何对这些参数进行优化,也介绍了如何进行这样的优化。
如果大家想进一步了解可以参考这篇博客,博客的这个图也很形象告诉我们为什么作者要这么做。(作者不愧为天才这都能想出来,膜拜膜拜)
博客图片
2.4重新参数化技巧这一部分介绍了他们的方法是如何起效果,通过这一部分我发现这篇论文主要是为了告诉我们给定一个真实样本 Xk,我们可以假设存在一个专属于 Xk 的分布 p(Z|Xk)(后验分布),并假设这个分布是(独立的、多元的)正态分布。,那么从 p(Z) 中采样一个 Z,那么我们就可以知道这个 Z 对应于哪个真实的 X 了, p(Z|Xk) 专属于 Xk,我们有理由说从这个分布采样出来的 Z 应该还原到Xk 中去。

例子:变分自动编码器

这一部分作者介绍了一个例子,通过这个例子我们对作者的方法可以有更深入的了解,而且如果大家跟我一样不像看前面的推导过程的话,大家可以好好研究一下这一部分,毕竟直观的例子更方便我们理解。公式(9)告诉我们后验概率的分布定义,公式(10)告诉我们我们针对于这个例子的目标函数。通过优化我们可以实现拟合后验模型,而根据后验模型我们就可以得到原始分布即达到生成数据的目的。
在这里插入图片描述
可能文字不太直观,大家可以参考这篇知乎和这篇博客的内容。
在这里插入图片描述
在这里插入图片描述
之后就是相关工作、实验、结论等内容,大家可以看原文,我就不给大家献丑了。
本人水平有限肯定存在很多不足之处,欢迎大家进行交流。若是大家觉得看不懂我写的,推荐大家可以参考一下内容:
博客(强烈推荐!!!)
知乎
CSDN

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/939176.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Go语言后台实现选中式导出excel文件

实现选中导出为excel文件的基本实现方案是前端将选中的数据传递给后端,后台接受这些数据生成excel文件的流,将流返回给前端并在响应体设置文件的格式。 这时只要将需要下载的数据提交到改接口就会返回文件流数据,提供下载。具体实现代码如下&…

大模型微调---Prompt-tuning微调

目录 一、前言二、Prompt-tuning实战2.1、下载模型到本地2.2、加载模型与数据集2.3、处理数据2.4、Prompt-tuning微调2.5、训练参数配置2.6、开始训练 三、模型评估四、完整训练代码 一、前言 Prompt-tuning通过修改输入文本的提示(Prompt)来引导模型生…

spring学习(spring-bean实例化(实现FactoryBean规范)(延迟实例化bean))

目录 一、spring容器实例化bean的几种方式。 (1)无参构造与有参构造方法。 (2)静态工厂与实例工厂。 (3)实现FactoryBean规范。 二、spring容器使用实现FactoryBean规范方式实现bean实例化。 (1…

【Java】mac安装Java17(JDK17)

文章目录 下载java17一、安装二、环境变量 下载java17 官网下载:https://www.oracle.com/java/technologies/downloads 提示:以下是本篇文章正文内容,下面案例可供参考 一、安装 直接安装后,安装完后目录会存放在下面目录下 /…

mysql免安装版配置教程

一、将压缩包解压至你想要放置的文件夹中,注意:绝对路径中要避免出现中文 二、在解压目录下新建my.ini文件,已经有的就直接覆盖 my.ini文件内容 [mysqld] # 设置3306端口 port3306 # 设置mysql的安装目录 basedirD:\\tools\\mysql-8.1.0-win…

web:pc端企业微信登录-vue版

官方文档:developer.work.weixin.qq.com/document/pa… 不需要调用ww.register,直接调用ww.createWWLoginPanel即可创建企业微信登录面板 - 文档 - 企业微信开发者中心 (qq.com) 引入 //通过 npm 引入 npm install wecom/jssdk import * as ww from we…

基于Spring Boot的无可购物网站系统

一、系统背景与意义 随着互联网的快速发展,电子商务已经成为人们日常生活的重要组成部分。构建一个稳定、高效、可扩展的电商平台后端系统,对于满足用户需求、提升用户体验、推动业务发展具有重要意义。Spring Boot作为当前流行的Java开发框架&#xff…

YOLOv11改进,YOLOv11添加DLKA-Attention可变形大核注意力,WACV2024 ,二次创新C3k2结构

摘要 作者引入了一种称为可变形大核注意力 (D-LKA Attention) 的新方法来增强医学图像分割。这种方法使用大型卷积内核有效地捕获体积上下文,避免了过多的计算需求。D-LKA Attention 还受益于可变形卷积,以适应不同的数据模式。 理论介绍 大核卷积(Large Kernel Convolu…

fpga系列 HDL:Quartus II PLL (Phase-Locked Loop) IP核 (Quartus II 18.0)

在 Quartus II 中使用 PLL (Phase-Locked Loop) 模块来将输入时钟分频或倍频,并生成多个相位偏移或频率不同的时钟信号: 1. 生成 PLL 模块 在 Quartus II 中: 打开 IP Components。 file:///C:/intelFPGA_lite/18.0/quartus/common/help/w…

JAVA:代理模式(Proxy Pattern)的技术指南

1、简述 代理模式(Proxy Pattern)是一种结构型设计模式,用于为其他对象提供一种代理,以控制对这个对象的访问。通过代理模式,我们可以在不修改目标对象代码的情况下扩展功能,满足特定的需求。 设计模式样例:https://gitee.com/lhdxhl/design-pattern-example.git 2、什…

3D Gaussian Splatting for Real-Time Radiance Field Rendering-简洁版

1. 研究背景与问题 传统的3D场景表示方法,如网格和点云,适合GPU加速的光栅化操作,但缺乏灵活性。而基于神经辐射场(NeRF)的表示方式,尽管质量高,但需要高成本的训练和渲染时间。此外&#xff0…

Unity性能优化---使用SpriteAtlas创建图集进行批次优化

在日常游戏开发中,UI是不可缺少的模块,而在UI中又使用着大量的图片,特别是2D游戏还有很多精灵图片存在,如果不加以处理,会导致很高的Batches,影响性能。 比如如下的例子: Batches是9&#xff0…

计算机网络知识点全梳理(三.TCP知识点总结)

目录 TCP基本概念 为什么需要TCP 什么是TCP 什么是TCP链接 如何唯一确定一个 TCP 连接 TCP三次握手 握手流程 为什么是三次握手,而不是两次、四次 为什么客户端和服务端的初始序列号 ISN 不同 既然 IP 层会分片,为什么 TCP 层还需要 MSS TCP四…

找出1000以内的所有回文数

找出1000以内的所有回文数 方法概述检查回文数的方法伪代码C代码实现代码解析运行结果在计算机科学中,回文数是一种具有对称性质的数,即从左向右读和从右向左读都是相同的。例如,121、1331、12321都是回文数。本文将利用数据结构、C语言和算法的知识来编写一个程序,找出100…

Go-FastDFS文件服务器一镜到底使用Docker安装

本文章介绍一镜到底安装go-fastdfs并配置数据文件到linux 由于国内镜像无法安装go-fastdfs:国内环境已经把docker官方的网站给封闭了 我们需要从国外的一台服务器,下载images镜像,然后进行转发加载到国内服务器 当然我也给你们准备了docke…

ArcGIS计算土地转移矩阵

在计算土地转移矩阵时,最常使用的方法就是在ArcGIS中将土地利用栅格数据转为矢量,然后采用叠加分析计算,但这种方法计算效率低。还有一种方法是采用ArcGIS中的栅格计算器,将一个年份的地类编号乘以个100或是1000再加上另一个年份的…

软路由系统 --- VMware安装与配置OpenWRT

目录: OpenWrt安装与配置 一、下载OpenWRT映像二、img转换vmdk格式三、创建虚拟机(OpenWRT)四、启动系统(OpenWRT)五、配置网络信息(LAN、WAN)六、登录OpenWRT后台管理界面 一、下载OpenWRT映像 OpenWrt映…

利用notepad++删除特定关键字所在的行

1、按组合键Ctrl H,查找模式选择 ‘正则表达式’,不选 ‘.匹配新行’ 2、查找目标输入 : ^.*关键字.*\r\n (不保留空行) ^.*关键字.*$ (保留空行)3、替换为:(空) 配置界面参考下图: ​​…

Moretl开箱即用日志采集

永久免费: 至Gitee下载 使用教程: Moretl使用说明 使用咨询: 用途 定时全量或增量采集工控机,电脑文件或日志. 优势 开箱即用: 解压直接运行.不需额外下载.管理设备: 后台统一管理客户端.无人值守: 客户端自启动,自更新.稳定安全: 架构简单,兼容性好,通过授权控制访问. 架…

Java中的全局异常捕获与处理

引言 Java编程中,异常情况是不可避免的,优秀的异常处理机制是保证程序稳定性和可靠性的重要因素,当程序出现异常的时候,如果没有进行适当的处理,可能导致程序崩溃,丢失数据等严重问题。全局异常捕获与处理可…