AutoEncoder简介

1.介绍

  • 作为一种无监督或者自监督算法,自编码器本质上是一种数据压缩算法自编码器流程图
  1. 编码器: 输入图像(在这个例子中是一个28x28像素的数字“9”)首先被输入到编码器中。编码器的任务是将这个输入压缩成一个更小的、密集的表示形式,称为“code”。这个code通常具有比原始输入更少的维度。在这里,784个像素被编码成了一个维度小于784的code。
  2. 解码器: 解码器主要目的是接收编码器生成的code,然后尝试重构原始输入图像。输出的图像应该尽可能接近原始图像,虽然可能会有一些失真。

总结: 自编码器的编码器和解码器部分通常是同时训练的,目的是让解码器能够尽可能准确地重建编码器的输出。这种类型的网络通常用于特征学习、降维和在无监督学习环境中的数据压缩。

2.特点

  1. 数据相关性: 就是指自编码器只能压缩与自己此前训练数据类似的数据,比如说我们使用mnist训练出来的自编码器用来压缩人脸图片,效果肯定会很差。
  2. 数据有损性: 自编码器在解压时得到的输出与原始输入相比会有信息损失,所以自编码器是一种数据有损的压缩算法。
  3. 自动学习性: 自动编码器是从数据样本中自动学习的,这意味着很容易对指定类的输入训练出一种特定的编码器,而不需要完成任何新工作。

用数学的方式解释编码器和解码器:

  • 编码器将输入压缩为潜在空间表征,编码器会创建一个隐藏层(或多个隐藏层)包含了输入数据含义的低维向量。可以用函数 f(x) 来表示。
  • 解码器将潜在空间表征重构为输出,即通过隐藏层的低维向量重建输入数据。可以用函数 g(x) 来表示。

请添加图片描述

能否用作自然语言的降维:
自编码器的主要目的是进行数据压缩特征学习。通过一个编码器将数据压缩成一个低维的表示(code),然后通过一个解码器尝试重构原始数据。这种过程通常是有损的,目的是捕捉数据中最重要的特征。因此它不能用作自然语言的语句匹配和语义搜索。

学习数据的低维表示: 自动编码器设计的核心是学习输入数据的有效的低维表示。这种表示主要用于数据压缩、去噪、特征提取等,而不是为了理解或比较文本的语义内容。
缺乏语义理解能力: 自动编码器在其基本形式中,并不包括对数据的语义理解。它们通过最小化输入与输出之间的重建误差来学习,这主要关注于数据的表面特征,而非其语义意义。
句子匹配需要上下文理解: 句子匹配和语义搜索通常需要理解句子中的上下文和语义信息。自动编码器的结构并不适合捕获长距离的依赖关系和复杂的语言结构,这对于准确的句子匹配至关重要。
更合适的替代模型: 对于句子匹配任务,向量空间模型(如TF-IDF)、机器学习分类模型(如支持向量机),以及特别是基于变换器(Transformer)的深度学习模型(如BERT)等技术,能够更好地处理语义信息。这些模型通过学习词与词之间的关系和句子的结构,能够更有效地进行句子间的语义比较和匹配。

AutoEncoder(自编码器)与PCA(主成分分析)降维效果对比:

  1. AutoEncoder是一种神经网络,这种神经网络的目标输出就是其输入。自动编码器属于神经网络家族,但它们也和 PCA(主成分分析)紧密相关。【自编码器的目标是学习函数h(x)约等于x】
  2. AutoEncoder既能表征线性变换,也能表征非线性变换;而 PCA 只能执行线性变换。【因为自编码器的网络表示结构:非线性函数的叠加可以使其变成任意复杂的函数】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/747867.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux系统安装Lua语言及Lua外部库

安装Lua Lua语言是一种轻量级、高效且可扩展的脚本语言,具有简洁易学的语法和占用资源少的特点。它支持动态类型,提供了丰富的表达式和运算符,同时具备自动垃圾回收机制和跨平台性。Lua语言易于嵌入到其他应用程序中,并可与其他语…

Websocket在Java中的实践——握手拦截器

在《Websocket在Java中的实践——最小可行案例》一文中,我们看到如何用最简单的方式实现Websocket通信。本文中,我们将介绍如何在握手前后进行干涉,以定制一些特殊需求。 在《Websocket在Java中的实践——最小可行案例》的基础上,…

我在高职教STM32——GPIO入门之按键输入(1)

大家好,我是老耿,高职青椒一枚,一直从事单片机、嵌入式、物联网等课程的教学。对于高职的学生层次,同行应该都懂的,老师在课堂上教学几乎是没什么成就感的。正因如此,才有了借助 CSDN 平台寻求认同感和成就…

ELK集群设置密码

一、软件安装清单 elasticsearch7.17.22logstash7.17.22kibana:7.17.22filebeat7.17.22elasticsearch-head:5 二、配置 生成证书 进入elasticsearch容器 bin/elasticsearch-certutil cert -out /usr/share/elasticsearch/config/elastic-certificates.p12 -pass将证书拷贝…

AI职场调研 - 被AI替代的工作分析报告

研究背景 随着人工智能(AI)技术的快速发展,其在职场中的应用日益广泛,引发了对工作被AI替代的担忧。本研究旨在分析在自由职业市场中,哪些工作更有可能被AI替代,并探讨AI对工作市场的实际影响。 研究目标 识别最有可能被AI替代…

OAuth2.0 三方登录(Google登录)

一、OAuth2.0流程 (A)客户端向从资源所有者请求授权。(B)客户端收到授权许可,资源所有者给客户端颁发授权许可(比如授权码code)(C)客户端与授权服务器进行身份认证并出示…

docker部署FastDFS整合Springboot

文章目录 1、FastDFS是什么?2、搭建docker环境3、部署fastdfs4、整合springboot5、接口测试参考文章 1、FastDFS是什么? FastDFS是一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文…

网易Filmly网盘影片播放器安卓TV版

我们在观看网盘内的影视时,想要高清/原画质观看视频,甚至倍速功能往往都需要开通网盘会员才可以,否则你只能使用”马赛克”画质观看。 最近网易上线了一款播放器:Filmly ,它支持直连网盘影视资源,可以高速…

栈,ASCII编码

栈 LinkedList stack new LinkedList<>(); int i 0; while (i < s.length()) { char c s.charAt(i); if (c <) {if (stack.isEmpty()) {i;continue;}stack.removeLast(); //从栈的末尾移除一个元素} else {stack.addLast(c); //压入栈的末尾栈是只允许在一端…

JCR一区级 | Matlab实现BO-Transformer-LSTM多变量回归预测

JCR一区级 | Matlab实现BO-Transformer-LSTM多变量回归预测 目录 JCR一区级 | Matlab实现BO-Transformer-LSTM多变量回归预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现BO-Transformer-LSTM多变量回归预测&#xff0c;贝叶斯优化Transformer结合LSTM长…

论文翻译 | ITER-RETGEN:利用迭代检索生成协同增强检索增强的大型语言模型

论文地址&#xff1a;Enhancing Retrieval-Augmented Large Language Models with Iterative Retrieval-Generation Synergy 摘要 检索增强生成由于有望解决包括过时知识和幻觉在内的大型语言模型的局限性而引起广泛关注。然而&#xff0c;检索器很难捕捉相关性&#xff0c;尤…

ce学习第一天(例行性工作,chrony服务时间同步,两台服务器免密登录)

1、Linux 的例行性工作 1.1单一执行的例行性工作 at 单一执行的例行性工作&#xff1a;单一执行的例行性工作&#xff1a;仅处理执行一次就结束了&#xff0c;at -> atd 1.1.1 at 命令的实际工作过程 1、我们使用 at 命令来生成所要运行的工作&#xff0c;并将这个工作&a…

从中序与后序遍历序列构造二叉树-二叉树题型

106. 从中序与后序遍历序列构造二叉树 - 力扣&#xff08;LeetCode&#xff09; right要再left前面 如下如&#xff0c;后序为第一行&#xff0c;最后一个是根&#xff1b; 中序为第二行&#xff0c;中间的为根&#xff1b; 通过后序的最后一个元素从中序中找到根&#xff0…

935.骑士拨号器 - 力扣

935.骑士拨号器 - 力扣 题目链接&#xff1a;935. 骑士拨号器 - 力扣&#xff08;LeetCode&#xff09; 题目&#xff1a; 示例 1&#xff1a; 输入&#xff1a;n 1 输出&#xff1a;10 解释&#xff1a;我们需要拨一个长度为1的数字&#xff0c;所以把骑士放在10个单元格中…

24/06/26(1.1129)动态内存

strtok 字符串分割函数 #include<stdio.h> int main(){ char str[] "this,a sample string."; char* sep ","; char* pch strtok(str, sep); printf("%s\n", pch); while (pch ! NULL){ printf("%s\…

Power BI 占比函数

1&#xff0c;普通层级结构占比 占比1 DIVIDE([sum_qty], CALCULATE([sum_qty],ALLSELECTED(Item[ITEM_CODE]))) //按照line为一个整理展示数据占比2 SWITCH( true(),ISINSCOPE(Item[ITEM_CODE]),DIVIDE([sum_qty], CALCULATE([sum_qty],ALLSELECTED(Item[ITEM_CODE]))), IS…

说说MQ在你项目中的应用(二)商品支付

看了不少关于MQ的文章&#xff0c;也对MQ的作用做了一些总结。通常来说MQ有三大功能&#xff1a;异步处理、系统解耦和流量削峰。但我觉得这些功能本质上都是围绕着异步这个核心来的&#xff0c;只是针对不同的业务场景做了些调整。 现在市面上常用的MQ中间件&#xff0c;如Ra…

Go语言之函数和方法

个人网站&#xff1a; http://hardyfish.top/ 免费书籍分享&#xff1a; 资料链接&#xff1a;https://url81.ctfile.com/d/57345181-61545511-81795b?p3899 访问密码&#xff1a;3899 免费专栏分享&#xff1a; 资料链接&#xff1a;https://url81.ctfile.com/d/57345181-6…

Java进阶-Lambda

Java进阶-Lambda 前言Lambda表达式什么是Lambda表达式初识Lambda表达式Lambda表达式的简单使用Lambda表达式格式分析与传统接口方法实现的比较 理解Lambda表达式函数式编程非纯函数实例纯函数示例函数式编程在Lambda表达式中的体现 闭包闭包与Lambda表达式的示例 类型推导-匿名…

【D3.js in Action 3 精译】1.2.2 可缩放矢量图形(一)

译注 由于 1.2.2 小节介绍 SVG 的篇幅过多&#xff0c;为了方便查阅&#xff0c;后续将分多个小节依次进行翻译。为了确保整个 1.2.2 小节的完整性&#xff0c;特意将上一篇包含的 SVG 小节的内容整理出来重新编排。敬请留意。 1.2.2 SVG - 可缩放矢量图形 可伸缩矢量图形&…