机器学习系列15：通过t-SNE可视化高维数据

机器学习系列15：通过t-SNE可视化高维数据

article2024/11/25 2:25:58/文章来源:https://blog.csdn.net/Gabriel100yi/article/details/135833684

t-SNE 的全称是 t-distributed stochastic neighbor embedding（t-分布随机领域嵌入），这是一种非线性降维技术。而 PCA 和 LDA 是线性的降维技术。

t-SNE 通常用来在二维或者三维空间中可视化复杂数据集。

简单来说，t-SNE 试图发现数据集中的样本在原始高维空间中距离的概率分布，然后再去低维空间中重建这种概率分布。我们通过 t-SNE 将高维空间中的数据点嵌入到了低维空间，同时还保留了数据点在高维空间中的距离关系。

不过 t-SNE 只能用于数据可视化，我们没法用训练集的数据去拟合一个 t-SNE 模型，然后将模型用于测试集，我们只能用整个数据集（训练集和测试集）去拟合 t-SNE 模型，然后得到数据集的低维表示，并可视化。

我们现在就以著名的手写数字数据集为例，scikit-learn 自带了该数据集。

这个数据集中包含了 1797 张手写的 0 到 9 的数字图片，每张图片都是一个 8 x 8 的灰度图，如上图所示。

我们可以将 8 x 8 的灰度图展平成长为 64 的表示样本特征的向量。

现在我们将 64 维特征投影到了 2 维空间。

你可能注意到了我们使用了 PCA 初始化 t-SNE 嵌入。而且 t-SNE 还有很多额外的超参数，我们这里都使用了 scikit-learn 提供的默认值。

现在我们就在二维空间可视化这个手写数字数据集。y_digits 只被用来在可视化时标记不同的数据点族群，并没有参与到 t-SNE 的训练中。

我们可以看到 t-SNE 降维后，还是能够将表示不同数字的样本区分开，但是这种区分不是很完美，部分是因为我们使用了默认的超参数，部分是因为数据集本身的问题，比如这里图像的分辨率很低，手写的 3 和手写的 8 可能很相似。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/355367.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

idea中Spring项目yml文件注释中文乱码问题

idea中Spring项目yml文件注释中文乱码问题

idea中spring项目yml文件中文乱码问题，如图： 当出现这种情况一般就是idae的配置问题，解决起来也是非常简单的。按下面操作即可，如图： 解决方式： 1.进入设置 2.找到File Encodings，然后再将编…

阅读更多...

PWN 常用工具-补充

PWN 常用工具-补充

目录 pwndbg 如何加载文件如何运行到Main函数停止如何查看程序的内存布局查看内存地址存储的值如何查看某个地址存储的指令搜索字符串打印调试相关断点相关查看栈内数据查看栈调用顺序从程序回到gdb 修改内存中的值 file 可执行文件特征动态链接文…

阅读更多...

elementUI的el-select传递item对象或其他参数的2种方法

elementUI的el-select传递item对象或其他参数的2种方法

方法1 :value“item” 绑定对象只要:value绑定item对象就可以 value-key"value" 必须是item里的一个属性，绑定值为对象类型时必填 <el-select v-model"value" placeholder"请选择" value-key"value" change"cha…

阅读更多...

Day02-数据类型和运算符(基本数据类型转换,赋值运算符,算术运算符,关系运算符,逻辑运算符,条件运算符,位运算符,赋值运算符,运算符优先级,标点符号)

Day02-数据类型和运算符(基本数据类型转换,赋值运算符,算术运算符,关系运算符,逻辑运算符,条件运算符,位运算符,赋值运算符,运算符优先级,标点符号)

文章目录 Java基础语法学习目标1 基本数据类型转换（Conversion）（掌握）1.1 自动类型转换（隐式类型转换）1.2 强制类型转换（显式类型转换）1.3 基本数据类型与字符串类型的转换 2 运算符…

阅读更多...

一起玩儿Proteus仿真（C51）——01. 仿真软件Proteus和开发软件Keil C51的安装

一起玩儿Proteus仿真（C51）——01. 仿真软件Proteus和开发软件Keil C51的安装

摘要：本文介绍仿真软件Proteus和开发软件Keil C51的安装智能小车系列文章已经连续发布49期了。为了照顾更多读者的需求，从这周开始，新增加一个系列——Proteus仿真系列，这个系列的文章还是以一个个小的专题的形式，介绍…

阅读更多...

数据结构（二）------单链表

数据结构（二）------单链表

制作不易，三连支持一下呗！！！ 文章目录前言一.什么是链表二.链表的分类三.单链表的实现总结前言上一节，我们介绍了顺序表的实现与一些经典算法。但是顺序表这个数据结构依然有不少缺陷： 1.顺序表指定…

阅读更多...

（2）(2.9) Holybro Microhard P900无线电遥测设备

（2）(2.9) Holybro Microhard P900无线电遥测设备

文章目录前言 1 特点 2 规格 3 包装内包括前言 Holybro Microhard Radio 集成了 microhard Pico 系列射频模块，能够在强大的拓扑结构中提供高性能无线串行通信，如点对点、点对多点和安全 Mesh（P840 不提供 Mesh）。它采用跳…

阅读更多...

多线程之静态代理

多线程之静态代理

什么是静态代理？ 静态代理是一种思想，找一个代理负责一些琐事，自己则专注于一件大事。有哪些具体的表现？ 在日常生活中做饭就是这样，会做饭的人需要做饭，那么其他的人就来帮他打杂，这样做饭的…

阅读更多...

Sqli-labs-master第一关通关攻略

Sqli-labs-master第一关通关攻略

第一关基于错误的字符串/数字型注入第一关打开，请输入id数值作为参数，那就输呗整个1，2，3看看效果通过ID数值得变动，页面也随之发生变化，然后就是判断SQL语句是否拼接，是字符型还是数字型输入…

阅读更多...

DETR解读，将Transformer带入CV

DETR解读，将Transformer带入CV

论文出处 [2005.12872] End-to-End Object Detection with Transformers (arxiv.org) 一个前置知识匈牙利算法：来源于二部图匹配，计算最小或最大匹配算法操作：在n*n的矩阵中减去行列最小值，更新矩阵（此时行或者…

阅读更多...

（蓝桥杯每日一题）求最长回文串

（蓝桥杯每日一题）求最长回文串

问题描述给出一个长度为 n 的小写字符串，求一个最长的子串 S，满足SXY,X，Y>1，且X,Y 均为回文串。输入格式输入包括一行: 第一行是一个长度为 n 的小写字符串。输出格式输出包括一行： 一行一个整数，表…

阅读更多...

Java设计模式-享元模式（12）

Java设计模式-享元模式（12）

馆长准备了很多学习资料，其中包含java方面，jvm调优，spring / spring boot /spring cloud ，微服务，分布式，前端，js书籍资料，视频资料，以及各类常用软件工具，破解工具等资源。请关注“IT技术馆”公众号，进行关注，馆长会每天更新资源和更新技术文章等。请大家多多关注…

阅读更多...

Vue ECharts X轴 type为value的数据格式 + X轴固定间隔并向上取整十位数 - 附完整实例

Vue ECharts X轴 type为value的数据格式 + X轴固定间隔并向上取整十位数 - 附完整实例

echarts：一个基于 JavaScript 的开源可视化图表库。目录效果一、介绍 1、官方文档：Apache ECharts 2、官方示例二、准备工作 1、安装依赖包 2、示例版本三、使用步骤 1、在单页面引入 echarts 2、指定容器并设置容器宽高 3、数据处理&am…

阅读更多...

Java： javax.net.ssl.SSLPeerUnverifiedException: peer not authenticated

Java： javax.net.ssl.SSLPeerUnverifiedException: peer not authenticated

我们在平时练习的时候一般使用低版本的jdk来练习，以便了解不同版本jdk的区别，下面是我们练习中遇到的问题 >>> DefaultHttpClient mHttpClient new DefaultHttpClient(new BasicHttpParams()); ClientConnectionManager ccm mHttpClien…

阅读更多...

【Vite+Vue3+TS】基于Vite+Vue3+TypeScript+ESLint+Prettier+Stylelint搭建项目（亲测超详细）

【Vite+Vue3+TS】基于Vite+Vue3+TypeScript+ESLint+Prettier+Stylelint搭建项目（亲测超详细）

目录项目搭建步骤确定node版本使用Vite创建Vue3项目规范目录结构配置环境修改Vite配置文件集成路由工具Vue Router集成状态管理工具Pinia集成CSS预编译器Sassvite-plugin-svg-icons图标组件集成UI框架Element Plus集成HTTP 请求工具 Axios 项目代码规范集成ESLint配置集成Pre…

阅读更多...

docker环境搭建及其安装常用软件

centos安装docker Install Docker Engine on CentOS | Docker Docs 下载docker sudo yum install -y yum-utils sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo sudo yum install -y docker-ce docker-ce-cli containerd.io…

阅读更多...

Git学习，基础，安装，配置，笔记总结

Git学习，基础，安装，配置，笔记总结

Git安装与常用命令本教程里的git命令例子都是在Git Bash中演示的，会用到一些基本的linux命令，在此为大家提前列举： ls/ll 查看当前目录 cat 查看文件内容 touch 创建文件 vi vi编辑器（使用vi编辑器是为了方便展示效果，学员可以记事本、editPlus、notPad++等其它编辑…

阅读更多...

【YOLO系列算法俯视视角下舰船目标检测】

【YOLO系列算法俯视视角下舰船目标检测】

YOLO系列算法俯视视角下舰船目标检测数据集和模型YOLO系列算法俯视视角下舰船目标检测YOLO系列算法俯视视角下舰船目标检测可视化结果数据集和模型数据和模型下载： YOLOv6俯视视角下舰船目标检测训练好的舰船目标检测模型舰船目标检测数据YOLOv7俯视视角下舰船…

阅读更多...

ES6.8.6 为索引映射(Mapping)创建自定义分词器，测试分词匹配效果

ES6.8.6 为索引映射(Mapping)创建自定义分词器，测试分词匹配效果

文章目录环境创建索引：配置自定义分词器、字段指定分词器自定义分词器参数说明创建索引：custom_analyzer_comment 使用索引中自定义的分词器进行分词分析自定义分词器my_custom_analyzer分词测试：测试中文停用词、英文字母转小写测试敏感词替…

阅读更多...

Parquet文件推送数据到OSS

Parquet文件推送数据到OSS

1. 任务背景任务说明：公司 saas 数据分析类产品，客户需要把行为数据回传到客户指定文件系统中（oss）周期：T1数据格式：parquet数据范围：部分表全量，部分表增量其他要求： …

阅读更多...

最新文章