【机器学习】第9章 降维算法——PCA降维

一、概念

1.PCA

(1)主成分分析(Principal ComponentAnalysis,PCA)一种经典的线性降维分析算法。

(2)原理,这里以二维转一维为例,原来的平面变成了一条直线

这是三维变二维:

(3)方差越大,特征的重要程度越大;方差越小,特征的重要程度越小。

如上面的例子中,样本集合中的数据在旋转过后的新的y轴上的方差接近于0,几乎不携带任何信息量,故可将其省去,达到降维的目的。

(所谓找方差最大的方向,就是找长度,面积最大的那条线或者面,因为方差就是离散程度,就是分散程度)

(4)降维对数据的处理主要包含特征筛选特征提取

前者是裁员,后者排列组合。

2.实际问题往往需要研究多个特征,而这些特征存在一定的相关性。

(1)数据量增加了问题的复杂性。

(2)将多个特征综合为少数几个代表性特征:

(3)既能够代表原始特征的绝大数信息,组合后的特征又互不相关,降低相关性。

(4)PCA是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。

3.方差贡献率:

(1)具体量化保留几个主成分往往根据实际情况通过计算累计方差贡献率来决定。

(2)方差的方差贡献率又称为解释方差(explained variance),

(人话就是说这个成分有多大用处)

3.PCA算法步骤:

(1)用特征值表示哪个重要,越大越重要。

(2)特征值是由协方差矩阵求得。

(3)协方差就是数据相关程度,接近1是正相关,接近-1是负相关,0是不相关。

二、习题

单选题

3. 以下属于典型的监督学习的是( C

A、聚类  

B、关联分析  

C、分类  

D、降维  

18. 以下属于典型的无监督学习的是(C

A、支持向量机  

B、k-近邻算法  

C、降维  

D、逻辑回归  

判断题

2. 降维、聚类是无监督学习算法。(P

16. 降维的目的就是降低数据的维度从而方便后续对数据的储存、可视化、建模等操作。(P

17. 特征提取是指对现有特征进行重新组合产生新的特征,例如相对于年龄,出生年月就是冗余特征。(Í

裁员是特征筛选

18. 对于n维特征变量中的每个子变量,主成分分析使用样本集合中对应子变量上取值的方差来表示该特征的重要程度。方差越小,特征的重要程度越高;方差越大,特征的重要程度越低。(Í

方差越大,特征的重要程度越大;方差越小,特征的重要程度越小。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/722836.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

git 基本命令

列出分支基本命令: git branch 如果我们要手动创建一个分支 。执行 git branch (branchname) 即可: git branch testing 切换到testing分支: git checkout testing 我们也可以使用 git checkout -b (branchname) 命令来创建新分支并立…

1504 - Java多线程面试题

少年,思无邪,最最动人。 1.Java中有哪几种创建线程的方式 1.1 继承Thread类 代码示例 class HelloWorld01 extends Thread{Overridepublic void run() {System.out.println("这是继承 Thread 类方式实现多线程!");} }public class CreateTh…

Redis 高可用 sentinel

简介 Sentinel提供了一种高可用方案来抵抗节点故障,当故障发生时Redis集群可以自动进行主从切换,程序可以不用重启。 Redis Sentinel集群可以看成是一个Zookeeper集群,他是Redis集群高可用的心脏,一般由3-5个节点组成&#xff0…

从“产品的RFM分析”看如何探索“职业方向”

我们在做产品分析时,经常会用到一种方法“产品的RFM分析”,它是一种客户细分和价值评估的常用方法,广泛应用于电子商务、零售和其他众多行业,它可以帮助企业和产品团队更好地理解用户行为,优化营销策略,提升…

python发邮件给多人的注意事项?如何群发?

python发邮件给多人的效率如何?python发邮件的方法? 在利用Python编程语言实现邮件群发功能时,需要注意许多细节,以确保邮件能有效送达且用户体验良好。AokSend将详细探讨python发邮件给多人时需要注意的各个方面,以帮…

2024年历史、文学与人文艺术国际会议(ICHLH 2024)

2024年历史、文学与人文艺术国际会议(ICHLH 2024) 2024 International Conference on History, Literature, and Humanities 【重要信息】 大会地点:兰州 大会官网:http://www.ichlh.com 投稿邮箱:ichlhsub-conf.com 【…

【第10章】Vue之Element Plus常用组件

文章目录 前言一、表格1. 带斑马纹表格2. 展示 二、分页1.国际化(中文)2.分页代码3. 展示 三、表单1. 表单代码2. 展示 四、卡片1. 卡片代码2. 展示 总结 前言 通过上一章的快速入门,我们已经学习了按钮使用,接下来学习Element Plus的常用组件&#xff…

02-QWebEngineView的使用

Qt WebEngine_hitzsf的博客-CSDN博客 一、QWebEngineView QWebEngineView 类是一个实现Web浏览器的便捷类,提供了back() 、forward()、reload()、stop() 等方法,可轻松实现页面的前进、后退、重载等导航功能,要实现一个简单的只有网页加载网…

手机网站制作软件是哪些

手机网站制作软件是一种用于设计、开发和创建适用于移动设备的网站的软件工具。随着移动互联网时代的到来,越来越多的用户开始使用手机浏览网页和进行在线交流,因此,手机网站制作软件也逐渐成为了市场上的热门工具。 1. Adobe Dreamweaver&am…

前端某个页面乱码

项目场景: 提示:这里简述项目相关背景: springbootlayui,前后端一体 问题描述 提示:这里描述项目中遇到的问题: 某个页面访问中文乱码: 就是这种。 不是数据库的中文,而是html页…

docker回顾--docker compose详细解释,安装,与常用命令

文章目录 Docker compose简介什么是Docker compose核心概念优势 安装常用命令总结 Docker compose简介 什么是Docker compose Docker Compose 是一个用于定义和运行多容器 Docker 应用的工具。它使得开发者可以使用一个单独的 YAML 文件来定义应用所需的所有服务、网络和卷&a…

智慧之选:Vatee万腾平台,引领未来的创新引擎

在数字化浪潮席卷全球的今天,我们身处一个信息爆炸、技术革新的时代。在这样的大背景下,选择一个能够引领我们走向未来的平台显得尤为重要。而Vatee万腾平台,正是这样一个不容错过的智慧之选。 Vatee万腾平台,作为一个集创新、科技…

uni app 树状结构数据展示

树状数据展示&#xff0c;可以点击item 将点击数据给父组件 &#xff0c;满足自己需求。不喜勿喷&#xff0c;很简单可以根据自己需求改哈&#xff0c;不要问&#xff0c;点赞收藏就好 <template><view><view v-for"(node, index) in treeData" :ke…

汇凯金业:现货黄金锁单及解锁策略详解

在现货黄金交易中&#xff0c;锁单是一种常见的操作手法&#xff0c;目的是在市场波动中保护已有盈利或避免亏损扩大。锁单分为锁损单和锁盈单&#xff0c;虽然锁单可以暂时控制风险&#xff0c;但解单操作不当可能会导致更大的损失。本文将详细介绍现货黄金锁单的概念、锁单的…

深入探索Stable Diffusion:从原理到应用的全面解析

目录 一 Stable Diffusion的基本概念 什么是Stable Diffusion? Stable Diffusion与传统生成模型的区别 二 Stable Diffusion的理论基础 扩散过程的数学描述 马尔可夫链蒙特卡罗方法(MCMC) 三 Stable Diffusion的算法实现 基本步骤 代码实现 四 Stable Diffusion的…

springboot优雅shutdown时如何保障异步线程的安全

我前面写了一篇springboot优雅shutdown的文章&#xff0c;看起来一切很美好。 https://blog.csdn.net/chenshm/article/details/139640775 那是因为没有进行多线程测试。如果一个请求中包括阻塞线程&#xff08;主线程&#xff09;和非阻塞线程&#xff08;异步线程&#xff09…

抖音短剧看剧系统是怎么做的?怎么样搭建上线运营?

前言&#xff1a; 当前热门短剧已深入大家的日常&#xff0c;针对一些好的短剧更是吸金无数。今天给大家介绍一下短剧这个项目整个运作模式。 一、一部短剧是怎么样呈现到观众眼前的&#xff1f; 首先影视作品公司拍摄剪辑好短剧 &#xff0c;弄好一切审核后&#xff0c;放到…

[C#] opencvsharp对Mat数据进行序列化或者反序列化以及格式化输出

【简要介绍】 在OpenCVSharp中&#xff0c;FileStorage类用于将数据&#xff08;包括OpenCV的Mat类型数据&#xff09;序列化为XML或YAML格式的文件&#xff0c;以及从这些文件中反序列化数据。以下是关于FileStorage类用法的详细说明&#xff1a; 写入数据&#xff08;序列化…

【分布预测】DistPred:回归与预测的无分布概率推理方法

论文题目&#xff1a;DistPred: A Distribution-Free Probabilistic Inference Method for Regression and Forecasting 论文作者&#xff1a;Daojun Liang, Haixia Zhang&#xff0c;Dongfeng Yuan 论文地址&#xff1a;https://arxiv.org/abs/2406.11397 代码地址&#xff1a…

Mellanoxnvidia ib高速网络常用命令总结

1.spci&#xff1a;检查本地的pci设备。示例&#xff1a;lspci| grep -i mell 2.ofed_info&#xff1a;检测ofed驱动版本。示例&#xff1a;ofed_info-s 3.ibstat&#xff1a;查看本机的ib网卡状态。 4.mst&#xff1a;mellnoax软件管理工具。用来生成IB设备描述符。提供给其他…