主成分分析例题 (多元统计分析期末复习)

例一

给定X的协差阵,对其进行主成分分析,

在这里插入图片描述
(1)求出每个主成分的贡献率;
(2)求出每个原始变量的信息提取率;


解:对于主成分分析的题,一般来说,题目给定一个协方差阵,不管怎样先求出特征值和特征向量。
Step1 计算特征根

∣ Σ − λ I ∣ |Σ-λI| ∣ΣλI=0,得: λ 1 λ_1 λ1=2, λ 2 λ_2 λ2=2, λ 3 λ_3 λ3=1 ( λ 1 λ_1 λ1 λ 2 λ_2 λ2 λ 3 λ_3 λ3
如果解出来不确定或者解不出来的话可以通过特征值的和等于协方差阵对角线元素的和以及特征值的积等于协方差阵对应的行列式来进行验证

Step2 求特征向量,这里一定不能忘记要化成单位特征向量

U 1 = [ 1 0 0 ] U_1=\left[ \begin{matrix} 1 \\ 0 \\ 0 \end{matrix} \right] U1= 100 U 2 = [ 0 1 2 1 2 ] U_2=\left[ \begin{matrix} 0 \\ {1 \over {\sqrt{2}} } \\ {1 \over {\sqrt{2}} } \end{matrix} \right] U2= 02 12 1 U 3 = [ 0 − 1 2 1 2 ] U_3=\left[ \begin{matrix} 0 \\ -{1 \over {\sqrt{2}} } \\ {1 \over {\sqrt{2}} } \end{matrix} \right] U3= 02 12 1

Step3 计算贡献率

第一个主成分的贡献率为: λ 1 λ_1 λ1/( λ 1 λ_1 λ1+ λ 2 λ_2 λ2+ λ 3 λ_3 λ3)=2/5=40%
第二个主成分的贡献率为: λ 2 λ_2 λ2/( λ 1 λ_1 λ1+ λ 2 λ_2 λ2+ λ 3 λ_3 λ3)=2/5=40%
第三个主成分的贡献率为: λ 3 λ_3 λ3/( λ 1 λ_1 λ1+ λ 2 λ_2 λ2+ λ 3 λ_3 λ3)=1/5=20%
(注意这里算的不是累积贡献率)所以我们取前两个主成分就可以了

Step4 求信息提取率

分别计算 x i x_i xi F 1 F_1 F1 F 2 F_2 F2的相关系数的平方,信息提取率为两者之和,
计算相关系数的公式如下
在这里插入图片描述
所以x1的信息提取率就是x1与 F 1 F_1 F1相关系数的平方加上x1与 F 2 F_2 F2相关系数的平方,其他原始变量同理。

x i x_i xi x i x_i xi F 1 F_1 F1相关系数的平方 x i x_i xi F 2 F_2 F2相关系数的平方信息提取率
1101
202/30.67
302/30.67

例二

x 1 x_1 x1 x 2 x_2 x2 x 3 x_3 x3协方差矩阵如下,试求主成分分析,并求出每个主成分的贡献率及每个原始变量的信息提取率
Σ = [ 1 − 2 0 − 2 5 0 0 0 2 ] Σ=\left[ \begin{matrix} 1 & -2 & 0 \\ -2 & 5 & 0 \\ 0 & 0 & 2 \end{matrix} \right] Σ= 120250002


解:
Step1 计算特征根

∣ Σ − λ I ∣ |Σ-λI| ∣ΣλI=0,得: λ 1 λ_1 λ1=5.83, λ 2 λ_2 λ2=2, λ 3 λ_3 λ3=0.17 ( λ 1 λ_1 λ1 λ 2 λ_2 λ2 λ 3 λ_3 λ3

Step2 求特征向量

U 1 = [ 0.383 − 0.924 0.000 ] U_1=\left[ \begin{matrix} 0.383 \\ -0.924 \\ 0.000 \end{matrix} \right] U1= 0.3830.9240.000 U 2 = [ 0 0 1 ] U_2=\left[ \begin{matrix} 0 \\ 0 \\ 1 \end{matrix} \right] U2= 001 U 3 = [ 0.924 0.383 0.000 ] U_3=\left[ \begin{matrix} 0.924 \\ 0.383 \\ 0.000 \end{matrix} \right] U3= 0.9240.3830.000

Step3 计算贡献率
第一个主成分的贡献率为: λ 1 λ_1 λ1/( λ 1 λ_1 λ1+ λ 2 λ_2 λ2+ λ 3 λ_3 λ3)=5.83/8=72.875%
第二个主成分的贡献率为: λ 2 λ_2 λ2/( λ 1 λ_1 λ1+ λ 2 λ_2 λ2+ λ 3 λ_3 λ3)=2/8=25%
第三个主成分的贡献率为: λ 3 λ_3 λ3/( λ 1 λ_1 λ1+ λ 2 λ_2 λ2+ λ 3 λ_3 λ3)=0.17/8=2.125%

Step4 求信息提取率
虽然第一个主成分的贡献率不小,但在本题中第一主成分不含第三个原始变量的信息,因此应该取两个主成分
所以分别计算 x i x_i xi F 1 F_1 F1 F 2 F_2 F2的相关系数的平方,信息提取率为两者之和

x i x_i xi x i x_i xi F 1 F_1 F1相关系数的平方 x i x_i xi F 2 F_2 F2相关系数的平方信息提取率
10.85500.855
20.99600.996
3011

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/205917.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

centos7 nginx_keepalived 在主备服务器上安装

脚本地址 https://gitcode.net/zengliguang/nginx_keepalived.git 文件说明keepalivedkeepalived的离线安装包nginx-1.24.0nginx的离线安装包centos7_keepalived_offline_install_backup.shkeepalved安装脚本,备服务器安装 centos7_keepalived_offline_install_mas…

深入解析 Python 中 Parsel 的两种数据提取方式

更多资料获取 📚 个人网站:ipengtao.com 在网络爬虫的世界中,数据提取是至关重要的一环。Python 提供了许多强大的工具,其中之一就是 parsel 库,专门用于解析和提取 HTML 或 XML 数据。本篇博客将深入探讨 parsel 中两…

Memcached最新2023年面试题,高级面试题及附答案解析

文章目录 01、Memcached是什么,有什么作用?02、Memcached的多线程是什么?如何使用它们?03、Memcached与Redis的区别?04、如果缓存数据在导出导入之间过期了,怎么处理这些数据呢?05、如何实现集群…

机器学习入门(第五天)——决策树(每次选一边)

Decision tree 知识树 Knowledge tree 一个小故事 A story 挑苹果: 根据这些特征,如颜色是否是红色、硬度是否是硬、香味是否是香,如果全部满足绝对是好苹果,或者红色硬但是无味也是好苹果,从上图可以看出来&#…

传教士与野人过河问题

代码模块参考文章:传教士与野人过河问题(numpy、pandas)_python过河问题_醉蕤的博客-CSDN博客 问题描述 一般的传教士和野人问题(Missionaries and Cannibals):有N个传教士和C个野人来到河边准 备渡河。…

vscode集成git

1、首先电脑要安装git 打开git官网地址:Git进行下载,如下图界面: 如图片中描述:一般进入官网后会识别电脑对应系统(识别出了我的电脑是Windows系统 。如果未识别到电脑系统,可在左侧选择自己电脑对应的系统…

Maven——使用Nexus创建私服

私服不是Maven的核心概念,它仅仅是一种衍生出来的特殊的Maven仓库。通过建立自己的私服,就可以降低中央仓库负荷、节省外网带宽、加速Maven构建、自己部署构件等,从而高效地使用Maven。 有三种专门的Maven仓库管理软件可以用来帮助大家建立…

vue3使用动态component

使用场景: 多个组件通过component标签挂载在同一个组件中,通过触发时间进行动态切换。vue3与vue2用法不一样,这里有坑! 使用方法: 1.通过vue的defineAsyncComponent实现挂载组件 2.component中的is属性 父组件&am…

deque容器结构学习笔记

1.结构图 2.deque对比vector和list deque双端队列,就像是list和vector的结合 vector: 优点:1.可以随机读取 2. 空间利用率高 缺点:1. 除了尾插尾删,其他插入删除效率比较低 2. 扩容效率低 list: 优点&…

第16关 革新云计算:如何利用弹性容器与托管K8S实现极速服务POD扩缩容

------> 课程视频同步分享在今日头条和B站 天下武功,唯快不破! 大家好,我是博哥爱运维。这节课给大家讲下云平台的弹性容器实例怎么结合其托管K8S,使用混合服务架构,带来极致扩缩容快感。 下面是全球主流云平台弹…

threeJs引入模型使用3D模型(vite+React+Ts)

要在 Three.js 中使用 3D 模型,你需要加载模型文件并将其添加到场景中。Three.js 支持多种不同的模型格式,比如 OBJ、FBX、GLTF 等。 init vitelatest //创建一个vite的脚手架 选择react并配置Ts 安装three.js准备 npm install react-three/drei np…

Ubuntu Server 20.04.6下Anaconda3安装Pytorch

环境 Ubuntu 20.04.6 LTS Anaconda3-2023.09-0-Linux-x86_64.sh conda 23.7.4 Pytorch 1.11.0 安装 先创建一个工作环境,环境名叫lia: conda create -n lia python3.8环境的使用方法如下: conda activate lia # 激活环境 conda deactiv…

2021年8月18日 Go生态洞察:整合Go的网络体验

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

ps 透明印章制作

ps 透明印章制作 1、打开不透明印章2、抠出红色印章3、新建图层4、填充红色印章到新图层5、导出透明印章 1、打开不透明印章 打开ps软件,菜单栏选择 文件-打开 选择本地不透明印章 打开 2、抠出红色印章 ps菜单栏 选择 选择-色彩范围 点击色彩范围 色彩范围窗口 取…

13.单调栈(接雨水、柱状图最大矩形)【灵神基础精讲】

单调栈【灵神基础精讲】 https://www.bilibili.com/video/BV1VN411J7S7/ 单调栈和单调队列的关系:单调队列单调栈滑窗 单调栈,顾名思义就是栈内元素单调按照递增(递减)顺序排列的栈。 适用问题:单调栈分为单调递增栈和单调递减栈&#xff0c…

在Linux上安装KVM虚拟机

一、搭建KVM环境 KVM(Kernel-based Virtual Machine)是一个基于内核的系统虚拟化模块,从Linux内核版本2.6.20开始,各大Linux发行版就已经将其集成于发行版中。KVM与Xen等虚拟化相比,需要硬件支持的完全虚拟化。KVM由内…

Nginx实现(动静分离)

动静分离应该是听的次数较多的性能优化方案,那先思考一个问题:「「为什么需要做动静分离呢?它带来的好处是什么?」」 其实这个问题也并不难回答,当你搞懂了网站的本质后,自然就理解了动静分离的重要性。先来…

设计模式之装饰模式(2)--有意思的想法

目录 背景概述概念角色 基本代码分析❀❀花样重难点聚合关系认贼作父和认孙做父客户端的优化及好处继承到设计模式的演变过程 总结 背景 这是我第二次写装饰模式,这一次是在上一次的基础上进一步探究装饰模式,这一次有了很多新的感受和想法,也…

如何提高销售技巧,增加客户的成交率?

如何提高销售技巧,增加客户的成交率? 在如今的市场环境中,销售技巧的高低往往决定了你是否能够成功地打动客户的心。想要提高销售业绩,除了产品质量和服务的保障,更需要你精进销售技巧,从而让客户愿意为你…

MySQL三大日志详细总结(redo log undo log binlog)

MySQL日志 包括事务日志(redolog undolog)慢查询日志,通用查询日志,二进制日志(binlog) 最为重要的就是binlog(归档日志)事务日志redolog(重做日志)undolog…