12种相关系数汇总,别再以为只有皮尔逊了!

所谓相关关系是指2个或2个以上变量取值之间在某种意义下所存在的规律,其目的在于探索数据集所存在隐藏的关系网,在19世纪80年代,Galton通过研究人类身高遗传问题首次提出了相关的概念,文中指出相关关系可以定义为:一个变量变化时,另一个变量或多或少的相应的变量。这种相关关系的统计量称为相关关系。相关分析不只有我们常用的pearson相关,还有其它相关系数等等,本篇文章为大家梳理都有哪些相关系数。

一、两个变量

1、Pearson相关

Pearson相关分析的说明:

pearson 法则是一种经典的相关系数计算方法,主要用于表征线性相关性,假设2个变量服 从正态分布且标准差不为0,他的值介于-1到1之间,pearson相关系数的绝对值越接近于1,表明 2个变量的相关程度越高,即这2个变量越相似。

Pearson相关分析的计算:

其相关系数计算如下:

Pearson相关分析的操作:

以SPSSAU为例,pearson相关系数路径【通用方法】→【相关分析】

分析前选择“pearson相关系数”按钮即可,au这里有提供两个分析项放置框,第二个分析项放置框可以不放置分析项为可选项,如果将分析项放置两个框和一个框内,结果不会改变,但是结果的表现形式会些许不一致,建议根据所需进行选择即可。

Pearson相关分析系数判断:

不同的文献相关系数的判断标准不同,如果在分析中,建议以及所参考的文献等进行参考,比如上面的文献就来自于贾俊平, 何晓群, 金勇进. 统计学.第7版[M]. 中国人民大学出版社, 2018.

Pearson的一般结果:

一般结果会提供相关系数以及p值等,可以根据p值结合相关系数进行分析,若p值小于显著性水平(比如显著性水平为0.05)则拒绝原假设,该模型显著,具有相关关系。反之,接受原假设,不具有相关关系。

2、Spearman相关

spearman相关分析的说明:

Spearman 相关性分析是对两组变量的等级大小作相关性分析,从而得到一个自变量与因变量之间的关系和自变量对因变量的影响强弱。它首先将两组变量的数据按照大小顺序排列,然后用等级代替原始数据,最后计算等级之间的相关性。

spearman相关分析的计算:

设自变量 X 和 Y 的 2 个随机样本为 ( x1 ,y1 ),⋯,( xn ,yn ),将 x1 ,⋯,xn和 y1 ,⋯,yn按升序方式进行排列,则X和Y的spearman秩相关系数为:

spearman相关分析的操作:

以SPSSAU为例,pearson相关系数路径【通用方法】→【相关分析】

spearman相关分析系数判断:

Spearman相关系数范围为-1——1,小于0代表负相关,大于0代表正相关,等于0则代表不存在相关关系。相关系数绝对值越接近0,相关关系越弱;绝对值越接近1,证明相关关系越强。

spearman的一般结果:

一般结果会提供相关系数(此相关系数为spearman相关系数)以及p值等,可以根据p值结合相关系数进行分析,若p值小于显著性水平(比如显著性水平为0.05)则拒绝原假设,该模型显著,具有相关关系。反之,接受原假设,不具有相关关系。

3、Kendall等级相关

kendall相关分析的说明:

kendall相关系数也叫kendall秩相关系数,广泛用于量化不同变量间的相关程度,作为一类无参数假设检验,用于衡量两变量之间的相关性,其并不要求数据满足正态分布,对于样本容量也没有过多要求,适用性比较广。

kendall相关分析的分类:

kendall相关系数常见的有 tau-a、tau-b、tau-c,除此之外还有tub_b等等。其中tau-a未对数据中的结做校正,tau-b对数据中的结做校正,tau-c适用于两列变量尺度不相等的情况。tub_b适合两个变量为定量变量。

kendall相关分析的操作:

这里以kendall tub_b为例,操作路径【通用方法】→相关分析;

kendall相关分析系数判断:

kendall相关系数取值范围介于-1到1之间,其中绝对值越接近于1说明相关性越强,越接近于0说明相关性越弱。

kendall的一般结果:

以kendall tub_b为例,结果如下:

分析结果一般提供kendall相关系数和p值,可以根据p值结合相关系数进行分析,若p值小于显著性水平(比如显著性水平为0.05)则拒绝原假设,该模型显著,具有相关关系。反之,接受原假设,不具有相关关系。

4、Hoeffding’D相关系数

Hoeffding相关分析的说明:

Hoeffding’D是由Wassily Hoeffding在1948年提出的,用于衡量两个变量之间的相关关系。

Hoeffding相关分析的计算:

其计算公式如下:

Hoeffding相关分析系数判断:

Hoeffding’D相关系数取值范围介于-1到1之间,其中绝对值越接近于1说明相关性越强,越接近于0说明相关性越弱。

二、多个变量

1、偏相关

偏相关分析的说明:

相关分析用于研究两两变量之间的关系情况,如果有第三个变量会干扰到分析结果,也就是我们常说的控制变量,这是控制变量也需要考虑在模型内,比如研究身高与肺活量之间的关系,如果直接进行相关分析,会出现有相关关系,但真实结论很可能并不应该这样,同样身高的人肺活量很可能明显不一样,原因是体重并不一样。所以此时在分析时需要将体重考虑在内,此种情况下适合使用的为偏相关。

偏相关分析的计算:

以au为例,其原理计算与pearson相关系数的计算一致:

偏相关分析的操作:

分析路径【进阶方法】→【偏相关】;

偏相关分析系数判断:

其判断也与pearson相关系数的判断标准类似:

偏相关的一般结果:

SPSSAU分析建议如下:

SPSSAU分析建议如下:

2、散点图

散点图的说明:

散点图是一种以点的分布反映变量之间的相关情况的统计图,根据散点图中的各点分布走向和密集程度,可以大致判断变量之间的相互关系。

散点图的操作:

以SPSSAU为例,pearson相关系数路径【可视化】→【散点图】

将左侧分析项拖拽到右侧分析框内,选择相应参数,点击开始分析,其中“bins”为一种散点数据处理方式,当散点过多时可通过bins处理更清晰的查看散点数据关系情况,当散点数量>1000时,SPSSAU自动会进行bins处理(bins=100),与此同时,研究者也可自主设置bins数量。“矩阵排列图”当自变量不止一项时,勾选矩阵排列图,结果会默认提供不同自变量的散点图排列图,比如:

散点图应用场景:

  • 观测数据是否有异常值

如果数据明显偏离数据群,判定其可能为异常值(偏主观);比如:

  • 观测两个变量之间的关系(变化趋势)

其中包括正相关、负相关、不相关,比如正相关:

两个变化趋势相同。

散点图的一般结果:

一般用于相关分析之前,通过图示化查看两个变量之间的基本关系,分析上偏主观,一般还需要结合相关分析进一步分析,比如如图所示,散点整体比较杂乱,并没有什么特别趋势,所以两个变量可能不相关,具体可以查看相关分析进行查看相关系数以及p值等。

三、两组变量

1、典型相关

典型相关分析的说明:

典型相关分析简称CAA,用于研究一组X与另一组Y数据之间的相关关系情况。如果研究1个X和1个Y之间的关系情况,此时直接使用相关分析即可,但如果希望研究1组X和1组Y之间的关系情况,则需要使用典型相关分析。

典型相关分析的操作:

分析路径【进阶方法】→【典型相关】;

典型相关分析的步骤:

一般步骤分为三步:

Step1:提取出典型相关变量;

Step2:寻找典型变量与研究变量之间的关系表达式,以及典型变量与研究变量间的关系情况;

Step3:典型冗余分析。

典型相关分析系数判断:

典型相关系数介于-1-1之间,绝对值越接近于1说明相关行越强,绝对值越接近于0说明相关性越弱,分析时还是要结合p值一起分析。

典型的一般结果:

中间过程:

除此之外也提供了典型系数(Y组)。

四、整个模型

1、KMO检验

KMO值的说明:

KMO值是用来判断所选取变量在因素分析中的可接受程度,考察变量之间相关关系,KMO值应用于很多方法中,比如进行探索性因子分析,第一步需要通过KMO和巴特利特检验进行测量问卷量表进而决定是否适合进行因子分析等等。

KMO值的计算:

KMO值的计算如下:

KMO值的操作:

很多方法都有提及到KMO值,比如因子分析、主成分分析等,这里以探索性因子分析作为例子进行演示操作:

默认结果有提供KMO值检验结果。

KMO值判断标准:

kmo值的判断标准是怎么样的呢?

所以一般进行因子分析(主成分分析)需要kmo值大于0.6即可。

KMO值一般结果:

以探索性因子分析为例:

一般判断数据是否适合进行因子分析或者主成分分析,KMO 和 Bartlett 的检验是第一步,所以在KMO 和 Bartlett 的检验表格中上半部分为kmo值,下半部分为Bartlett 的检验,从表中可以看到kmo值大于0.6说明适合进行分析。

2、R方

R方的说明:

r方也被称为决定系数,是用来描述模型拟合程度的重要指标,R方测度了回归直线对观测数据的拟合程度,一般常用于回归分析中,在一元线性回归中,R2(R方)=Pearson相关系数的平方。

R方的计算:

R方的计算如下:

从图片中可以看出:

所以对于模型来讲肯定是能用回归直线解释的变差部分越大越好,也就是说明SSR占SST的比例越大,解释越多,同时也可以说明直线拟合的越好,所以我们引出一个指标R方,回归平方和占总平方和的比例,即为R方。计算公式为:

R方的操作:

以线性回归为例,操作如下:

R方判断:

R方的取值范围在【0,1】,同时根据计算公式,也可以得到,R方越接近1说明SSR占SST的占比越大,也就是说明模型拟合越好,反之,如果R方越接近1,说明SSR占SST的占比越小,被解释部分越少,模型拟合越差。

R方的一般结果:

SPSSAU线性回归结果默认有提供R方值,如下:

一个模型只有一个R方,如果在文献中看到有多个R方的结果,通常是由多次分析最后整合在一起的,如果模型仅关注于变量是否显著等,一般不需要过度关注R方值,但是如果是利用线性回归进行预测,可以关注下R方,具体以专业和研究目的为准。

3、Icc组内相关

ICC组内相关的说明:

ICC组内相关系数是一种用来检验观测值在多个观察者之间是否具有一致性,是一种常用的两阶标准化相关系数。

ICC组内相关的计算:

ICC=个体变异/总变异;

ICC组内相关的操作:

SPSSAU【实验/医学研究】→icc组内相关系数;

ICC组内相关判断:

ICC取值在0~1之间,通常情况下:

ICC <0.2则说明一致性程度较差;

0.2~0.4之间说明一致性程度一般;

0.4~0.6之间说明一致性程度中等;

0.6~0.8之间说明一致性程度较强;

0.8~1.0之间说明一致性程度很强。

ICC组内相关的一般结果:

一般会提供icc组内相关系数和95%CI等。

五、距离相关

距离相关系数用于测量两个变量之间的相关性指标,应用于多种分析方法中,比如聚类分析,一般相关系数越高,说明模型越好,常用的距离相关系数测量指标有很多,比如欧式距离,余弦距离等等。

1、欧氏距离

相关分析的计算:

�=∑�=1�(��−��)2

相关分析的操作:

以SPSS为例:

进行选择参数:

2、余弦距离

余弦距离是衡量两个向量之间相似程度的一种方法。它是通过计算两个向量之间的夹角来确定相似度的。夹角越小,余弦距离越接近1,表示两个向量越相似;夹角越大,余弦距离越接近0,表示两个向量越不相似。

余弦距离相关分析的计算:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/356869.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PGsql 解析json及json数组

创建测试数据 drop table if exists json_test; create table json_test as select 111 as id, {"nodes":{"1692328028076":{"nodeId":"1692328028076","nodeName":"测试表1","nodeType":"DATACO…

报错“MySql配置文件已损坏,请联系技术支持”的解决方法

目录 第一步 打开控制面板&#xff0c;选择管理工具&#xff0c;再选择事件查看器 第二步 在【应用程序】里找到这条报错&#xff0c;记下来文件内容。我自己的来源是“MsiInstaller” 第三步 winR组合键&#xff0c;输入regedit打开注册表 第四步 根据前面报错的文件名定位…

【网页设计期末】咖啡商城网页代码

本文资源&#xff1a;咖啡商城网页代码htmlCSSJavaScript_前端-CSDN问答 1.题目要求 用HTMLCSSJavaScript创建网站项目 说明:制作首页、登录页、列表页。要求: 1、首页页面结构:logo&#xff0c;导航&#xff0c;轮播&#xff0c;商品列表(九宫格结构&#xff0c; 每一格均含图…

如何过有「松弛感」的生活?

最近网上有一个词很流行&#xff0c;叫做「松弛感」。最早的出处似乎是这么一条微博&#xff1a;博主见到一家人出门旅游&#xff0c;行李全部被退回&#xff0c;空手抵达目的地&#xff0c;竟然没人紧张和生气&#xff0c;而是重新安排好行李后继续开心聊天&#xff0c;全程非…

Vue3使用setup-extend简化组件名写法

如果我们在Vue3中要使用setup的语法糖&#xff0c;就需要使用两个script标签&#xff0c;一个用于设置组件的name属性&#xff0c;一个用于编写setup中的代码。如下&#xff1a; 但是我们有觉得光是因为一个name属性就多写一个script标签有点麻烦了。 因此我们可以使用插件来进…

会话技术复习笔记

一.登录校验的需求 什么是登录校验&#xff1f; 所谓登录校验&#xff0c;指的是我们在服务器端接收到浏览器发送过来的请求之后&#xff0c;首先我们要对请求进行校验。先要校验一下用户登录了没有&#xff0c;如果用户已经登录了&#xff0c;就直接执行对应的业务操作就可以…

iOS 面试 Swift基础题

一、Swift 存储属性和计算属性比较&#xff1a; 存储型属性:用于存储一个常量或者变量 计算型属性: 计算性属性不直接存储值,而是用 get / set 来取值 和 赋值,可以操作其他属性的变化. 计算属性可以用于类、结构体和枚举&#xff0c;存储属性只能用于类和结构体。存储属性可…

爬虫学习笔记-get请求获取豆瓣电影排名多页数据★★★★★

1. 导入爬虫需要使用的包 import urllib.request import urllib.parse 2.创建请求函数 def create_request(page): # 定义不变的url部分 base_url https://movie.douban.com/j/chart/top_list?type5&interval_id100%3A90&action& # 根据规律定义data拼接url …

倒排索引的构建与查询

倒排索引是信息检索的重要技术&#xff0c;本文将基于中文短信数据&#xff08;数据集可在本文所附资源处下载或点击此处链接下载&#xff09;&#xff0c;编程构建倒排索引并实现布尔查询。 1. 功能设计 用户输入查询&#xff0c;按下回车键&#xff0c;如果该查询作为单独的…

宏景eHR FrCodeAddTreeServlet SQL注入漏洞

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…

微信小程序|摇骰子

目录 简介设计与功能需求确定用户界面设计确定摇骰子动画效果确定随机数生成算法编码实现实现摇骰子动画测试与优化进行功能测试进行性能测试说明简介 制作一个摇骰子小程序是一个有趣且具有挑战性的项目。通过这个项目,你可以学习如何运用编程技术来模拟骰子的摇动和结果显示…

Linux的bash命令语法

可用点 #!/bin/bash # 文件要以上面开始,.sh结尾的文件不需要# 赋权文件可执行权限 chmod x <fileName># 获取java jar包启动的进程id ps -ef | grep *.jar | grep -v grep | awk {print $2}shell变量 变量命令规则&#xff1a; 只能包含字母、数字、下划线&#xff1…

麒麟系统—— openKylin 安装 mongodb

麒麟系统—— openKylin 安装 mongodb 一、准备工作1. 确保麒麟系统 openKylin 已经安装完毕。 二、下载解压 MongoDB二、增加环境变量三、配置MongoDB创建数据目录创建日志文件运行 四、加入到服务中 MongoDB是一款高性能、开源的NoSQL数据库&#xff0c;因其灵活的数据结构、…

基于DistFlow潮流的配电网故障重构MATLAB程序

微❤关注“电气仔推送”获得资料&#xff08;专享优惠&#xff09; 简介 程序采用适用于辐射状网络的DistFlow潮流模型&#xff0c;可输入任意故障线路编号&#xff0c;得到优化重构结果。程序加入了辐射状和连续状约束&#xff0c;保证网络连通性和辐射性&#xff0c;改换成…

Linux CPU 负载说明

一、背景 工作中我们经常遇到CPU 负载高&#xff0c;CPU负载高意味着什么&#xff1f; CPU的负载是怎么计算的&#xff1f; top指令中的各个指标代表什么含义&#xff1f; 二、CPU 负载计算方法 在系统出现负载问题&#xff0c;通常会使用uptime和top确认负载&#xff0c;这两…

15、Kafka ------ SpringBoot 整合 Kafka (自动配置类 KafkaAutoConfiguration 源代码剖析)

目录 SpringBoot 整合 Kafka 的自动配置及源代码剖析Spring Boot 为 Kafka 提供的自动配置KafkaAutoConfiguration Kafka自动配置类源码解析1、自动配置类&#xff1a;KafkaAutoConfiguration 注解解析2、自动配置类&#xff1a;KafkaAutoConfiguration 配置的 bean1、KafkaTem…

2024 年, Web 前端开发趋势

希腊哲学家赫拉克利特认为&#xff0c;变化是生命中唯一不变的东西。这句话适用于我们的个人生活、行业和职业领域。 尤其是前端开发领域&#xff0c;新技术、开发趋势、库和框架不断涌现&#xff0c;变化并不陌生。最近发生的一些事件正在改变开发人员构建网站和 Web 应用的方…

mysql中的锁

按照锁的粒度分 表锁 表级锁&#xff0c;增删改操作时&#xff0c;会给正张表加锁&#xff1b; myisam支持表级锁&#xff0c;innodb中默认没有使用表锁&#xff0c; 特点&#xff1a;虽然加锁的开销小&#xff0c;但是并发性能低。 间隙锁 满足某些条件&#xff0c;获取…

Selenium教程11:模拟账号密码,自动登入qq空间

Python爬虫教程30&#xff1a;Selenium网页元素&#xff0c;定位的8种方法&#xff01; Selenium自动化教程02&#xff1a;浏览器options配置及常用的操作方法 Selenium自动化教程03&#xff1a;延时等待的3种方式 Selenium自动化教程04&#xff1a;鼠标键盘网页的模拟操作 …

AJAX进阶(重点)

目录 ◆ 同步代码和异步代码 ◆ 回调函数地狱和 Promise 链式调用 什么是回调函数地狱&#xff1f; Promise - 链式调用 什么是Promise链式调用&#xff1f; Promise 链式应用 &#xff08;重点&#xff09; ◆ async 和 await 使用 async函数和await_捕获错误 ◆ 事…