学习笔记|Pearson皮尔逊相关系数|Spearman斯皮尔曼相关系数|和Kendall肯德尔tau-b相关系数|分析流程|-SPSS中双变量相关性分析系数

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 基础概念
    • 皮尔逊相关系数
      • 基本假设(适用条件):
      • 系数的范围及意义
      • 实例
        • 1. 读数据:
        • 2.正态性检验:
        • 3.异常值检验(体重):
        • 4.分析:
    • 斯皮尔曼相关系数
      • 基本假设(适用条件):
    • 肯德尔tau-b相关系数
      • 基本假设(适用条件):
  • 相关性系数的比较
    • 皮尔森相关与Spearman和Kendall相关
    • Spearman相关与Kendall相关

学习目的

SPSS中双变量相关性分析系数

软件版本

IBM SPSS Statistics 26。

原始文档

三个相关系数的注意事项
Pearson/Spearman/Kendallta三大相关系数怎么选?怎么计算?
《小白爱上SPSS》课程第18讲数据
Statistical functions (scipy.stats)包-scipy.stats.pearsonr
Statistical functions (scipy.stats)包-scipy.stats.spearmanr
Statistical functions (scipy.stats)包-scipy.stats.kendalltau
百度百科:spearman相关系数
相关性检验-Kendall’s Tau-b相关系数
Pearson’s Correlation 皮尔逊相关性分析详细操作

基础概念

皮尔逊相关系数

Pearson相关系数是传统的统计分析工具,应用广泛。Pearson相关系数公式:
在这里插入图片描述
但其有明显的理论局限,即只能度量线性的相关性,隐含地做了高斯性假设(正态分布、独立性假、方差齐性),使其无法在非线性和非高斯的情况下应用。

基本假设(适用条件):

每个观察值应具有一对值。比较的两个变量必须来源于同一个总体。
每个变量应该是连续的。
每个变量应为正态分布。
应该没有异常值。

系数的范围及意义

皮尔逊相关系数的范围是位于[-1,1]之间。相关系数展示了方向性:
如果相关系数接近1,说明两个变量之间呈较高的正相关性;
如果相关系数接近-1,说明两个变量之间呈较高的负相关性;
如果相关系数接近0,说明两个变量之间彼此独立,没有相关性。

实例

1. 读数据:
GET 
  FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十八讲:线性相关分析.sav'. 
2.正态性检验:
EXAMINE VARIABLES=体重 肺活量
  /PLOT HISTOGRAM NPPLOT /*若无此行,则不输出正态性检验表*/
  /COMPARE GROUPS 
  /STATISTICS DESCRIPTIVES 
  /CINTERVAL 95 
  /MISSING LISTWISE 
  /NOTOTAL.

在这里插入图片描述

在这里插入图片描述
经S-W(夏皮洛-威尔克)检验,体重、肺活量数据的p值分别为0.490和0.465,均大于0.05,无统计学意义,支持原假设,可认为两组数据符合正态分布。

3.异常值检验(体重):
USE ALL. 
COMPUTE filter_$=(体重 <= (49.308+3*5.3245)  &  体重 >= (49.308-3*5.3245)). 
VARIABLE LABELS filter_$ '体重 <= (49.308+3*5.3245)  &  体重 >= (49.308-3*5.3245) (FILTER)'. 
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'. 
FORMATS filter_$ (f1.0). 
FILTER BY filter_$. 
EXECUTE.

无异常值:
在这里插入图片描述
异常值检验(肺活量):

USE ALL. 
COMPUTE filter_$=(肺活量 <= (2.9342+3*.43383)  &  肺活量 >= (2.9342-3*.43383)). 
VARIABLE LABELS filter_$ '肺活量 <= (2.9342+3*.43383)  &  肺活量 >= (2.9342-3*.43383) (FILTER)'. 
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'. 
FORMATS filter_$ (f1.0). 
FILTER BY filter_$. 
EXECUTE.

无异常值:
在这里插入图片描述

4.分析:
CORRELATIONS 
  /VARIABLES=体重 肺活量 
  /PRINT=TWOTAIL NOSIG  /*显著性检验:双尾*/
  /STATISTICS DESCRIPTIVES /*选项中选定:平均值、标准偏差*/
  /MISSING=PAIRWISE	 /*皮尔逊*/.

在这里插入图片描述
皮尔逊相关性分析结果显示,P值显著性为0.001。P值小于0.05,说明示例的两个变量相关。相关性系数为0.828,离1比较近,也说明呈较高的正相关性。

斯皮尔曼相关系数

斯皮尔曼相关系数被定义成等级变量之间的皮尔逊相关系数。
对于样本容量为n的样本,n个原始数据被转换成等级数据,相关系数ρ为:
在这里插入图片描述
斯皮尔曼相关系数表明X(独立变量)和Y(依赖变量)的相关方向。如果当X增加时,Y趋向于增加,斯皮尔曼相关系数则为正。如果当X增加时,Y趋向于减少,斯皮尔曼相关系数则为负。斯皮尔曼相关系数为零表明当X增加时Y没有任何趋向性。当X和Y越来越接近完全的单调相关时,斯皮尔曼相关系数会在绝对值上增加。当X和Y完全单调相关时,斯皮尔曼相关系数的绝对值为1。完全的单调递增关系意味着任意两对数据Xi,Yi和Xj,Yj,有Xi−Xj和Yi−Yj总是同号。完全的单调递减关系意味着任意两对数据Xi,Yi和Xj,Yj,有Xi−Xj和Yi−Yj总是异号。
斯皮尔曼相关系数经常被称作"非参数"的。这里有两层含义。首先,当X和Y的关系是由任意单调函数描述的,则它们是完全皮尔逊相关的。与此相应的,皮尔逊相关系数只能给出由线性方程描述的X和Y的相关性。其次,斯皮尔曼不需要先验知识(也就是说,知道其参数)便可以准确获取XandY的采样概率分布。

基本假设(适用条件):

两对数据的观察是独立的。
应按序数,区间或比率测量两个变量。
假定两个变量之间存在单调关系。
皮尔逊Pearson相关系数使用前提条件中,任何一个条件不满足时可以考虑使用该系数;
Spearman与Pearson相关系数计算很类似,只是Spearman计算需要将两个变量转化为序数。

肯德尔tau-b相关系数

Kendall’s Tau相关系数,是由英国统计学家Maurice Kendall于1938年提出,主要包括Somers’ D、Goodman-kruskal’s gamma(γ)、Kendall’s Tau(a、b、c)等一系列相关系数。其中,最常用的是Kendall’s Tau-b和Kendall’s Tau-c相关系数。Kendall’s Tau相关系数适用于判断两列离散有序型数据之间的相关性,本文主要讲解Kendall’s Tau-b相关系数的计算。
在这里插入图片描述

基本假设(适用条件):

假设同spearman。但适应条件和前两者比完全不一样,衡量有序分类型数据的序数相关性。

相关性系数的比较

皮尔森相关与Spearman和Kendall相关

非参数相关(指 spearman和hendall)的表达能力相对较弱,因为它们在计算中使用的信息较少。在Pearson的情况下,相关性使用有关均值和均值偏差的信息,而非参数相关性仅使用序数信息和成对分数。
在非参数相关的情况下,X和Y值可能是连续的或有序的,并且不需要X和Y的近似正态分布。但在皮尔逊相关的情况下,它假定X和Y的分布应该是正态分布,并且也应该是连续的(因此做spearman之前要做一些对数变换之类的尽量接近正态分布)。
相关系数 测量线性(皮尔逊)或单调(Spearman和Kendall)关系。

Spearman相关与Kendall相关

在正常情况下,Kendall相关性比Spearman相关性更强健和有效。这意味着当样本量较小或存在一些异常值时,首选Kendall相关。
在所有情况下,Kendall相关系数的绝对值均小于其他绝对值。 可以看出,肯德尔相关性比其他相关性更为保守。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/124698.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Git的入门详细教程

&#x1f3c5;我是默&#xff0c;一个在CSDN分享笔记的博主。&#x1f4da;&#x1f4da; ​​ &#x1f31f;在这里&#xff0c;我要推荐给大家我的专栏《git》。&#x1f3af;&#x1f3af; &#x1f680;无论你是编程小白&#xff0c;还是有一定基础的程序员&#xff0c;这…

企业级,搭建接口自动化测试框架思路分析,8年测试老鸟整理...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 在选择接口测试自…

Vue3 学习笔记

vue3 官网&#xff1a;简介 | Vue.js (vuejs.org) 1. 环境搭建与启动 npm create vuelatest 这一指令将会安装并执行 create-vue&#xff0c;它是 Vue 官方的项目脚手架工具 之后&#xff0c;你将会看到一些诸如 TypeScript 和测试支持之类的可选功能提示&#xff1a; ✔ …

学习笔记|SPSS|描述变量|按照3倍标准差剔除异常值|标准化值另存为变量|剔除个案|Zscore|箱图|Zscore取值范围

目录 学习目的软件版本原始文档概述服从正态分布-按照3倍标准差剔除异常值读数据数据概览描述变量 正态性检验异常值检验及剔除 非正态分布-根据Zscore取值范围确定基础数据数据概览正态性检验Tips&#xff1a;箱图圆圈的含义 异常值检验及剔除描述变量&#xff0c;并将标准化值…

C语言C位出道心法(三):共用体|枚举

C语言C位出道心法(一):基础语法 C语言C位出道心法(二):结构体|结构体指针|链表 一: C语言共用体数据类型认知 二:C语言枚举基本数据类型认知 忙着去耍帅,后期补充完整.............

Verilog刷题[hdlbits] :Alwaysblock2

题目&#xff1a;Alwaysblock2 For hardware synthesis, there are two types of always blocks that are relevant: 对于硬件综合&#xff0c;有两种相关的always块&#xff1a; Combinational: always () 组合型&#xff1a;always ()Clocked: always (posedge clk) 时钟型…

Python实现图片与PDF互相转换

目录 图片转PDF文件夹所有图片转为1个PDF文件夹指定图片转为1个PDF文件夹所有图片分别转为PDF举例 PDF转图片指定PDF转为图片文件夹所有PDF转为图片举例 图片转PDF 之前的一篇博客《Python合并拼接图片》&#xff0c;可对图片进行合并拼接 使用前需要安装PyMuPDF库&#xff0c…

设置区块链节点输出等级为警告级,并把日志存储阈值位100MB并验证;

题目 获取指定区块链节点输出等级为警告级&#xff0c;并设置日志存储阈值位100MB并验证&#xff1b; 操作步骤 1.切换目录 cd nodes/127.0.0.1/node0 2.打开配置文件并修改 vim config.ini warn&#xff1a;警告

力扣最热一百题——每日温度

Python后面的文章&#xff0c;内容都比较多&#xff0c;但是同时我又想保持每天更新的速度&#xff0c;所以Python的文章我继续打磨打磨&#xff0c;先更新一篇算法的文章。 一身正气报国家&#xff0c;旁无乱境不恋她 ヾ(◍∇◍)&#xff89;&#xff9e; 力扣题号&#xff1a…

大语言模型比武

今年随着 ChatGPT 的流行&#xff0c;并在各个领域有一定程度生产级别的应用。国内外也掀起了一股大语言模型浪潮&#xff0c;各大厂商都推出了自己的大语言模型&#xff0c;阿里推出了 通义千问&#xff0c;腾讯推出了 Hunyuan&#xff0c;亚马逊云推出了 Titan&#xff0c;大…

微服务-grpc-consul-protoBuf-micro

微服务 一、微服务&#xff08;microservices&#xff09; 近几年,微服这个词闯入了我们的视线范围。在百度与谷歌中随便搜一搜也有几千万条的结果。那么&#xff0c;什么是微服务 呢&#xff1f;微服务的概念是怎么产生的呢&#xff1f; 我们就来了解一下Go语言与微服务的千丝…

C++ 断言

1.断言的概念 断言(assertion)是一种编程中常用的手段。在通常情况下&#xff0c;断言就是将一个返回值总是需要为真的判别式放在语句中&#xff0c;用于排除在设计的逻辑上不应该产生的情况。比如一个函数总需要输人在一定的范围内的参数&#xff0c;那么程序员就可以对该参数…

汽车标定技术(五)--基于模型开发如何生成完整的A2L文件(1)

1 数据对象的创建 CtrlH打开Model Explorer&#xff0c;在Base workspace中点击工具栏add&#xff0c;出现如下界面&#xff0c; 可以看到Simulink提供了多种数据类型 Matlab Variable&#xff1a;Simulink.Parameter&#xff1a;使用该数据对象表示工程应用中的标定量Simuli…

CSS 渐变、文本效果、字体

一、CSS3渐变&#xff1a; CSS3渐变&#xff08;gradient&#xff09;可以在两个或多个指定的颜色之间显示平稳的过渡。CSS3定义了两种类型的渐变&#xff08;gradient&#xff09;&#xff1a;线性渐变&#xff08;linear gradient&#xff09;-向下/向上/向左/向右/对角方向…

MySQL–第4关:查询用户日活数及支付金额

MySQL–第4关&#xff1a;查询用户日活数及支付金额 – WhiteNights Site 标签&#xff1a;MySQL 非常好的题&#xff0c;爱来自中国。 题目 没啥用 任务描述 现有3张业务表&#xff0c;详见如下: 需要输出结果如下&#xff0c;没有支付的日期不需要显示&#xff0c;请写出对…

设计模式——建造者模式

目录 建造者模式盖房项目需求基本介绍四个角色实例代码注意事项和细节抽象工厂模式 VS 建造者模式 建造者模式 盖房项目需求 传统方式&#xff1a;打地基&#xff0c;砌墙&#xff0c;封顶 盖房子步骤 public abstract class AbstractHouse {// 地基public abstract void b…

【小白专用】PHP中的JSON转换操作指南 23.11.06

一、JSON的基础知识 1.1JSON数据格式 JSON数据格式是一组键值对的集合&#xff0c;通过逗号分隔。键值对由“键”和“值”组成&#xff0c;中间使用冒号分隔。JSON数据格式可以嵌套&#xff0c;而且可以使用数组 二、PHP中的JSON函数 JSON的操作需要使用编程语言进行处理&am…

软考软件设计师刷题笔记整理

软件设计师 HTML代码中&#xff0c;创建指向邮箱地址的链接正确的是ARP攻击造成网络无法跨网段通信的原因是在软件开发过程中进行风险分析关于哈夫曼树的叙述关于风险管理的叙述ISO/IEC9126软件质量模型关于结构化开发方法的叙述分布式数据库中的分片透明、复制透明、位置透明和…

day61--单调栈2

503.下一个更大元素II 42. 接雨水 第一题&#xff1a;下一个更大元素2 给定一个循环数组&#xff08;最后一个元素的下一个元素是数组的第一个元素&#xff09;&#xff0c;输出每个元素的下一个更大元素。数字 x 的下一个更大的元素是按数组遍历顺序&#xff0c;这个数字之…

前端工程化(vue2)

一、环境准备 1.依赖环境&#xff1a;NodeJS 官网&#xff1a;Node.js 2.脚手架&#xff1a;Vue-cli 参考网址&#xff1a;安装 | Vue CLI 介绍&#xff1a;Vue-cli用于快速的生成一个Vue的项目模板。主要功能有&#xff1a;统一的目录结构&#xff0c;本地调试&#xff0…