统计分析方法-非参数检验-python

文章目录

  • 前言
  • 非参数检验
    • 特点
  • 常见的非参数检验
  • 一、Cliff's Delta
    • 动机
    • 定义
  • 二、Wilcoxon Signed-Rank Test
    • 定义
  • 三、 Friedman检验
    • 适用场景
    • 公式
  • python 代码
    • Wilcoxon Signed-Rank Test和 cliffs delta
    • Friedman


前言

记录一下自非参数检验的学习过程,如有不对请纠正。

非参数检验

非参数检验是一类统计检验方法,它不对数据的分布作出严格假设,尤其是正态性假设。与参数检验(如t检验、ANOVA)不同,非参数检验不需要数据符合特定的分布,因此在处理不符合正态分布的数据或分类数据时非常有用。

特点

无需分布假设: 不要求数据符合特定的分布,如正态分布。
适用于各种数据类型: 不仅适用于连续型数据,还适用于有序数据和分类数据。
鲁棒性: 对异常值和数据的分布形态不敏感。
应用广泛: 常用于小样本和分布未知的数据集。

常见的非参数检验

Mann-Whitney U检验:用于比较两个独立样本的中位数。
Wilcoxon Signed-Rank Test:用于比较两个相关样本的中位数差异。
Kruskal-Wallis检验:用于比较多个独立样本的中位数。
Friedman检验:用于比较多个相关样本的中位数。(至少三组)

注:这些非参数检验在小样本的情况下至少需要5个样本。

一、Cliff’s Delta

Cliff’s Delta(Cliff’s δ)是一个非参数检验,用于衡量两个独立样本之间的差异。它通过比较两个样本的每对数据点来评估一个样本中的值在另一个样本中的值之前或之后出现的频率。(一般用于假设检验的有用补充分析)
The Cliff’s Delta statistic is a non-parametric effect size measure that quantifies the amount of difference between two groups of observations beyond p-values interpretation. This measure can be understood as a useful complementary analysis for the corresponding hypothesis testing.

动机

大致意思:认为非参数检验中仅靠p-value只能表明A和B存在显著差异,但是其差异量的大小是未知的。参考链接
The main contribution of ESMs to the correct interpretation of hypothesis testing has been earlier noticed by Fisher (1925), who argued that p-values do not really inform about the magnitude of a difference between two groups of observations. For example, if treatments A and B produce a statistically significant difference on the dependent variable, the amount of such discrepancy remains unknown. It is correctly concluded that the difference is important, but the researcher can not claim how important it is.

定义

Cliff’s Delta表示两个组的效果大小,范围在-1到1之间:

δ = 1 表示所有值在样本A中都大于样本B。
δ = -1 表示所有值在样本B中都大于样本A。
δ = 0 表示两个样本没有差异。

具体的假设,例如δ>0.33时,则认为ES(effect size)较大。
在这里插入图片描述

二、Wilcoxon Signed-Rank Test

Wilcoxon Signed-Rank Test(威尔科克森符号秩检验)是一个非参数统计检验,用于比较两个相关样本或配对样本的中位数差异。它是一种用于检验配对差异是否对称分布的无假设检验方法。

定义

该检验用于评估在一组配对数据中的差异是否显著。适用于:

1.两个配对样本。
2.相关样本之间的比较。
3. 如果p-value的值小于0.05(统计学中一般有0.1,0.05以及0.01),则说明配对样本之间的差异显著。

三、 Friedman检验

Friedman检验是一种非参数统计检验,用于比较多个相关样本(配对样本)的中位数差异。它是用于检测多组相关样本之间是否存在显著差异的有效方法,通常用于重复测量设计或块设计中的数据分析。

适用场景

重复测量设计: 同一组对象在不同条件下的测量结果。
块设计: 实验对象被分成多个块,每个块中的实验对象在所有处理条件下都进行测量。

公式

在这里插入图片描述

在这里插入图片描述
注:本领域一般使用Friedman计算三组样本之间是否存在显著性差异,如果存在。则继续使用其它非参数检验比较两组之间的显著性差异。

python 代码

Wilcoxon Signed-Rank Test和 cliffs delta

from scipy import stats
def cliffs_delta(lst1, lst2):
    """Cliff's Delta test"""
    from cliffs_delta import cliffs_delta

    return cliffs_delta(lst1, lst2)
def wilcoxon_signed_rank_test(lst1, lst2):
    """Wilcoxon Signed-Rank Test"""
    return stats.wilcoxon(lst1, lst2)

data1 = [93.40 ,98.69,99.87,99.31 ,99.77 ,97.84]
data2 = [93.4,96.77,97.71,91.67,97.97 ,95.73]

cliffs_delta_value = cliffs_delta(data1, data2)
wilcoxon_statistic, wilcoxon_p_value = wilcoxon_signed_rank_test(data1, data2)

print("Cliff's Delta:", cliffs_delta_value)
print("Wilcoxon Signed-Rank Test p-value:", wilcoxon_p_value)

Friedman

# -- coding:utf-8 --
import numpy as np
import scipy.stats as stats

# 示例数据,表示三个模型在六个数据集上的性能
# 计算方差和均值是为了比较在模型的总体稳定性和泛化性。
model1 = [93.40 ,96.77 ,97.71 ,91.67 ,97.97 ,95.73]
model2 = [85.85 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/721126.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ESP32蓝牙BLE连接米家温湿度计

ESP32蓝牙BLE连接米家温湿度计 文章目录 ESP32蓝牙BLE连接米家温湿度计简介需要准备的东西软件调试代码实现修改查找的名称 修改需要连接的服务和属性添加解析数据的代码 上电演示提示 简介 最近在学习低功耗蓝牙BLE(Bluetooth Low Energy),刚好手里有个米家蓝牙温…

如何将Postman API测试转换为JMeter以进行扩展

2024软件测试面试刷题,这个小程序(永久刷题),靠它快速找到工作了!(刷题APP的天花板)-CSDN博客跳槽涨薪的朋友们有福了,今天给大家推荐一个软件测试面试的刷题小程序。​编辑https://…

递归与回溯 || 排列问题

目录 前言: 全排列 题解: 全排列 II 题解: 子集 题解: 组合 题解: 组合总和 题解: 电话号码的字母组合 题解: 字母大小写全排列 题解: 优美的排列 题解:…

Hbase搭建教程

Hbase搭建教程 期待您的关注 ☀小白的Hbase学习笔记 目录 Hbase搭建教程 1.上传hbase的jar包并解压 2.重新登录 3.启动zookeeper 4.配置环境变量 5.关闭ZK的默认配置 6.修改hbase-site.xml文件 7.修改regionservers文件 8.将配置好的文件分发给其它节点 9.配置环境变量…

shell编程中的运算符的讲解

在Linux操作系统中也可以使用expr来进行一些数值的运算,expr接受表达式作为参数,并打印计算结果。 对于某些复杂的表达式或早期不支持内嵌算术表达式的Shell环境,expr 仍然是一个可行的选择。 如上图所示,是使用变量sum来承接加和…

【算法训练记录——Day31】

Day31——贪心算法Ⅰ 1. 理论1.1 什么是贪心1.2 什么时候用贪心1.3 贪心算法一般步骤 2.leetcode455——分发饼干3.leetcode376——摆动序列 目标: 理论leetcode455——分发饼干leetcode376——摆动序列leetcode53 —— 最大字序和 1. 理论 算法随想录——贪心 1…

四十七、openlayers官网示例Image Filters——给地图添加锐化、浮雕、边缘等滤镜效果

官网demo示例: Image Filters 这篇讲的是如何给地图添加滤镜。 一看代码,,好家伙,信息量满满,全都看不懂。。。 咱只能一段一段扒。。。 首先添加一个底图到地图上,这个好理解。 const imagery new Til…

第十一章:接口

接口 文章目录 接口一、简介1.1 接口是什么1.2 接口的作用1.3 接口的开发与调用1.4 接口的组成 二、RESTful API三、json-server四、接口测试工具五、接口的创建 一、简介 1.1 接口是什么 接口是前后端通信的桥梁 简单理解:一个接口就是 服务中的一个路由规则&am…

十分钟学会微调大语言模型

有同学给我留言说想知道怎么训练自己的大语言模型,让它更贴合自己的业务场景。完整的大语言模型训练成本比较高昂,不是我们业余玩家能搞的,如果我们只是想在某个业务场景或者垂直的方面加强大模型的能力,可以进行微调训练。 本文…

ssl证书能认证多少个域名

SSL证书能认证的域名数量取决于SSL证书的类型。不同类型的SSL证书支持不同数量的域名: SSL证书,作为网络安全的基石之一,起着至关重要的作用。它通过为网站提供加密连接,确保数据传输的安全性和完整性,同时验证网站的真…

spark常见问题

写文章只是为了学习总结或者工作内容备忘,不保证及时性和准确性,看到的权当个参考哈! 1. 执行Broadcast大表时,等待超时异常(awaitResult) 现象:org.apache.spark.SparkException: Exception…

答应我,完成单位投稿任务用对的方法别让自己受投稿之苦

在这个信息爆炸的时代,单位的形象塑造与品牌传播已成为不可忽视的关键环节。作为单位的信息宣传员,我深知每一次对外发声的重要性,它不仅是展示我们工作成果的窗口,更是连接公众、塑造品牌形象的桥梁。然而,在传统的投稿方式中,尤其是依赖于邮箱投稿,我经历了太多次的挫败与无奈…

LeetCode 算法:合并两个有序链表 c++

原题链接🔗:合并两个有序链表 难度:简单⭐️ 题目 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示例 1: 输入:l1 [1,2,4], l2 [1,3,4] 输出:…

PHP学习笔记--初学

笔录:我是从黑马里面找的资料学习的,如果有人看我的笔记话,建议去看黑马程序课程,更详细一些。 目录 php定义,平台支持: 静态网站: 动态网站: 服务器概念: IP的概念…

JavaFX 分隔符

Separator类表示水平或垂直分隔线。它分割元素,不产生任何动作。 我们可以设计风格,应用视觉效果,并为分隔符设置动画。 默认情况下,分隔符是水平的。我们可以使用setOrientation方法改变它的方向。 Separator类扩展了Node类。…

2024/6/18(RBAC,查询用户权限,细粒度授权,选课,支付宝生成二维码支付,支付结果查询需要内网穿透)

黑马程序员【学成在线项目】,P141 测试沙箱支付宝_黑马学成在线支付宝沙箱-CSDN博客 需要内网穿透

reverse-android-实战喜马拉雅-ollvm

资料 1. apk: com.ximalaya.ting.android.apk. 2020年8月 可以使用 2. 抓包分析 java层分析 so层分析 登录的算法so是在 liblogin_encrypt.so中。 32位的, 用 IDA打开,查看 静态的导出函数。 打开 一个 首先看到 IDA VIEW 是一个横向 比较多的分支&am…

【3D模型库】机械三维模型库整理

1 开拔网 简介:开拔网是中国较早的机械设计交流平台,广受行业内的各个大学,公司以及行业人士的欢迎。网站有非常丰富的3D模型,CAD图纸,以及各类热门软件的下载。同时我们也为行业搭建一个平台,提供各类设计…

AI智能盒子助力中钢天源设备工厂升级安全防护

中钢集团安徽天源科技股份有限公司成立于2002年3月27日,是中央企业中国中钢股份有限公司控股的上市公司,主导产品为永磁铁氧体器件、钕铁硼器件、四氧化三锰、锶铁氧体预烧料及各类磁选机等。 在中钢天源智能化升级过程中,采用并定制开发一系列厂区安全…

【C++】Template模板

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;c系列专栏&#xff1a;C/C零基础到精通 &#x1f525; 给大…