1.什么是秩和检验?
秩和检验,也称为Wilcoxon 秩和检验,是一种非参数统计检验方法,用于比较两个独立样本的中位数是否有显著差异。它不要求数据满足正态分布假设,因此适用于小样本或者数据不满足正态分布假设的情况。
在进行秩和检验时,首先对两个样本的数据进行合并,然后对合并后的数据进行排序,并为每个值分配一个秩(从小到大)。接下来,计算两组样本的秩和,然后利用秩和来比较两组样本的位置关系。
秩和检验的原假设是两个独立样本的中位数相同,备择假设是两个独立样本的中位数不同。通过计算秩和的大小以及相应的P 值来判断是否拒绝原假设,从而得出结论是否存在显著差异。
还是灯泡工厂的故事,老板想知道新灯泡和旧灯泡使用寿命有没有差别,以下是两组灯泡的使用寿命,但是有一只新灯泡超过了800小时,却还是一直亮着。老板没有耐心等下去了,只记录了那只灯泡的使用时间大于800小时。那么我们该如何分析呢?这种情况下,我们采用秩和检验的方法。
首先,我们将两组数据合并,并对所有数据进行排序,然后给每个值分配秩。接下来,我们计算每个组的秩和,最后使用秩和检验的公式计算统计量和P值。
合并数据并进行排序:
对合并后的数据进行排序得到:
642, 646, 648, 649, 650, 650, 651, 652, 654, 658, 684, 685, 691, 705, 709, 716, 718, 719, 728, 800
接下来,给每个值分配秩(按照从小到大的顺序,如果有重复值,则取平均秩):
642: 1, 646: 2, 648: 3, 649: 4, 650: 5.5, 650: 5.5, 651: 7, 652: 8, 654: 9, 658: 10, 684: 11, 685: 12, 691: 13, 705: 14, 709: 15, 716: 16, 718: 17, 719: 18, 728: 19, 800: 20
接下来,计算每个组的秩和:
第一组的秩和:11 + 12 + 13 +14 + 15 + 16 + 17 + 18 +19 + 20 = 155
第二组的秩和:1 + 2 + 3 + 4 + 5.5 + 5.5 + 7 + 8 + 9 + 10 = 55
然后,我们可以使用秩和检验的公式计算统计量和P值。
第一组的秩和为155, 第二组的秩和为55。
如果两组数据属于同一分布,那么他们的秩和应该差不多,当n1足够大时,秩和近似服从均数为n1(N+1)/2, 方差为n1n2(N+1)/12的正态分布,
计算得到W和P值分别是:
P值小于0.05,因此,我们拒绝零假设,即两组数据之间存在显著差异。
也可以用代码算: