统计学-R语言-7.3

文章目录

  • 前言
  • 总体方差的检验
    • 一个总体方差的检验
    • 两个总体方差比的检验
  • 非参数检验
  • 总体分布的检验
    • 正态性检验的图示法
    • Shapiro-Wilk和K-S正态性检验
    • 总体位置参数的检验
  • 练习


前言

本篇文章继续对总体方差的检验进行介绍。


总体方差的检验

在这里插入图片描述

一个总体方差的检验

在生产和生活的许多领域,方差的大小是否适度是需要考虑的一个重要因素。一个方差大的产品意味着其质量或性能不稳定。相同均值的产品,方差小的自然要好些。与总体方差的区间估计类似,一个总体方差的检验也是使用 分布。此外,总体方差的检验,不论样本量n是大还是小,都要求总体服从正态分布。检验统计量为
在这里插入图片描述
对于设定的显著性水平 在这里插入图片描述,双侧检验的拒绝域如下图所示。对于单侧检验拒绝域在分布一侧的尾部
在这里插入图片描述
例题:
啤酒生产企业采用自动生产线灌装啤酒,每瓶的填装量为640ml,但由于受某些不可控因素的影响,每瓶的填装量会有差异。如果 在这里插入图片描述很大,会出现填装量太多或太少的情形,这样,要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶填装量的方差不应超过16。企业质检部门抽取了10瓶啤酒进行检验,得到的样本数据如下。检验填装量的方差是否符合要求( =0.05)
638.3 642.0 640.4 641.1 637.2 643.3 643.7 640.5 639.8 644.2

sigma.test(x,sigmasq= ,alternative=" ")
在这里插入图片描述

load("C:/example/ch6/example6_11.RData")
library(TeachingDemos)
sigma.test(example6_11$填装量,sigmasq=16,alternative="greater")

在这里插入图片描述
在这里插入图片描述

两个总体方差比的检验

在这里插入图片描述
(数据: example6_6. RData)沿用例6-6。检验两家企业灯泡使用寿命的方差是否有显著差异( 在这里插入图片描述=0.05)
在这里插入图片描述

load("C:/example/ch6/example6_6.RData")
var.test(example6_6[,1],example6_6[,2],alternative="two.sided")

在这里插入图片描述
在这里插入图片描述

非参数检验

以上介绍的参数检验(如t检验、F检验等)通常是在假定总体服从正态分布或总体分布形式已知的条件下进行的、而且要求所分析的数据是数值的。
当总体的概率分布形式未知、或者无法对总体的概率分布做出假定时,参数检验方法往往会失效,这时可采用非参数检验。非参数检验方法不仅对总体的分布要求很少,对数据类型的要求也比参数检验宽松。当数据不适合用参数检验时,非参数检验往往能得出理想的结果。本篇主要介绍总体分布的检验以及几种常用的参数检验的替代方法。

总体分布的检验

在实际问题中,除了关心总体参数外,还会关心总体的分布,比如,总体是否服从正态分布,两个总体的分布是否相同,等等。
介绍检验正态性的几种方法,它是根据样本数据检验总体是否服从正态分布,或者说样本数据是否来自正态总体,检验方法有图示法和检验法。图示法主要有Q-Q图和P-P图,检验法主要有 Shapiro-Wilk检验和 Kolmogorov- Smirnov检验(K-S检验)等。

正态性检验的图示法

判断数据是否服从正态分布的描述性方法之一,就是画出数据频数分布的直方图或茎叶图,若数据近似服从正态分布,则图形的形状与正态曲线应该相似。但实际中更常用的方法是绘制样本数据的正态概率图( normal probability plots)。正态概率图有两种画法,一种称为Q-Q图( quantile-quantile plot),一种称为P-P图( probabilit probability plot)。
Q-Q图是根据观测值的实际分位数与理论分布(如正态分布)的分位数的符合程度绘制的,有时也称为分位数-分位数图;P-P图则是根据观测数据的累积概率与理论分布(如正态分布)的累积概率的符合程度绘制的。
下图是用R模拟的几种不同分布的Q-Q图
在这里插入图片描述
例题:
(数据: example6_3.RData)沿用例6-3。会制Q-Q图和P-P图,检验该城市每立方米空气中的PM2.5是否服从正态分布。

#  绘制Q-Q图
 qqnorm(x,xlab=" ",ylab=" ",datax=TRUE,main="正态Q-Q图")
 qqline(x,datax=TRUE,col="")
 
# 绘制P-P图
 f<-ecdf(x)
 p1<-f(x)#y<- ecdf(x);y(x);plot(x,y(x), ylab = "ECDF(x)")
 p2<-pnorm(x,mean(x),sd(x)) 
 plot(p1,p2,xlab="观测的累积概率",ylab="期望的累积概率",main="正态P-P图")
 abline(a=0,b=1,col=" ")
#  绘制Q-Q图
 load("C:/example/ch6/example6_3.RData")
 par(mfrow=c(1,2),cex=0.8,mai=c(0.7,0.7,0.2,0.1))
 qqnorm(example6_3$PM2.5,xlab="期望正态值",ylab="观测值",datax=TRUE,main="正态Q-Q图")
 qqline(example6_3$PM2.5,datax=TRUE,col="red")
 
# 绘制P-P图
 f<-ecdf(example6_3$PM2.5)
 p1<-f(example6_3$PM2.5)#y<- ecdf(x);y(x);plot(x,y(x), ylab = "ECDF(x)")
 p2<-pnorm(example6_3$PM2.5,mean(example6_3$PM2.5),sd(example6_3$PM2.5)) 
 plot(p1,p2,xlab="观测的累积概率",ylab="期望的累积概率",main="正态P-P图")
 abline(a=0,b=1,col="red")

在这里插入图片描述
图中的直线表示理论正态分布线,各观测点越靠近直线,且呈随机分布,表示数据越接近正态分布。从图中可以看出,各观测点大致围绕在一条直线周围随机分布,可以说该城市每立方米空气中的PM2.5基本上服从正态分布。
在分析正态概率图时,最好不要用严格的标准去衡量数据点是否在理论直线上,只要各点近似在一条直线周围随机分布即可。而且当样本量比较小时正态概率图中的点很少,提供的正态性信息很有限,因此样本量应尽可能大。

Shapiro-Wilk和K-S正态性检验

当样本量较小时,正态概率图的应用就会受到限制,这时可以使用标准的统计检验方法。检验的原假设是总体服从正态分布。
如果检验获得的P值小于指定的显著性水平,则拒绝原假设,表示总体不服从正态分布;如果P值较大不能拒绝原假设,可以认为总体满足正态分布。正态性的检验方法有很多、这里只介绍两种常用的检验方法,即 Shapiro-Wilk检验和K-S检验。

Shapiro-Wilk检验
Shapiro-Wilk检验是S.Shapiro和M.Wilk于1965年提出的,该检验是用顺序统计量W来检验分布的正态性。 Shapiro-wilk检验的具体步骤如下:
首先,对研究的总体提出如下假设:
H0:总体服从正态分布;H1:总体不服从正态分布
然后,按下列公式计算检验统计量W:

在这里插入图片描述

在这里插入图片描述

(数据: example6_4.RData) 沿用例6-4。用 Shapiro-wilk方法检验该企业生产的砖的厚度是否服从正态分布( 在这里插入图片描述=0.05)。

在这里插入图片描述

load("C:/example/ch6/example6_4.RData")
shapiro.test(example6_4$厚度)

在这里插入图片描述

结论:在该项检验中,W=0.91377,P=0.07522,由于P>0.05,不拒绝原假设,没有证据显示该企业生产的砖的厚度不服从正态分布。

K-S检验
Shapiro–Wilk检验只适用于小样本场合(3≤n<50),当样本量较大时,可使用K-S检验。该检验既可以用于大样本,也可以用于小样本。
K-S检验用来检验总体是否服从某个已知的理论分布。该检验是将某一变量的累积分布函数与特定的分布函数进行比较,检验其拟合程度。设总体的累积分布函数为F(x),已知的理论分布函数为F0(x),则检验的原假设和备择假设为:
在这里插入图片描述
在这里插入图片描述
K-S检验
如果H0成立,每次抽样得到的D值应当不会与0偏离太远,否则就应拒绝H0。对于设定的显著性水平 在这里插入图片描述,若检验统计量D(或z)对应的概率小于在这里插入图片描述,则拒绝H0,表示总体与指定的理论分布差异显著。
K-S检验要求样本数据是连续的数值数据,而且要求理论分布已知。比如,要检验的样本数据是否来自μ=100, =10的正态总体,即 在这里插入图片描述。当总体均值和方差未知时,可以用样本均值 和方差 来代替
K-S检验的函数为:ks.test(x,y,…).参数x为向量或数据框;y指定分布,pnom表示要检验的是正态分布;mean和sd是正态分布的均值和标准差。

(数据: example6_4.RData) 沿用例6-4。用K-S方法检验该企业生产的砖的厚度是否服从正态分布( 在这里插入图片描述=0.05)。
ks.test(x,y,…).参数x为向量或数据框;y指定分布;
在这里插入图片描述

load("C:/example/ch6/example6_4.RData")
ks.test(example6_4$厚度,"pnorm", mean(example6_4$厚度), sd(example6_4$厚度))

在这里插入图片描述
结论:在该项检验中,D=0.23538,P=0.2178,由于P>0.05,不拒绝H0,没有证据显示该企业生产的砖的厚度不服从正态分布。
注:K-S检验的函数为:ks.test(x,y,…).参数x为向量或数据框;y指定分布,pnom表示要检验的是正态分布;mean和sd是正态分布的均值和标准差。

由于 Shapiro-Wilk检验和K-S检验对正态性偏离十分敏感,因此当样本数据轻微偏离正态分布时,这些检验往往也会导致拒绝原假设。当某些分析对正态性的要求相对宽松时,应谨慎使用这些检验。

总体位置参数的检验

总体位置参数的检验是参数检验的一种替代方法。当只有一个总体时,通常关心总体的某个位置参数(如中位数)是否等于假设值,检验方法主要是 Wilcoxon(威尔科克森)符号秩检验。当有两个总体时,通常关心两个总体的位置参数是否相同。对于独立样本,采用Mann- Whitney(曼-惠特尼)检验;对于配对样本,则采用配对样本的 Wilcoxon符号秩检验。
秩(rank)的概念:
秩就是一组数据按照从小到大的顺序排列之后,每一个观测值所在的位置
用一般符号R来表示,假定一组数据 按照从小到大的顺序排列, 在所有观测值中排第 在这里插入图片描述位,那么 在这里插入图片描述的秩即为 在这里插入图片描述

也是一个统计量,它测度的是数据观测值的相对大小,大多数非参数检验方法正是利用秩的这一性质来排除总体分布未知的障碍的。当然,也有一些非参数方法并不涉及秩的性质。

结(ties)的处理:
很多情况下,数据中会出现相同的观测值,那么对它们进行排序后,这些相同观测值的排名显然是并列的,也就是说它们的秩是相等的,这种情况被称为数据中的“结”
对于结的处理,通常是以它们排序后所处位置的平均值作为它们共同的秩
当一个数据中结比较多时,某些非参数检验中原假设下检验统计量的分布就会受到影响,从而需要对统计量进行修正(一般情况下,软件会自动作出修正)

Wilcoxon符号秩检验(Wilcoxon signed ranks test)是由Frank Wilcoxon于1945年提出的,它是单样本t检验的一种替代方法,用于检验总体中位数是否等于某个假设的值。该检验假定样本数据来自连续对称分布的总体。设总体真实中位数为M,假设的中位数为M0, Wilcoxon符号秩检验的步骤如下:
第1步:提出假设
双侧检验:H0:M=M0,H1:M≠M0;
左侧检验:H0:M=M0,H1:M<M0;
右侧检验:H0:M=M0,H1:M>M0。

在这里插入图片描述
在这里插入图片描述
例题:
(数据: example6_4.RData) 沿用例6-4。假定样本数据来自连续对称分布总体,但不知道总体的具体分布。检验该企业生产的砖的厚度中位数是否等于5cm( 在这里插入图片描述=0.05)
在这里插入图片描述
注:函数 wilcox.test(x,…)中,参数m为假定的中位数,alternative=c(“two.side””less”," greater")指定备择假设的方向,默认为alternative="two.side”

load("C:/example/ch6/example6_4.RData")
wilcox.test(example6_4$厚度,m = 5)

在这里插入图片描述
注:函数 wilcox.test(x,…)中,参数m为假定的中位数,alternative=c(“two.side””less”," greater")指定备择假设的方向,默认为alternative="two.side”
结论:在该项检验中,统计量V=2,P=0.0005812,由于P<0.05,拒绝H0。有证据显示该企业生产的砖的厚度中位数与5cm有显著差异。


练习

1、(数据: exercise6_2.RData) 安装于一种联合收割机的金属板的平均重量为25千克。对某企业生产的20块全属板进行测量,得到的重量数据如下:
(1)采用 Shapiro-Wik检验方法,检验该企业生产的全属板的重量是否从正态分布( 在这里插入图片描述=0.05)

解:提出假设:
H0:该企业生产的全属板的重量服从正态分布;H1:该企业生产的全属板的重量不服从正态分布

load("C:/example/ch6/exercise6_2.RData")
shapiro.test(exercise6_2$重量)

在这里插入图片描述
结论:在该项检验中,W=0.97064,P=0.7684,由于P>0.05,不拒绝原假设,没有证据显示该企业生产的金属板的重量不服从正态分布。

(2)假定金属板的重量服从正态分布,检验该企业生产的金属板是否符合要求 ( 在这里插入图片描述=0.05)
解:提出假设:该企业生产的全属板的平均重量为μ
H0: μ=25;H1:μ 在这里插入图片描述25

t.test(exercise6_2$重量,mu=25,conf.level=0.95)

在这里插入图片描述
结论:P=0.3114>0.05,不拒绝原假设,没有证据表明该企业生产的金属板的重量不符合要求。

(3)计算效应量,分析差异程度
单样本t检验的效应量:
library(lsr)
cohensD(exercise6_2$重量,mu=25)

在这里插入图片描述

结论:0.2<d<0.5 小的效应量

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/358152.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Hypermesh中模型抽取中面的方法

一、自动抽取中面 二、手动抽取中面 offsetplanessweeps会记录所抽取的中面由哪两个面形成的 planes&#xff1a;所识别的对面是两个平面&#xff0c;就会在两平面中间区域插入一个中面 sweeps&#xff1a;所识别的对面是两个曲面时&#xff0c;就会在两个曲面中间区域插入一个…

esp32 操作DS1307时钟芯片

电气参数摘要 有VCC供电&#xff0c;IIC活动状态是1.5mA&#xff0c;待机状态200μA&#xff0c;电池电流5nA(MAX50nA&#xff09;无VCC供电的时候&#xff0c;电池电流&#xff0c;300nA&#xff08;时钟运行&#xff09;&#xff0c;10nA&#xff08;时钟停止&#xff09;供…

机器人顶会IROS,ICRA论文模板下载及投稿须知,以及机器人各大会议查询

一、背景 机器人方向&#xff0c;不止期刊TRO&#xff0c;TASE&#xff0c;RAM&#xff0c;RAL上的成果被认可&#xff0c;机器人顶会上的成果也是非常好的。当决定要写一篇IROS论文时&#xff0c;结果IROS论文模板和投稿须知找了半天才找到&#xff0c;且意外发现了一个特别好…

Java 面试题之 IO(一)

字节流 文章目录 字节流InputStream&#xff08;字节输入流&#xff09;OutputStream&#xff08;字节输出流&#xff09; 文章来自Java Guide 用于学习如有侵权&#xff0c;立即删除 InputStream&#xff08;字节输入流&#xff09; InputStream用于从源头&#xff08;通常是…

最全音频总线汇总

本文介绍了常见的音频总线&#xff0c;主要有I2S, AC’97&#xff08;Audio Codec 97&#xff09;, SPI&#xff08;Serial Peripheral Interface&#xff09;,USB Audio, Bluetooth Audio,HDMI, A2B&#xff08;Analog to Digital to Analog&#xff09;, Ethernet Audio I2S…

ros2配合yolov8具体实现

效果图 用yolov8实时检测物体,包括物体的类别,置信度和坐标通过ros2发布出去自定义消息 int64 xmin int64 ymin int64 xmax int64 ymax float32 conf string name发布端代码 from ultralytics import YOLO import cv2 import rclpy from yolo_interfaces.msg import Msgyo…

永宏 plc怎样实现远程调试、远程上下载程序?

准备工作 一台可联网操作的电脑一台单网口的远程透传网关及博达远程透传配置工具网线一条&#xff0c;用于实现网络连接和连接PLC一台永宏 PLC及其编程软件一张4G卡或WIFI天线实现通讯(使用4G联网则插入4G SIM卡&#xff0c;WIFI联网则将WIFI天线插入USB口&#xff09; 第一步…

不会使用这个工具的网工,都不能称为高手

你们好&#xff0c;我的网工朋友。 点开之前&#xff0c;你脑子里闪出来的工具是什么&#xff1f;ping&#xff1f;又或是arp、tracert、route……&#xff1f; 今天要给你分享的是非常经典的Linux网络抓包工具Tcpdump。 它允许用户拦截和显示发送或收到过网络连接到该计算机…

Pytest中doctests的测试方法应用!

在 Python 的测试生态中&#xff0c;Pytest 提供了多种灵活且强大的测试工具。其中&#xff0c;doctests 是一种独特而直观的测试方法&#xff0c;通过直接从文档注释中提取和执行测试用例&#xff0c;确保代码示例的正确性。本文将深入介绍 Pytest 中 doctests 的测试方法&…

幻兽帕鲁服务器视频教程,3分钟快速搭建,新手0基础也可以!

幻兽帕鲁服务器搭建教程&#xff0c;基于阿里云计算巢新手3分钟0基础搞定&#xff0c;详细参考 aliyunbaike.com/go/palworld 视频教程 1分钟部署幻兽帕鲁搭建&#xff0c;新手成功创建&#xff01; 大家也可以参考阿里云百科下方的教程&#xff1a; 如何自建幻兽帕鲁服务器&a…

二极管漏电流对单片机ad采样偏差的影响

1&#xff0c;下图是常规的单片机采集电压电路&#xff0c;被测量电压经过电阻分压&#xff0c;给到mcu采集&#xff0c;反向二极管起到钳位作用&#xff0c;避免高压打坏mcu。 2&#xff0c;该电路存在的问题 二极管存在漏电流&#xff0c;会在100k电阻上产生叠加电压&#x…

pve宿主机更改网络导致没网,pve更改ip

一、问题描述 快过年了&#xff0c;我把那台一直在用的小型服务器&#xff0c;带回去了&#xff0c;导致网络发生了变更&#xff0c;需要对网络进行调整&#xff0c;否则连不上网&#xff0c;我这里改的是宿主机&#xff0c;不是pve虚拟机中的系统。 二、解决方法 pve用的是…

07.领域驱动设计:3种常见微服务架构模型的对比和分析

目录 1、概述 2、整洁架构 3、六边形架构 4、三种微服务架构模型的对比和分析 5、从三种架构模型看中台和微服务设计 5.1 中台建设要聚焦领域模型 5.2 微服务要有合理的架构分层 5.2.1 项目级微服务 5.2.2 企业级中台微服务 5.3 应用和资源的解耦与适配 6、总结 1、概…

2024年CSC公派研究生项目(含联培)选派办法及解读

2024年春节将至&#xff0c;知识人网提前祝大家新年快乐&#xff0c;心想事成&#xff01;同时提醒申请者关注国家留学基金委&#xff08;CSC&#xff09;的申报政策。近日CSC官网发布了2024年国家建设高水平大学公派研究生项目通知&#xff0c;知识人网小编现将其选派办法原文…

13.前端--CSS-盒子模型

1.盒子模型的组成 CSS 盒子模型本质上是一个盒子&#xff0c;封装周围的 HTML 元素&#xff0c;它包括&#xff1a;边框、外边距、内边距、和 实际内容 2.边框&#xff08;border&#xff09; 2.1 边框的使用 1、border设置元素的边框。边框有三部分组成:边框宽度(粗细) 边框…

ucharts 让x轴文字倾斜文字

ucharts 让x轴文字倾斜文字 xAxis: {disableGrid: true,scrollShow: false,//x轴文字倾斜rotateLabel:true},

2023年天猫食用油市场行业分析(电商数据查询软件):市场细分,营养调和油高速成长

食用油是人类膳食的重要组成部分&#xff0c;除了为日常饮食提供美味外&#xff0c;也是人体所需脂肪和能量的重要来源&#xff0c;对人体健康发挥着重要作用。因此&#xff0c;作为日常生活中的刚需品&#xff0c;食用油市场的整体规模也较大。 首先来看食用油市场的年度销售…

华为OD-华为机试精讲500篇系列文章目录介绍(持续补充ing)

目录 背景介绍 什么是华为OD&#xff1f; OD现状 OD趋势 华为OD机考刷题攻略 1、刷题资料&#xff1a;投递岗位通过筛选后提供 2、注意事项&#xff1a; 真题代码目录 背景介绍 经济下行的这几年&#xff0c;每个人都感同身受&#xff0c;如何让自己在芸芸众生中脱颖而…

深度学习之卷积神经网络

卷积神经网络简称为CNN 首先我们来回顾一下&#xff0c;我们之前学到的全连接的神经网络&#xff1a; 上面我们通过线性层串行连接起来的神经网络&#xff0c;我们叫做全链接的网络&#xff0c;在线性层里面&#xff0c;我们的输入值和任意的输出值之间都存在权重&#xff0c;…

05 Redis之Benchmark+简单动态字符串SDS+集合的底层实现

3.8 Benchmark Redis安装完毕后会自动安装一个redis-benchmark测试工具&#xff0c;其是一个压力测试工具&#xff0c;用于测试 Redis 的性能。 src目录下可找到该工具 通过 redis-benchmark –help 命令可以查看到其用法 3.8.1 测试1 3.9 简单动态字符串SDS 无论是 Redis …