【R语言】t检验

一、基本介绍

t检验(t-test)是用于比较两个样本均值是否存在显著差异的一种统计方法。

t.test()函数的调用格式:

t.test(x, y=NULL, alternative=c("two.sided", "less", "greater"), mu=0, pair=FALSE, var.equal=FALSE, conf.level=0.95, ...)

参数详解:

  1. x:用于均值比较的数值向量。
  2. y:用于均值比较的数值向量。当y=NULL时,表示为单样本t检验。
  3. alternative:表示指定假设检验的备择检验类型。two.sided:双侧检验(默认);less:左侧检验(备择假设为样本均值小于mu);greater:右侧检验(备择假设为样本均值大于mu)。
  4. mu:一个对比用的数值,默认为0。当检验为单样本t检验时,表示x所代表的总体均值是否与mu中指定的值相等;当检验为双样本t检验时,表示x和y代表的总体均值之差是否与mu中指定的值相等。
  5. pair:逻辑值,指定是否为配对样本,默认为FALSE,即独立样本。
  6. var.equal:逻辑值,指定两个样本的方差是否相等(默认为TRUE,即假设方差相等;如果方差可能不相等,应设置为FALSE以执行Welch t检验)
  7. conf.level:置信区间的置信水平。

二、原假设与备择假设

在t检验中,原假设(null hypothesis,通常表示为H0​)和备择假设(alternative hypothesis,通常表示为H1​)是根据研究目的和所要检验的具体问题来设定的。

通常,原假设是希望被推翻的假设,而备择假设是研究者认为如果原假设被推翻则可能成立的假设。在进行t检验时,如果计算出的p值小于事先设定的显著性水平(如0.05)则可以拒绝原假设,接受备择假设(在统计上显著的意义上)。

1、单样本t检验

原假设:样本所来自的总体的均值等于某个已知值μ0​,即μ=μ0​。

备择假设:样本所来自的总体的均值不等于μ0​(双侧检验);或者小于μ0​(左侧检验);或者大于μ0​(右侧检验)。

2、独立样本t检验

原假设:样本所来自的总体的均值等于某个已知值μ0​,即μ=μ0​。

备择假设:样本所来自的总体的均值不等于μ0​(双侧检验);或者小于μ0​(左侧检验);或者大于μ0​(右侧检验)

3、非独立样本t检验

原假设:配对样本差值所来自的总体的均值等于0,即μd​=0(其中μd​表示配对样本差值的均值)。

备择假设:配对样本差值所来自的总体的均值不等于0(双侧检验);或者小于0(左侧检验,即认为第一种情况或测量值平均上小于第二种);或者大于0(右侧检验,即认为第一种情况或测量值平均上大于第二种)

三、单样本t检验

单样本t检验(One-Sample t-Test)用于比较一个样本的均值与已知的总体均值是否存在显著差异。

sample_data <- c(5.1, 4.8, 5.0, 5.3, 4.9)

# 总体均值
mu <- 5.0

# 执行单样本t检验
t.test(sample_data, mu = mu)

四、独立样本t检验

独立样本t检验(Independent Two-Sample t-Test)用于比较两个独立样本的均值是否存在显著差异。

group1 <- c(5.1, 4.8, 5.0, 5.3, 4.9)
group2 <- c(5.5, 5.2, 5.4, 5.6, 5.0)

# 执行独立样本t检验, 假设两组数据之间无差异
t.test(group1, group2, alternative="two.sided", var.equal = T)

 使用R语言中内置的数据集InsectSprays,检验杀虫剂C与杀虫剂D的效果差异。

head(InsectSprays)
library(dplyr)
# 筛选杀虫剂C和D
data1 <- dplyr::filter(InsectSprays, spray %in% c("C", "D"))
# 独立样本t检验:假设使用杀虫剂C后的昆虫数目比使用杀虫剂D后的少
t.test(count ~ spray, data1, alternative="less", var.equal=T)

从以下结果可知,使用杀虫剂C后的昆虫数目(2.08)显著(P=0.0027<0.05)小于使用杀虫剂D后的昆虫数目(4.917),即杀虫剂C的效果比D好。 

五、非独立样本t检验

非独立样本t检验又叫配对样本t检验。

下面用R语言内置的sleep数据集做演示:

现假设两种安眠药对增加睡眠时长的效果一样。

head(sleep)
t.test(extra ~ group, data = sleep, pair=TRUE, alternative="two.sided")

从下面结果可知,两种安眠药平均增加睡眠时长相差1.58小时,而且p=0.002833,远小于0.05,因此可以拒绝原假设,即这两种安眠药的效果不一样。 

需要注意的是,因为是进行的双侧t检验,所以可以假设“两种安眠药对增加睡眠时长的效果一样”。如果要假设“第1种安眠药的效果低于第2种安眠药的效果”,需要使用左侧检验,如下所示:

t.test(extra ~ group, data = sleep, pair=T, alternative="less")

原假设:两种安眠药的效果没有显著差异,或者第1种安眠药的效果不小于第2种。

备择假设:第1种安眠药的效果低于第2种安眠药的效果。

从下面结果可知,第1种安眠药效果确实显著低于第2种安眠药效果(p=0.0014)  

六、方差齐性检验

方差齐性检验(Equality of Variance Test)是指检验两个或两个以上样本的方差是否相等的统计检验方法。如果两个样本的方差相等,说明它们的变异情况相似,可以认为它们来自同一总体或具有可比性;反之,如果方差不相等,则可能说明它们的变异情况不相似,来自不同的总体或不具有可比性。

在t检验中,方差齐性是一个重要的前提假设,因为如果两个样本的方差差异显著,那么t检验的结果可能会受到严重影响,导致结论不准确。

在t检验中,进行方差齐性检验的目的是确保两个样本具有可比性。因为t检验是用于比较两个样本均值是否存在显著差异的统计方法,如果两个样本的方差差异显著,那么它们的均值比较可能就没有意义。因此,在进行t检验之前,通常需要先进行方差齐性检验

常用检验方法是Bartlett检验和Levene检验。

1、Bartlett检验

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/968356.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Uniapp 原生组件层级过高问题及解决方案

文章目录 一、引言&#x1f3c5;二、问题描述&#x1f4cc;三、问题原因❓四、解决方案&#x1f4af;4.1 使用 cover-view 和 cover-image4.2 使用 subNVue 子窗体4.3 动态隐藏原生组件4.4 使用 v-if 或 v-show 控制组件显示4.5 使用 position: fixed 布局 五、总结&#x1f38…

x_xor_md5

x_xor_md5 打开附件&#xff0c;用010打开 发现有一行值是重复的。 根据题目提示我们把全文与重复行进行异或 str1 [0x01,0x78,0x0C,0x4C,0x10,0x9E,0x32,0x37,0x12,0x0C,0xFB,0xBA,0xCB,0x8F,0x6A,0x53]result[]txt [0x69,0x35,0x41,0x01,0x1C,0x9E,0x75,0x78,0x5D,0x48,0xF…

【C语言标准库函数】标准输入输出函数详解[6]:字符文件读取写入

目录 一、字符文件写入函数 1.1. fputc函数 1.1.1. fputc函数简介 1.1.2. 使用场景 1.1.3. 注意事项 1.1.4. 示例 1.2. fputs函数 1.2.1. fputs函数简介 1.2.2. 使用场景 1.2.3. 注意事项 1.2.4. 示例 二、字符文件读取函数 2.1. fgetc函数 2.1.1. 函数简介 2.1…

基于深度学习的半导体故障诊断与寿命预测算法研究

摘要 半导体产业在现代科技领域占据着核心地位&#xff0c;其设备的稳定性和可靠性至关重要。传统的半导体故障诊断和寿命预测方法存在效率低、准确性差等问题。本文聚焦于深度学习算法在半导体故障诊断与寿命预测方面的应用&#xff0c;详细阐述了卷积神经网络&#xff08;CN…

制药行业 BI 可视化数据分析方案

一、行业背景 随着医药行业数字化转型的深入&#xff0c;企业积累了海量的数据&#xff0c;包括销售数据、生产数据、研发数据、市场数据等。如何利用这些数据&#xff0c;挖掘其价值&#xff0c;为企业决策提供支持&#xff0c;成为医药企业面临的重大挑战。在当今竞争激烈的…

基于Python flask-sqlalchemy的SQLServer数据库管理平台

适应场景&#xff1a; 主要用于帮助DBA自动化很多日常工作&#xff0c;包括&#xff1a; 数据库状态监控 性能问题诊断 日志分析 自动巡检 问题告警 系统截图&#xff1a; main.py from flask import Blueprint, render_template, request, flash, redirect, url_for f…

TensorRT 8.6.1教程1-TensorRT简介

区分计算节点和数据节点 视频 TensorRT 教程 | 基于 8.6.1 版本 | 第一部分_哔哩哔哩_bilibili cookbook

MySQL创建存储过程和存储函数

【图书推荐】《MySQL 9从入门到性能优化&#xff08;视频教学版&#xff09;》-CSDN博客 《MySQL 9从入门到性能优化&#xff08;视频教学版&#xff09;&#xff08;数据库技术丛书&#xff09;》(王英英)【摘要 书评 试读】- 京东图书 (jd.com) MySQL9数据库技术_夏天又到了…

【项目总结】易到家家政服务平台 —— 派单调度(7)

派单调度需求分析 在抢单业务中&#xff0c;用户下单成功由服务人员或机构进行抢单&#xff0c;抢单成功服务人员上门服务&#xff0c;除了抢单业务系统还设计了派单业务&#xff0c;由系统根据用户订单的特点自动派给合适的服务人员。 流程如下&#xff1a; 首先获取待分配…

visual studio 在kylin v10上跨平台编译时c++标准库提示缺少无法打开的问题解决

情况1&#xff1a;提示无法打开 源文件 "string"之类导致无法编译 情况2:能编译&#xff0c;但无法打开这些库文件或标准库使用提示下划红色问题 解决方案&#xff1a; 一、通过工具->选项->跨平台里&#xff0c;在“远程标头IntelliSense管理器”更新下载一下…

SpringCould+vue3项目的后台用户管理的CURD【Taurus教育平台】

文章目录 一.SpringCouldvue3项目的后台用户管理的CURD【Taurus教育平台】 1.1 背景 二.用户列表&#xff08;分页查询&#xff09; 2.1 前端Vue3 &#xff08;Vue3-Element-Admin&#xff09;2.2 后端SpringCould 处理 三. 用户信息删除 3.1 前端Vue3 &#xff08;Vue3-Eleme…

Eclipse 插件开发相关概念

整理了Eclipse插件开发的概念&#xff0c;用于熟悉入门 SWT&#xff08;Standard Widget Toolkit&#xff09;标准图形工具箱 Java开发的GUI程序技术&#xff0c;由Eclipse开发&#xff0c;相比AWT、Swing更美观&#xff1b;对于目标平台上已经有的控件&#xff0c;SWT会直接使…

算法之 数论

文章目录 质数判断质数3115.质数的最大距离 质数筛选204.计数质数2761.和等于目标值的质数对 2521.数组乘积中的不同质因数数目 质数 质数的定义&#xff1a;除了本身和1&#xff0c;不能被其他小于它的数整除&#xff0c;最小的质数是 2 求解质数的几种方法 法1&#xff0c;根…

AndroidStudio查看Sqlite和SharedPreference

1.查看Sqlite 使用App Inspection&#xff0c;这是个好东西 打开方式&#xff1a;View → Tool Windows → App Inspection 界面如图&#xff1a; App inspection不但可以看Sqlite还可以抓包network和background task连抓包工具都省了。 非常好使 2.查看sharedPreference 使…

谈一谈数据库中的死锁问题

文章目录 死锁是什么&#xff1f;死锁的四个必要条件避免死锁的策略 本篇文章是基于《MySQL45讲》来写的个人理解与感悟。 死锁是什么&#xff1f; 死锁是指两个或两个以上的进程在执行过程中&#xff0c;由于竞争资源或者由于彼此通信而造成的一种阻塞的现象。若无外力作用&a…

网络工程师 (31)VLAN

前言 VLAN&#xff08;Virtual Local Area Network&#xff09;即虚拟局域网&#xff0c;是一种将物理局域网划分成多个逻辑上独立的虚拟网络的技术。 一、定义与特点 定义&#xff1a;VLAN是对连接到的第二层交换机端口的网络用户的逻辑分段&#xff0c;不受网络用户的物理位置…

从深入理解 netty——》AI

想了很久&#xff0c;准备写一个系列从深入理解 netty——》AI。 先说下为啥要从netty开始&#xff0c;看看netty的重要性 rocketmq异步消息组件nacos微服务注册中心spring cloud gateway网关redission分布式缓存es全文检索sentinel流量控制&#xff0c;服务保护seata分布式…

从 0 开始本地部署 DeepSeek:详细步骤 + 避坑指南 + 构建可视化(安装在D盘)

个人主页&#xff1a;chian-ocean 前言&#xff1a; 随着人工智能技术的迅速发展&#xff0c;大语言模型在各个行业中得到了广泛应用。DeepSeek 作为一个新兴的 AI 公司&#xff0c;凭借其高效的 AI 模型和开源的优势&#xff0c;吸引了越来越多的开发者和企业关注。为了更好地…

在anaconda环境中构建flask项目的exe文件

一、创建并激活虚拟环境 conda create -n flask_env python3.9 # python版本根据项目需求安装 conda activate flask_env # 激活环境二、安装必要依赖 推荐使用conda&#xff0c;pip没尝试过&#xff0c;但是deepseek给出了命令 conda install flask …

腾讯云服务器中Ubuntu18.04搭建python3.7.0与TensorFlow1.15.0与R-4.0.3环境

所有踩过的坑&#xff0c;都化成了这条平坦的路 云服务器配置 基础配置选择竞价实例&#xff08;便宜/需求小&#xff09; 选择地区&#xff08;距离自己近的就行&#xff09; 实例配置选择异构计算&#xff08;能力较强&#xff0c;性价比高&#xff09;根据GPU显存需求选择…