如何设计统计量及相关假设检验

一、如何设置H0和H1假设

谁做H0,谁做H1,在统计学的假设检验里是有约定俗成的规定的。即:status quo(默认/现状)是H0,而新观点或试图challenge现状的是H1。H1也叫research hypothesis,所以我们做research、发文章就是要reject H0,而希望H1接受。
在这里插入图片描述

步骤和原则

1. 明确研究问题:
首先,需要明确你想要回答的研究问题或验证的假设。

2. 设定原假设(H0):

H0 一般是希望被检验和拒绝的假设,因为它通常代表现状或默认状态。

3. 设定备择假设(H1):

H1 是我们希望找到证据支持的假设。

二、 如何理解显著性水平和p值之间的关系

p 值的定义

p 值(p-value)是一个概率值,用于衡量在原假设(H0)为真时,观测数据(或比观测数据更极端的数据)出现的概率。它反映了数据与原假设的一致性。

理解 p 值

假设我们进行一个假设检验,下面是详细步骤和解释:

1. 设定假设:

  • 原假设(H0):没有效果或没有差异。例如,假设一个新药对血压没有影响。
  • 备择假设(H1):存在效果或存在差异。例如,假设新药对血压有影响。

2. 选择显著性水平( α \alpha α):

  • 通常设定为 0.05,这意味着我们允许有 5% 的概率犯第一类错误,即错误地拒绝原假设。

3. 收集数据:

  • 例如,我们收集了一组使用新药和一组使用安慰剂的患者的血压数据。

4. 计算检验统计量和 p 值:

  • 使用适当的统计方法(例如 t 检验),计算出一个检验统计量(例如 t 值),并基于此计算出 p 值。

p 值的含义

  • p 值是 0.03:这表示在原假设为真(即新药对血压没有影响)的情况下,获得与实际观测数据一样极端(或更极端)的结果的概率是 0.03(即 3%)。
    • 换句话说,如果新药确实对血压没有影响,那么我们观测到这种数据的概率是 3%。这么小的概率事件发生了,那我们是不是应该质疑原假设,认为原假设不正确。

决策依据

  • p 值 ≤ α(例如 0.03 ≤ 0.05):我们拒绝原假设 H0,认为数据提供了足够的证据支持备择假设 H1。也就是说,我们认为新药对血压有显著影响。
  • p 值 > α(例如 0.07 > 0.05):我们不能拒绝原假设 H0,认为数据没有提供足够的证据支持备择假设 H1。也就是说,我们认为新药对血压没有显著影响。

举例说明

假设我们研究新药对降低血压的影响,进行了独立样本 t 检验,得到以下结果:

  • 原假设 H0:新药对血压没有影响(新药组和对照组的平均血压相同)。

  • 备择假设 H1:新药对血压有影响(新药组和对照组的平均血压不同)。

  • 显著性水平 α:0.05。

  • 计算得到的 p 值:0.03。

解释:

  • p 值 0.03 表示在新药对血压没有影响的情况下,获得与实际观测数据一样极端或更极端结果的概率是 3%。
  • 由于 p 值(0.03)小于显著性水平 αα(0.05),我们拒绝原假设 H0,认为新药对血压有显著影响。

直观理解

可以把 p 值看作是对原假设 H0 的质疑程度:

  • 小 p 值:数据与原假设 H0 的一致性很低,因此我们更倾向于认为原假设不成立(拒绝原假设)。
  • 大 p 值:数据与原假设 H0 的一致性较高,因此我们没有足够的理由拒绝原假设。

总结

p 值衡量了在原假设为真时,观测到当前数据的概率。通过比较 p 值和预设的显著性水平 αα,我们可以判断是否拒绝原假设,从而得出是否存在显著差异的结论。

三、如何选择合适统计量

选择合适的统计量(statistic)进行假设检验是统计分析中的关键步骤,具体的选择取决于数据的性质、样本量、研究问题以及假设检验的类型。下面是选择合适统计量的一些指导原则和常见的统计量。
指导原则

1. 数据类型:

  • 定量数据(连续数据):如测量值、体重、温度等。
  • 定性数据(分类数据):如类别、性别、品牌等。

2. 分布类型:

  • 正态分布:数据服从正态分布。
  • 非正态分布:数据不服从正态分布。

3. 样本量:

  • 大样本: 通常指样本量大于 30。
  • 小样本: 通常指样本量小于 30。

4. 假设检验类型:

  • 均值检验:比较两个或多个组的均值。
  • 比例检验:比较两个或多个组的比例。
  • 相关性检验:检验两个变量之间的关系。
  • 方差分析:比较多个组的方差。

常见统计量

1. 均值检验:

  • 单样本 t 检验(One-Sample t-Test):用于检验单个样本均值是否与已知值有显著差异。适用于小样本且数据服从正态分布。
  • 独立样本 t 检验(Independent Samples t-Test):用于检验两个独立样本均值是否有显著差异。适用于小样本且数据服从正态分布。
  • 配对样本 t 检验(Paired Samples t-Test):用于检验两个相关样本均值是否有显著差异。适用于小样本且数据服从正态分布。
  • Z 检验(Z-Test):用于检验两个独立样本均值是否有显著差异,适用于大样本。

2. 比例检验:

  • 卡方检验(Chi-Square Test):用于检验分类数据的比例是否有显著差异。适用于大样本。
  • Z 检验(Z-Test):用于检验两个比例是否有显著差异,适用于大样本。

3. 相关性检验:

  • 皮尔逊相关系数(Pearson Correlation Coefficient):用于检验两个连续变量之间的线性关系,适用于数据服从正态分布。
  • 斯皮尔曼等级相关系数(Spearman Rank Correlation Coefficient):用于检验两个连续变量或顺序变量之间的关系,不要求数据服从正态分布。

4. 方差分析(ANOVA):

  • 单因素方差分析(One-Way ANOVA):用于比较多个组的均值是否有显著差异。
  • 双因素方差分析(Two-Way ANOVA):用于比较两个因素对多个组的均值的影响。

5. 非参数检验:

  • 曼-惠特尼 U 检验(Mann-Whitney U Test):用于检验两个独立样本的中位数是否有显著差异,不要求数据服从正态分布。
  • 威尔科克森符号秩检验(Wilcoxon Signed-Rank Test):用于检验两个相关样本的中位数是否有显著差异,不要求数据服从正态分布。
  • 克鲁斯卡尔-沃利斯检验(Kruskal-Wallis Test):用于比较三个或更多独立样本的中位数是否有显著差异,不要求数据服从正态分布。

选择步骤

1. 确定研究问题: 明确需要检验的假设类型(如均值、比例、相关性等)。
2. 数据类型和分布: 根据数据类型和分布选择合适的统计量。
3. 样本量: 根据样本量选择合适的检验方法(如 t 检验或 Z 检验)。
4. 检验假设: 根据假设检验的类型(如单尾或双尾检验)选择适当的统计量。

实例

假设我们要比较两组学生的考试成绩是否有显著差异:

  • 数据类型: 连续数据(考试成绩)。
  • 分布类型: 假设数据服从正态分布。
  • 样本量: 两组学生样本量都小于 30。

根据这些信息,我们可以选择 独立样本 t 检验 来比较两组学生的考试成绩是否有显著差异。

通过以上步骤和指导原则,可以有效选择合适的统计量来进行假设检验,从而得出可靠的结论。

四、统计量和p值有什么关系

统计量(test statistic)和 p 值之间的关系是非常密切的。统计量是从样本数据计算得出的一个值,用于评估数据与原假设(H0)的偏离程度。p 值则是基于统计量计算出来的概率值,用于衡量在原假设为真的情况下,观测到当前统计量或更极端的统计量的概率。

关系总结

  1. 统计量的计算

    • 统计量是从样本数据计算得出的一个值,具体计算方法取决于所使用的假设检验类型。
    • 例如,对于 t 检验,统计量是 t 值;对于卡方检验,统计量是 (\chi^2) 值;对于 z 检验,统计量是 z 值。
  2. 统计量与分布

    • 每种假设检验都有对应的统计分布,如 t 分布、正态分布、卡方分布等。
    • 统计量的位置在对应的统计分布上决定了 p 值。
  3. p 值的计算

    • p 值是根据统计量在对应统计分布中的位置计算得出的概率值。
    • 它表示在原假设为真的情况下,获得与观测数据一样极端或更极端的统计量的概率。

例子解释

1. 单样本 t 检验

假设我们有一个样本数据集,样本均值为 x ˉ = 105 \bar{x} = 105 xˉ=105,样本标准差为 s = 15 s = 15 s=15,样本大小为 n = 30 n = 30 n=30,已知均值为 μ 0 = 100 \mu_0 = 100 μ0=100

  1. 计算 t 统计量
    t = x ˉ − μ 0 s / n = 105 − 100 15 / 30 = 5 2.738 ≈ 1.83 t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}} = \frac{105 - 100}{15 / \sqrt{30}} = \frac{5}{2.738} \approx 1.83 t=s/n xˉμ0=15/30 105100=2.73851.83

  2. 确定 t 分布

    • 自由度 ( d f = n − 1 = 29 ) (df = n - 1 = 29) (df=n1=29)
  3. 查找 t 分布表或使用统计软件

    • 对应 t 值 1.83,在自由度为 29 的 t 分布中查找 p 值。
    • 假设查找结果为 p 值大约是 0.038。
  4. p 值解释

    • p 值 0.038 表示在原假设为真的情况下,获得 t 统计量等于或大于 1.83 的概率是 0.038。
2. 双尾检验

假设进行一个双尾 t 检验:

  • 原假设(H0):样本均值等于总体均值( μ = 0 \mu = 0 μ=0)。
  • 备择假设(H1):样本均值不等于总体均值。

假设计算出的 t 统计量为 2.0。

  1. 计算统计量
    t = 2.0 t = 2.0 t=2.0

  2. 查找 t 分布表

    • 对应 t 值 2.0 和自由度 df 查找 p 值。
  3. 计算 p 值

    • 双尾检验中,p 值是两个尾部的和:
      p = 2 × P ( T > 2.0 ) p = 2 \times P(T > 2.0) p=2×P(T>2.0)

假设查找到的 p 值为 0.05。

关系总结

  • 统计量:从数据中计算得出,用于评估数据与原假设的偏离程度。
  • p 值:基于统计量计算出的概率值,表示在原假设为真时,观测到当前统计量或更极端统计量的概率。

使用统计软件计算

在实际操作中,通常使用统计软件来计算统计量和 p 值。例如,使用 Python 的 scipy.stats 模块:

from scipy import stats

# 样本数据
sample_data = [105, 100, 95, 110, 120, 90, 85, 105, 100, 110]
# 已知均值
mu_0 = 100

# 计算 t 统计量和 p 值
t_stat, p_value = stats.ttest_1samp(sample_data, mu_0)

print(f"t 统计量: {t_stat}")
print(f"p 值: {p_value}")

这段代码会输出 t 统计量和对应的 p 值,帮助你判断是否拒绝原假设。

总结

统计量和 p 值是密切相关的。统计量通过衡量样本数据与原假设的偏离程度,p 值则通过统计量在对应分布中的位置,反映了在原假设为真时,观测到当前数据或更极端数据的概率。理解统计量和 p 值的关系,有助于在假设检验中做出正确的决策。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/801087.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Postman、Apifox、Apipost用哪个?

Postman、Apifox、Apipost都是流行的API接口管理工具,它们各自具有不同的特点和优势,因此哪个更好用取决于具体的使用场景和需求。以下是对这三个工具的比较分析: 一、Postman 特点与优势: 支持多种请求方式:包括GE…

Gartner发布终端安全运营指南:有效终端安全运营的三大关键

孤立的终端管理团队使用专门的工具和策略,这会产生不必要的开支、降低容量、增加风险并降低员工体验。I&O 领导者必须立即采取行动,团结终端管理团队、工具和策略,以取得成功。 主要发现 Gartner 客户互动和最近的一项调查表明&#xff0…

CORDIC Translate

随便记录一下下: Cordic IP核使用说明以及避坑记录-CSDN博客 本次只用到了Translate,记录一下自己遇到的坑坑 实际配置: timescale 1ns / 1nsmodule cordic_tb();reg clk;wire m_axis_dout_tvalid;reg s_axis_cartesian_tvalid 0;wire [31…

Apollo docker-compose

来源 https://www.apolloconfig.com/#/zh/deployment/quick-start-docker 路径 /usr/apollo Sql 自己复制 Vim docker-compose.yml #如果安装过了 记得删除mysql 历史文件 rm -r /var/lib/mysql version: 2.1services:apollo-quick-start:image: nobodyiam/apollo-quick…

《javeEE篇》--多线程(1)

进程 在讲线程之前我们先来简单了解一下进程 什么是进程 进程是操作系统对一个正在运行的程序的一种抽象,又或者说,可以把进程看作程序的一次运行过程(通俗的讲就是跑起来的程序)。 而且在操作系统内部,进程是资源分配的基本单位 PBC P…

食品企业销售管理体系升级的关键

盖世食品(股票代码:836826)是国家级农业产业化重点龙头企业,国家高新技术企业,拥有300种产品,1000SKU。从海洋蔬菜、营养菌菇、健康素菜到海珍味系列和鱼子系列,消费者经常可以从各大餐饮连锁店里吃到这家公司制作的凉…

前端开发(基础)

目录 一、Web前端项目初始化 环境准备 创建项目 前端工程化配置 引入组件库 开发规范 全局通用布局 基础布局结构 全局底部栏 动态替换内容 全局顶部栏 通用路由菜单 支持多套布局 请求 请求工具库 全局自定义请求 自动生成请求代码 全局状态管理 全局权限管…

跟着操作,解决iPhone怎么清理内存难题

在如今智能手机功能日益强大的时代,我们使用手机拍照、录制视频、下载应用、存储文件等操作都会占用手机内存。当内存空间不足时,手机运行会变得缓慢,甚至出现卡顿、闪退等现象。因此,定期清理iPhone内存是非常必要的。那么&#…

最新 taro v3 运行,报错 Error: [object Object] is not a PostCSS plugin 解决办法

报错如下: Error: [object Object] is not a PostCSS plugin 解决办法:pnpm install postcss -D 重新安装 postcss 依赖,重新运行即可。 结果:顺利运行

2000-2023年上市公司融资约束WW指数(含原始数据+计算结果)

2000-2023年上市公司融资约束WW指数(含原始数据计算结果) 1、时间:2000-2023年 2、来源:上市公司年报 3、指标:证券代码、证券简称、统计截止日期、是否发生ST或*ST或PT、是否发生暂停上市、行业代码、行业名称、上…

opengauss数据库兼容模式

一、官方说明 官方描述: 背景信息 初始时,openGauss包含两个模板数据库template0、template1,以及一个默认的用户数据库postgres。postgres默认的兼容数据库类型为O(即DBCOMPATIBILITY A ),该兼容类型下…

nginx的正向与反向代理

正向代理与反向代理的区别 虽然正向代理和反向代理都涉及代理服务器接收客户端请求并向服务端转发请求,但它们之间存在一些关键的区别: 正向代理: 在正向代理中,代理服务器代表客户端向服务器发送请求,并将服务…

怎么调整硬盘分区?让电脑运行更加高效!

硬盘分区是电脑存储管理的重要组成部分,合理的分区设置不仅能提高数据管理的效率,还能在一定程度上提升系统的运行性能。然而,随着使用需求的变化,我们可能需要对已有的硬盘分区进行调整。那么,我们该怎么调整硬盘分区…

PostgreSQL的学习心得和知识总结(一百四十八)|查看 PostgreSQL 17 中的新内置排序规则提供程序

目录结构 注:提前言明 本文借鉴了以下博主、书籍或网站的内容,其列表如下: 1、参考书籍:《PostgreSQL数据库内核分析》 2、参考书籍:《数据库事务处理的艺术:事务管理与并发控制》 3、PostgreSQL数据库仓库…

数码暴龙机(电波暴龙机)彩色复刻版!!| 使用Python、PySide6、pixilart自制windows桌面宠物

一、前言 数码暴龙机(电波暴龙机)是万代公司发售的一系列与《数码兽》系列相关的液晶玩具商品。这些产品融合了养成和对战元素,为玩家提供了一种虚拟养成和战斗的娱乐体验。也是很多人的童年回忆。最近在B站刷到讲解暴龙通关的教程和视频&…

ROS2 + 科大讯飞 初步实现机器人语音控制

环境配置: 电脑端: ubuntu22.04实体机作为上位机 ROS版本:ros2-humble 实体机器人: STM32 思岚A1激光雷达 科大讯飞语音SDK 讯飞开放平台-以语音交互为核心的人工智能开放平台 实现步骤: 1. 下载和处理科大讯飞语音模…

SQL Server的视图

SQL Server的视图 一、基础 SQL 视图(Views)是一种虚拟表,是基于 SQL 查询结果生成的。这些虚拟表可以包含来自一个或多个表的数据,并且可以像表一样查询;视图是一个表中的数据经过某种筛选后的显示方式,或…

Cornerstone3D导致浏览器崩溃的踩坑记录

WebGL: CONTEXT_LOST_WEBGL: loseContext: context lost ⛳️ 问题描述 在使用vue3vite重构Cornerstone相关项目后,在Mac本地运行良好,但是部署测试环境后,在window系统的Chrome浏览器中切换页面会导致页面崩溃。查看Chrome的任务管理器&am…

对话天润融通首席科学家:大模型的首要任务是为客户创造商业价值

2023年,AI大模型开启了企业数智化转型的新篇章。 不过前沿技术固然重要,但在增长见顶的存量背景下,先进技术带来的实用价值也尤为关键。 正如天润融通首席科学家田凤占所说:“现阶段最重要的是让大模型尽快和企业的业务相结合&a…

【Linux】进程间通信——消息队列和信号量

目录 消息队列(message queue) 信号量(Semaphore) system V版本的进程间通信方式有三种:共享内存,消息队列和信号量。之前我们已经说了共享内存,那么我们来看一下消息队列和信号量以及它们之间…