机器学习数学基础:31.Z检验

Z检验全面教程


一、核心概念与适用条件

1. 定义与原理

Z检验是基于标准正态分布的假设检验方法,用于判断样本均值与总体均值(或两样本均值)的差异是否具有统计学意义。其核心是通过计算Z值(标准分),量化观测数据与原假设之间的偏离程度。

2. 适用场景

  • 单样本Z检验:验证样本均值是否等于已知总体均值(需已知总体标准差)
  • 双样本Z检验:比较两个独立大样本的均值差异(需已知或可估计总体标准差)
  • 比率Z检验:检验比例或概率差异(如转化率、治愈率等)

3. 必要条件

  • 样本量 ≥30(大样本中心极限定理保障)
  • 总体服从正态分布(或样本量足够大)
  • 总体标准差已知/可估计

二、假设检验四步法

步骤1:建立假设

  • 原假设(H₀):无显著差异(如 μ=μ₀ 或 μ₁=μ₂)
  • 备择假设(H₁):存在显著差异(如 μ≠μ₀ 或 μ₁≠μ₂)

步骤2:计算Z统计量

单样本检验公式
Z = X ˉ − μ 0 σ / n Z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}} Z=σ/n Xˉμ0
其中 X ˉ \bar{X} Xˉ为样本均值, μ 0 \mu_0 μ0为总体均值, σ \sigma σ为总体标准差,n为样本量

双样本检验公式
Z = ( X ˉ 1 − X ˉ 2 ) σ 1 2 n 1 + σ 2 2 n 2 Z = \frac{(\bar{X}_1 - \bar{X}_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 (Xˉ1Xˉ2)
σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22为两总体方差

步骤3:确定临界值

查Z表获取临界值(常用α=0.05对应±1.96)

步骤4:决策与结论

  • |Z计算| > |Z临界| → 拒绝H₀
  • P值 < α → 拒绝H₀

三、经典案例解析

案例1:单样本Z检验(零件检测)

场景:某螺栓标准长度为120mm,已知总体标准差σ=5mm。质检员抽检50个产品,测得平均长度121.5mm,判断产品是否合格。

计算过程

  1. 设H₀: μ=120;H₁: μ≠120(α=0.05)
  2. 代入公式:
    Z = 121.5 − 120 5 / 50 = 1.5 0.707 = 2.12 Z = \frac{121.5-120}{5/\sqrt{50}} = \frac{1.5}{0.707} = 2.12 Z=5/50 121.5120=0.7071.5=2.12
  3. 对比临界值:|2.12| >1.96
  4. 结论:拒绝H₀,产品长度显著偏离标准

案例2:双样本Z检验(药物疗效)

场景:比较新旧降压药效果,旧药组n₁=45, X ˉ 1 \bar{X}_1 Xˉ1=18mmHg,σ₁=4;新药组n₂=40, X ˉ 2 \bar{X}_2 Xˉ2=15mmHg,σ₂=3.5。检验疗效差异(α=0.01)

计算过程

  1. 设H₀: μ₁=μ₂;H₁: μ₁≠μ₂
  2. 计算Z值:
    Z = 18 − 15 4 2 45 + 3. 5 2 40 = 3 0.356 + 0.306 = 3 0.814 = 3.68 Z = \frac{18-15}{\sqrt{\frac{4^2}{45}+\frac{3.5^2}{40}}} = \frac{3}{\sqrt{0.356+0.306}} = \frac{3}{0.814} = 3.68 Z=4542+403.52 1815=0.356+0.306 3=0.8143=3.68
  3. 查临界值(α=0.01):±2.58
  4. 结论:|3.68|>2.58,拒绝H₀,新药效果显著更优

案例3:比率Z检验(临床试验)

场景:试验组105人中76人症状缓解,对照组111人中49人缓解,比较缓解率差异(α=0.05)

计算过程

  1. 设H₀: p₁=p₂;H₁: p₁≠p₂
  2. 计算合并率:
    p ^ = 76 + 49 105 + 111 = 125 216 = 0.5787 \hat{p} = \frac{76+49}{105+111} = \frac{125}{216} = 0.5787 p^=105+11176+49=216125=0.5787
  3. 计算标准误:
    S E = p ^ ( 1 − p ^ ) ( 1 105 + 1 111 ) = 0.5787 × 0.4213 × 0.0187 = 0.0675 SE = \sqrt{\hat{p}(1-\hat{p})(\frac{1}{105}+\frac{1}{111})} = \sqrt{0.5787×0.4213×0.0187} = 0.0675 SE=p^(1p^)(1051+1111) =0.5787×0.4213×0.0187 =0.0675
  4. 计算Z值:
    Z = 0.7238 − 0.4414 0.0675 = 4.18 Z = \frac{0.7238-0.4414}{0.0675} = 4.18 Z=0.06750.72380.4414=4.18
  5. 对比临界值1.96,结论:拒绝H₀,缓解率差异显著

四、注意事项

  1. 小样本优先使用t检验
  2. 比率检验需满足np>5且n(1-p)>5
  3. 双样本检验要求数据独立性
  4. 单侧检验需调整假设方向与临界值

本教程完整呈现Z检验的理论框架与实操流程,通过三大经典案例演示不同场景下的计算逻辑,可作为统计分析的标准参考指南。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/975470.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Flash-01

1-初始登录页面 2-【文件】-【新建】 3-【ActionScript3.0】 4-常用功能介绍【关闭/开启】 4-1-【关闭开始页】 勾选【不再提示】 4-2-【开启开始页】 【编辑】-【首选参数】-【常规】-【重置所有警告对话框】 5-恢复初始页面 【窗口】-【工作区】-【重置】 6-常用快捷键 …

Golang | 每日一练 (3)

&#x1f4a2;欢迎来到张胤尘的技术站 &#x1f4a5;技术如江河&#xff0c;汇聚众志成。代码似星辰&#xff0c;照亮行征程。开源精神长&#xff0c;传承永不忘。携手共前行&#xff0c;未来更辉煌&#x1f4a5; 文章目录 Golang | 每日一练 (3)题目参考答案map 实现原理hmapb…

DeepSeek掘金——基于DeepSeek-R1构建文档问答机器人

DeepSeek掘金——基于DeepSeek-R1构建文档问答机器人 在这个项目中,我们将结合本地 AI 的隐私与 Deepseek R1 的智能,创建一个完全本地化、推理驱动的问答机器人。 在人工智能 (AI) 日益融入我们日常生活的时代,一个问题仍然处于最前沿:隐私。尽管基于云的 AI 系统功能强大…

蓝桥杯学习笔记04-滑动窗口不定长(最短/最小)

题目来源 分享丨【题单】滑动窗口与双指针&#xff08;定长/不定长/单序列/双序列/三指针/分组循环&#xff09; - 力扣&#xff08;LeetCode&#xff09; 209. 长度最小的子数组 - 力扣&#xff08;LeetCode&#xff09; 题目要求大于等于 class Solution { public:int min…

基于WOA鲸鱼优化的BiLSTM双向长短期记忆网络序列预测算法matlab仿真,对比BiLSTM和LSTM

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 2.算法运行软件版本 matlab2022a/matlab2024b 3.部分核心程序 &#xff08;完整版代码包含详细中文注释和操作步骤视频…

DeepSeek R1本地+私有云版医疗AI部署开发成功案例技术剖析

1. 引言 1.1 研究背景与意义 随着科技的飞速发展,人工智能(AI)在医疗领域的应用正逐渐成为推动医疗行业变革的重要力量。近年来,医疗 AI 取得了显著的进展,从疾病诊断、药物研发到医疗管理等各个环节,AI 技术都展现出了巨大的潜力。它能够处理和分析海量的医疗数据,为…

【行业解决方案篇十八】【DeepSeek航空航天:故障诊断专家系统 】

引言:为什么说这是“航天故障终结者”? 2025年春节刚过,航天宏图突然官宣"DeepSeek已在天权智能体上线",这个搭载在卫星和空间站上的神秘系统,号称能提前48小时预判99.97%的航天器故障。这不禁让人想起年初NASA禁用DeepSeek引发的轩然大波,更让人好奇:这套系…

四步彻底卸载IDEA!!!

各位看官早安午安晚安呀 如果您觉得这篇文章对您有帮助的话 欢迎您一键三连&#xff0c;小编尽全力做到更好 欢迎您分享给更多人哦 大家好&#xff0c;我们今天来学习四步彻底卸载IDEA&#xff01;&#xff01;&#xff01; 首先我要提醒各位 如果你想删除 IDEA 相关&#xf…

Codes 开源免费研发项目管理平台 2025年第一个大版本3.0.0 版本发布及创新的轻IPD实现

Codes 简介 Codes 是国内首款重新定义 SaaS 模式的开源项目管理平台&#xff0c;支持云端认证、本地部署、全部功能开放&#xff0c;并且对 30 人以下团队免费。它通过创新的方式简化研发协同工作&#xff0c;使敏捷开发更易于实施。并提供低成本的敏捷开发解决方案&#xff0…

BIRCH算法深度解析与实践指南

一、算法全景视角 BIRCH&#xff08;Balanced Iterative Reducing and Clustering using Hierarchies&#xff09;是首个针对超大规模数据集的聚类算法&#xff0c;可在有限内存下高效处理十亿级数据。其核心创新在于采用CF Tree数据结构&#xff0c;将数据压缩为多级聚类特征…

更改conda 环境默认安装位置

一、找到".condarc" Windows 下&#xff0c;~/.condarc 文件通常位于 C:\Users\<你的用户名>\.condarc 二、修改内容 在.condarc 里添加上 envs_dirs:- D:\ProgramData\anaconda3\envs- C:\Users\<你的用户名>\.condarc &#xff08;第一个优先&…

vue怎么设置允许局域网手机访问

打开vite.config.ts 添加 server: {host: 0.0.0.0}, host: 0.0.0.0&#xff1a;设置为0.0.0.0&#xff0c;允许从所有IP访问。port: 5173&#xff1a;指定端口号&#xff0c;可以根据需要进行修改。不指定默认 5173disableHostCheck: true&#xff1a;禁用主机检查&#xff0c…

【Git 学习笔记_27】DIY 实战篇:利用 DeepSeek 实现 GitHub 的 GPG 秘钥创建与配置

文章目录 1 前言2 准备工作3 具体配置过程3.1. 本地生成 GPG 密钥3.2. 导出 GPG 密钥3.3. 将密钥配置到 Git 中3.4. 测试提交 4 问题排查记录5 小结与复盘 1 前言 昨天在更新我的第二个 Vim 专栏《Mastering Vim (2nd Ed.)》时遇到一个经典的 Git 操作问题&#xff1a;如何在 …

为什么继电器要加一个反向并联一个二极管

1 动感就是电流不突变 2 为什么有的继电器上面要反向并联一个二极管和电阻 1 并联二极管是为消除掉动感产生的高压 2 加上二极管是为了让继电器更快的断开&#xff08;二极管选型的工作电流要大于动感电流&#xff0c;开关要够快&#xff09; 3 公式&#xff1a;二极管压降0…

每日精讲:删除有序数组中的重复项,移除元素,合并两个有序数组

一 移除元素 1题目链接&#xff1a;27. 移除元素 - 力扣&#xff08;LeetCode&#xff09; 2题目描述&#xff1a; 给你一个数组 nums 和一个值 val&#xff0c;你需要 原地 移除所有数值等于 val 的元素。元素的顺序可能发生改变。然后返回 nums 中与 val 不同的元素的数…

Docker-技术架构演进之路

目录 一、概述 常见概念 二、架构演进 1.单机架构 2.应用数据分离架构 3.应用服务集群架构 4.读写分离 / 主从分离架构 5.引入缓存 —— 冷热分离架构 6.垂直分库 7.业务拆分 —— 微服务 8.容器化引入——容器编排架构 三、尾声 一、概述 在进行技术学习过程中&am…

关于使用带elementplus前缀图标的步骤

关于使用带elementplus前缀图标的步骤 官网 安装 | Element Plus 1.需要全局注册 2.使用某个图标时导入&#xff0c; 如 import { Search } from element-plus/icons-vue

DPVS-3: 双臂负载均衡测试

测试拓扑 双臂模式&#xff0c; 使用两个网卡&#xff0c;一个对外&#xff0c;一个对内。 Client host是物理机&#xff0c; RS host都是虚拟机。 LB host是物理机&#xff0c;两个CX5网卡分别在两个子网。 配置文件 用dpvs.conf.sample作为双臂配置文件&#xff0c;其中…

买股票的最佳时机 - 2

买卖股票的最佳时机 III 题目描述&#xff1a; 提示&#xff1a; 1 < prices.length < 1050 < prices[i] < 105 分析过程&#xff1a; 写动态规划&#xff0c;我们需要考虑一下问题&#xff1a; 定义状态状态转移方程初始条件 遍历顺序 4种状态&#xff1a; …

数据分析与算法设计-作业2-拉普拉斯算子空间滤波和增强

作业2 题目 对Flower.dat图像&#xff08;10241024&#xff0c;np.uint8&#xff09;用如下拉普拉斯算子进行空间滤波和增强&#xff1a;np.array([[0, -1, 0], [-1, 4, -1], [0, -1, 0]])&#xff0c;图像边缘采用复制填充方式&#xff0c;不使用其他第三方库&#xff0c;使…