Z检验全面教程
一、核心概念与适用条件
1. 定义与原理
Z检验是基于标准正态分布的假设检验方法,用于判断样本均值与总体均值(或两样本均值)的差异是否具有统计学意义。其核心是通过计算Z值(标准分),量化观测数据与原假设之间的偏离程度。
2. 适用场景
- 单样本Z检验:验证样本均值是否等于已知总体均值(需已知总体标准差)
- 双样本Z检验:比较两个独立大样本的均值差异(需已知或可估计总体标准差)
- 比率Z检验:检验比例或概率差异(如转化率、治愈率等)
3. 必要条件
- 样本量 ≥30(大样本中心极限定理保障)
- 总体服从正态分布(或样本量足够大)
- 总体标准差已知/可估计
二、假设检验四步法
步骤1:建立假设
- 原假设(H₀):无显著差异(如 μ=μ₀ 或 μ₁=μ₂)
- 备择假设(H₁):存在显著差异(如 μ≠μ₀ 或 μ₁≠μ₂)
步骤2:计算Z统计量
单样本检验公式:
Z
=
X
ˉ
−
μ
0
σ
/
n
Z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}}
Z=σ/nXˉ−μ0
其中
X
ˉ
\bar{X}
Xˉ为样本均值,
μ
0
\mu_0
μ0为总体均值,
σ
\sigma
σ为总体标准差,n为样本量
双样本检验公式:
Z
=
(
X
ˉ
1
−
X
ˉ
2
)
σ
1
2
n
1
+
σ
2
2
n
2
Z = \frac{(\bar{X}_1 - \bar{X}_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}
Z=n1σ12+n2σ22(Xˉ1−Xˉ2)
σ
1
2
,
σ
2
2
\sigma_1^2,\sigma_2^2
σ12,σ22为两总体方差
步骤3:确定临界值
查Z表获取临界值(常用α=0.05对应±1.96)
步骤4:决策与结论
- |Z计算| > |Z临界| → 拒绝H₀
- P值 < α → 拒绝H₀
三、经典案例解析
案例1:单样本Z检验(零件检测)
场景:某螺栓标准长度为120mm,已知总体标准差σ=5mm。质检员抽检50个产品,测得平均长度121.5mm,判断产品是否合格。
计算过程:
- 设H₀: μ=120;H₁: μ≠120(α=0.05)
- 代入公式:
Z = 121.5 − 120 5 / 50 = 1.5 0.707 = 2.12 Z = \frac{121.5-120}{5/\sqrt{50}} = \frac{1.5}{0.707} = 2.12 Z=5/50121.5−120=0.7071.5=2.12 - 对比临界值:|2.12| >1.96
- 结论:拒绝H₀,产品长度显著偏离标准
案例2:双样本Z检验(药物疗效)
场景:比较新旧降压药效果,旧药组n₁=45, X ˉ 1 \bar{X}_1 Xˉ1=18mmHg,σ₁=4;新药组n₂=40, X ˉ 2 \bar{X}_2 Xˉ2=15mmHg,σ₂=3.5。检验疗效差异(α=0.01)
计算过程:
- 设H₀: μ₁=μ₂;H₁: μ₁≠μ₂
- 计算Z值:
Z = 18 − 15 4 2 45 + 3. 5 2 40 = 3 0.356 + 0.306 = 3 0.814 = 3.68 Z = \frac{18-15}{\sqrt{\frac{4^2}{45}+\frac{3.5^2}{40}}} = \frac{3}{\sqrt{0.356+0.306}} = \frac{3}{0.814} = 3.68 Z=4542+403.5218−15=0.356+0.3063=0.8143=3.68 - 查临界值(α=0.01):±2.58
- 结论:|3.68|>2.58,拒绝H₀,新药效果显著更优
案例3:比率Z检验(临床试验)
场景:试验组105人中76人症状缓解,对照组111人中49人缓解,比较缓解率差异(α=0.05)
计算过程:
- 设H₀: p₁=p₂;H₁: p₁≠p₂
- 计算合并率:
p ^ = 76 + 49 105 + 111 = 125 216 = 0.5787 \hat{p} = \frac{76+49}{105+111} = \frac{125}{216} = 0.5787 p^=105+11176+49=216125=0.5787 - 计算标准误:
S E = p ^ ( 1 − p ^ ) ( 1 105 + 1 111 ) = 0.5787 × 0.4213 × 0.0187 = 0.0675 SE = \sqrt{\hat{p}(1-\hat{p})(\frac{1}{105}+\frac{1}{111})} = \sqrt{0.5787×0.4213×0.0187} = 0.0675 SE=p^(1−p^)(1051+1111)=0.5787×0.4213×0.0187=0.0675 - 计算Z值:
Z = 0.7238 − 0.4414 0.0675 = 4.18 Z = \frac{0.7238-0.4414}{0.0675} = 4.18 Z=0.06750.7238−0.4414=4.18 - 对比临界值1.96,结论:拒绝H₀,缓解率差异显著
四、注意事项
- 小样本优先使用t检验
- 比率检验需满足np>5且n(1-p)>5
- 双样本检验要求数据独立性
- 单侧检验需调整假设方向与临界值
本教程完整呈现Z检验的理论框架与实操流程,通过三大经典案例演示不同场景下的计算逻辑,可作为统计分析的标准参考指南。