1.P值是什么?
P值(P-value)是假设检验中的一个重要指标,用于衡量样本数据对于零假设的支持程度。具体来说,P值表示在假设零假设为真的情况下,观察到的样本数据或更极端情况出现的概率。
通常情况下,P值的范围从0到1,其中:
-
如果P值很小(通常小于0.05),意味着观察到的样本数据在假设零假设为真的情况下出现的概率很低。这表明我们有足够的证据来拒绝零假设,并支持备择假设。
-
如果P值较大(通常大于0.05),意味着观察到的样本数据在假设零假设为真的情况下出现的概率较高。这表明我们没有足够的证据来拒绝零假设,无法支持备择假设。
P值是假设检验中的一个关键指标,它可以帮助我们做出对假设是否成立的推断。
对于那款新的降压药,公司又扩大了被试规模,这次老板给了你50个抽样数据,得出均值是15.5mmHg,标准差是5.5mmHg,老板说药品要经过有关部门的抽查,抽查的降压效果要大于10mmHg,降压药才能上市,想让你帮算会不会抽查结果只有10或者比10还少。
通过上篇文章的学习,我们已经会计算总体的置信区间了:
首先计算标准误差,
代入给定的值:
接下来,我们可以使用置信水平和标准正态分布的临界值来计算置信区间。常见的置信水平为95%。对于95%的置信水平,我们使用标准正态分布的临界值,约为1.96。
置信区间的计算公式为:
代入给定的值:
你跟你的老板说,我们的总体均值95%置信区间是(13.976,17.024),抽检95%都会在这个范围里,大于10mmHg,请他放心。可他就是焦虑,一定让你算有没有可能低于10mmHg。
你想起抽样的结果也是正态分布的,可以将其转化为标准正态分布,看看小于10mmHg的概率到底是多少。
由于z值为-7.07非常小,超出了标准正态分布表中的范围,因此我们可以近似地认为对应的概率非常接近于0。
(在标准正态分布表中,z值的范围通常限定在-3.5到3.5之间,对于超出这个范围的极端值,我们可以直接判断其对应的概率非常接近于0)
这下你的老板终于放心了。
我们还可以用假设检验的办法宽慰你的老板,我们假设H0,总体均值就在10mmHg,H1,总体均值不在10mmHg。
假设H0成立,那么Z值:
计算得z=7.07,由于7.07在拒绝域,大于1.96,P<0.05, 所以总体均值就是10mmHg不成立,我们拒绝原假设H0。
2.P值是不是越小越好?
P值的大小与假设检验的结果有关,但不能简单地说越小越好。P值的大小需要结合具体的假设检验问题和显著性水平来进行解释。
一般来说,P值小于显著性水平(通常为0.05或0.01)时,我们会拒绝零假设,认为观察到的样本数据对备择假设提供了足够的支持。这意味着我们有足够的证据来认为所研究的效应是真实存在的,或者两组数据之间的差异是显著的。
然而,P值很小并不意味着研究结果具有重要性或实际意义。P值的大小受到样本量、效应大小以及数据分布等因素的影响。因此,在解释P值时,还应考虑实际问题的背景和具体情况,以综合考量数据的统计显著性和实际意义。
请注意,P值只能显示出存在差异的可能性,而不能衡量存在多大的差异。也就是说P值越小,代表总体参数存在差异的可能性越大,但是不代表总体参数差距越大。
比如下面的例子:
两组实验中,第一组实验组的样本量较大(n=1000),而第二组实验组的样本量较小(n=8)。
对于第一组实验,实验组降压效果为17,对照组为16,样本量较大(n=1000),结果P值小于0.05,这意味着实验组和对照组之间的差异在统计上是显著的。
而对于第二组实验,实验组降压效果为24,对照组为16,样本量较小(n=8),结果P值大于0.05,这意味着实验组和对照组之间的差异在统计上不是显著的。
这种情况是可能的,因为样本量的大小会影响到统计显著性的检测能力。较大的样本量可以更容易地检测到较小的效应,而较小的样本量则可能需要更大的效应才能检测到统计显著性。