二项分布
定义
对立事件的总体分布,称为二项分布。
例如,一个群体只有男和女,现在进行n次随机抽样调查,随机抽样男出现的次数可能是0,1,2,3,4,…,n,
这种类似事件的分布称为二项分布。
特性
常用于
- 推断某个变量是否属于特定的二项分布总体B(n,p)
- 根据 公式 x = N*P(x) 求期望值 x 对应的理论样本N的大小
泊松分布
定义
特性
正态分布
定义
特性
标准正态分布
定义
正态分布的变形及应用
从正态总体中进行随机抽样,组成抽样的变量具有随机性,所以抽样的平均数以及方差,标准差也是不固定的。但是多次抽样后,样品的平均数呈现有规律的正态分布。
样品平均数的分布符合正态分布 N(μ,σ^2/n),其中 n是样本容量
可以用来判断样本是否属于总体,或者两个样本是否属于同一个总体
从两个正态总体中进行抽样,样本平均数之间的差值也属于正态分布 N(μ1 - μ2,σ1^2/n1 + σ2^2/n2)
可以用来判断两个样本是否属于独立的正态总体
通俗点说,从标准正态分布中抽样,得到一系列标准离差,这些标准离差的平方和称为 卡方。
因为抽取的标准离差具有随机性,所以卡方也具有不确定性。但是不确定的卡方值具有规律性的分布,称为卡方分布。
常说的卡方检验用来干啥呢?
是否来自同一个正态总体
拟合优度检测
独立性检测:一般用于列联表中变量的独立性检验
样品独立性检验
方差齐性检验
t分布
正态总体常做坐标轴以及尺度的转换,形成标准正态分布,也就是u分布N(0,1)。
其中 u = x - μ / σ
现在的情况是总体方差未知且样本容量小(<30),做标准正态转换时,使用样本方差代替总体方差 u = x - μ / sqrt(S) 会出现偏差,不能称为标准正态分布,然后给这种分布一个新名字,叫做 t分布。
正态分布与t分布的异同点
-
正态分布是一个曲线系统,为了方便使用一般会做标准化处理,使之成为 u 分布
u = x - μ / σ -
t 分布是一个自由度 df = n-1的曲线系统,中心位置是0,但是σ = df / df - 2不固定
-
标准正态分布中心位置是0,σ = 1是一个固定的曲线。
-
为什么出现 t 分布?
正态总体中随机抽样, 样品平均数的分布符合正态分布 N(μ,σ^2/n),其中 n是样本容量抽样的时,样本容量小于30,而且总体方差未知,其中样本平均数的平均值都等于μ,但是样本平均数的方差 σ^2/n就无法得知了,而且使用样本方差 代替总体方差会出现较大的误差。
然后有大牛推导出了σ^2 = df / df -2 (其中df = n -1,也就是说样本容量最小是3)那平常只有一个重复组怎么做显著性检验啊?