目录
1 自由度 /degree of freedom / df
1.1 物理学的自由度(摘自网上= =^)
1.2 数学里的自由度
1.2.2 统计里的自由度
1.2.3 需要补充线性代数的,用线性代数来理解自由度
1.3 统计学里自由度的定义
1.4 自由度的公式
1.5 线性回归公式的自由度:纯公式,无样本时
1.6 抽样分析时:纯样本的自由度
1.7 ESS 残差平方和的误差
1.8 回归方程的自由度
1.8.1 一元线性回归
1.8.2 多元线性回归
2 参考
其他
1 自由度 /degree of freedom / df
1.1 物理学的自由度(摘自网上= =^)
理论力学:
- 确定物体的位置所需要的独立坐标数称作物体的自由度,当物体受到某些限制时——自由度减少。
- 一个质点在空间自由运动,它的位置由三个独立坐标就可以确定,所以质点的运动有三个自由度。假如将质点限制在一个平面或一个曲面上运动,它有两个自由度。
- 假如将质点限制在一条直线或一条曲线上运动,它只有一个自由度。
- 刚体在空间的运动既有平动也有转动,其自由度有六个,即三个平动自由度x、y、z和三个转动自由度a、b、q。如果刚体运动存在某些限制条件,自由度会相应减少。
1.2 数学里的自由度
1.2.1 数学里的自由度
数学上,自由度是一个随机向量的维度数,也就是一个向量能被完整描述所需的最少单位向量数
1.2.2 统计里的自由度
样本容量越大,自由度就越高,就越趋近于正态分布,实验就更加合理
下图转载的,文章链接在最后
1.2.3 需要补充线性代数的,用线性代数来理解自由度
1.3 统计学里自由度的定义
自由度通常用于抽样分布中。
统计学中:在统计模型中,自由度指样本中可以自由变动的独立不相关的变量的个数,当有约束条件时,自由度减少。
- 样本中独立或能自由变化的数据的个数,称为该统计量的自由度。
- 自由度(degree of freedom, df)指的是计算某一统计量时,取值不受限制的变量个数。
1.4 自由度的公式
自由度计算公式:自由度=样本个数-样本数据受约束条件的个数,即df = n - k(df自由度,n样本个数,k约束条件个数)
- df=n-k。
- 自由度df:
- 不受限制的变量个数
- 不受限制的样本个数
- n:
- 自变量个数
- 样本数量
- k:
- 被限制的条件数或变量个数
- 或计算某一统计量时用到其它独立统计量的个数。
- 这些变量之间的有公式关系等形成的约束个数(应该要减掉一些线性相关的约束)
1.5 线性回归公式的自由度:纯公式,无样本时
- 抽象的公式的自由度:自变量的个数.
举例:
- 一元线性回归:y=ax+b
- x是自变量,自由度1
- y是因变量,没有自由度
- 总自由度1
- 多元线性回归:y=a1X1+a2X2+......anXn
- x是自变量,自由度n
- y是因变量,没有自由度
- 总自由度n
1.6 抽样分析时:纯样本的自由度
- 样本的自由度=n-k
- 样本数量n
- 关于样本的约束条件k,比如用到了样本的均值,就少1个自由度
举例
- a+b=1,其中a,b都是变量,那么总自由度为1,因为若a为变量,b会受到1-a的约束,所以不自由。自由度=2个自变量-1被限制的自变量=1
- 总体平均数,u=average(x)。因为总体内,每个样本都是独立的,所以自由度就是总体的容量n
- 样本平均数,average(xi) ,假设有10个样本,平均数=1,那只有前9个数可以自由取值,第10个数,一定得受到平均值得约束,因此自由度=n-1=10-1=9
- 总体方差,公式为
- 样本方差,公式为,因为本身是一个样本的约束,所以自由度=n-1
1.7 ESS 残差平方和的误差
- 需要考虑2方面
- 模型中自变量的个数,+自由度
- 模型中有几个未知数就要消耗几个自由度,-自由度
举例
- 观测值y
- 预测值y^
- 一元线性回归模型 y=b0+b1X+ε,因为每个y^都是用这个模型估算出来的
- y^-y的误差就是残差,也就是ε
- b0 常数,截距
- b1 自变量x的参数,未知,需要求
- ε 残差,残差的均值=0
- 另外,我们心中有一个理想模型y=b0+b1X (虽然不一定存在,不能能找到),但是我们相信我们的观测值符合一个这样的理想直线模型(否则我们也不会用线性回归,而是用曲线或者其他了^ ^)
- y^观测值,记录下来
- 理想模型的y观测值:y=b0+b1X
- ESS=Σ(y^-y)**2 =Σ(y^-b0+b1X)**2
- 残差平方和 ESS 的自由度
- 残差平方和 ESS=Σ(y^-y)**2,因为因为每个y^=b0+b1X,包含2个参数b0,b1 因此需要确定这2个参数,就需要2个约束才能算出来
- 为什么2个参数需要2个约束:因为解方程的需要,而且这2个约束还不能是线性相关的才行。因此有几个未知参数就消耗几个自由度
- 所以,如果需要得到ESS的自由度= n-2
- 所以线性回归的ESS的自由度=n-k-1 ,其中k 是变量个数,1是截距常量个数。
1.8 回归方程的自由度
1.8.1 一元线性回归
- 回归方程 y=b0+b1X
- 其中自变量X,只有1个,自由度+1
- 而参数是2个,也就是2个未知数,b0 和b1,自由度-2
- 如果有n个样本
- 那么回归方程的自由度= n-2+1=n-1
1.8.2 多元线性回归
- 回归方程 y=b0+b1X+b2X+....+bkX,
- 其中自变量X,有k个自变量,自由度+k
- 而参数是k+1个,所有x的参数,还一个一个截距。这些都是未知数。
- 如果有n个样本
- 那么回归方程的自由度= n+k-(k+1)=n-1
2 参考
【弱鸡版】什么回归中自由度(degrees of freedom),就是这么简单! - 知乎自由度是什么?我们先来百度一下: “自由度(degree of freedom, df)指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。 其中n为样本数量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它…https://zhuanlan.zhihu.com/p/607458488
一元线性回归模型中残差平方和的自由度为什么是n-2 - 爱问频道 - 经管之家(原人大经济论坛)一元线性回归模型中残差平方和的自由度为什么是n-2,一元线性回归模型中残差平方和的自由度为什么是n-2?,经管之家(原人大经济论坛) https://bbs.pinggu.org/thread-640905-1-1.html
其他
当想知道适不适合用回归分析时,最简单的方法是做散点图,对于方差分析则做箱线图或是条形图。
均方差:标准差SD