一、期望和方差的定义
随机变量(Random Variable) X 是一个映射,把随机试验的结果与实数建立起了一一对应的关系。而期望与方差是随机变量的两个重要的数字特征。
1. 期望(Expectation, or expected value)
期望是度量一个随机变量取值的集中位置或平均水平的最基本的数字特征;
2. 方差(Variance)
方差是表示随机变量取值的分散性的一个数字特征。 方差越大,说明随机变量的取值分布越不均匀,变化性越强;方差越小,说明随机变量的取值越趋近于均值,即期望值。
(1)百度百科上方差是这样定义的:
方差(variance):是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
(2)方差在统计描述和概率分布中各有不同的定义,并有不同的公式。
思考:为什么要求差的平方?可以参考这个链接里面的注解https://www.shuxuele.com/data/standard-deviation.html
3. 标准差
(1)方差和标准差的关系
方差和标准差的关系很简单,标准差(也称均方差)的平方就是方差。
- 标准差能反映一个数据集的离散程度 (或理解为数据集的波动大小)。
- 既然都能反映数据集的离散程度,既生瑜何生亮?因为我们发现,方差与我们要处理的数据的量纲是不一致的(单位不一致),虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。
- 比如一个班男生的平均身高是170cm,标准差是10cm,那么方差就是100cm^2。可以简便的描述为本班男生身高分布在170±10cm,方差就无法做到这点。
(2)标准差的应用
-
基金
衡量基金波动程度的工具就是标准差(StandardDeviation)。标准差是指基金可能的变动程度。标准差越大,基金未来净值可能变动的程度就越大,稳定度就越小,风险就越高。 -
股市分析
股票价格的波动是股票市场风险的表现,因此股票市场风险分析就是对股票市场价格波动进行分析。波动性代表了未来价格取值的不确定性,这种不确定性一般用方差或标准差来刻画。 -
企业债券
企业债务性资金和权益性资金完全正相关,即相关系数pDE为1。 -
衡量球员发挥水平的稳定性
一支值得信赖的球员队伍,他最不想要的就是表现时好时坏,水平反复无常,波动很大的队员。他需要的是评分高且发挥稳定的球员。
4. 均方误差
均方误差是各数据偏离真实值的距离平方和的平均数,也即误差平方和的平均数,计算公式形式上接近方差,它的开方叫均方根误差,均方根误差和标准差形式上接近。均方误差是各数据偏离真实值的距离平方和的平均数 。
总的来说,均方差是数据序列与均值的关系,而均方误差是数据序列与真实值之间的关系。
5. 极差
百度百科的解释:极差又称范围误差或全距(Range),以R表示,是用来表示统计资料中的变异量数(measures of variation),其最大值与最小值之间的差距,即最大值减最小值后所得之数据。
例:求下列数据集的极差
65、81、73、85、94、79、67、83、82
解:极差指的是这些数字分开得有多远,计算方法是:用其中最大的数减去最小的数。
极差是: 94−65=29
这个数字越大,表示分得越开,最大数和最小数之间的差就越大;该数越小,数字间就越紧密,这就是极差的概念。
6. 协方差
可以通俗的理解为:两个变量在变化过程中是同方向变化,还是反方向变化,同向或反向程度如何?
你变大,同时我也变大,说明两个变量是同向变化的,这时协方差就是正的。
你变大,同时我变小,说明两个变量是反向变化的,这时协方差就是负的。
从数值来看,协方差的数值越大,两个变量同向程度也就越大。反之亦然。
公式简单翻译一下是:如果有X,Y两个变量,每个时刻的“X值与其均值之差”乘以“Y值与其期望。
下面举个例子来说明吧:
比如有两个变量X,Y,观察t1-t7(7个时刻)他们的变化情况。
简单做了个图:分别用红点和绿点表示X、Y,横轴是时间。可以看到X,Y均围绕各自的均值运动,并且很明显是同向变化的。
--------LINE---------
一般的同学看到above the line的内容就ok了。但有一些爱钻研的同学,可能会进一步提问:
7. 相关系数
相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式。简单相关系数:又叫相关系数或线性相关系数,一般用字母 ρ \rho ρ 表示,用来度量两个变量间的线性关系。
翻译一下:就是用X、Y的协方差除以X的标准差和Y的标准差。
所以,相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。
既然是一种特殊的协方差,那它:
- 1、也可以反映两个变量变化时是同向还是反向,如果同向变化就为正,反向变化就为负。
- 2、由于它是标准化后的协方差,因此更重要的特性来了:它消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时的相似程度。
二、期望和方差的运算性质
1. 期望运算性质
2. 方差的运算性质
3. 期望与方差的联系
三、抽样分布
四、区别Y=X+X与Z=2X
https://www.zhihu.com/question/20852004/answer/134902061
https://zhuanlan.zhihu.com/p/64859161