1、总体规模的描述——总量指标
定义:反映在一定时间、空间条件下某种现象的总体规模、总水平或总成果的统计指标。
eg:营业额、利润等
2、总体规模的描述——相对指标
定义:两个有相互联系的指标数值之比
eg:目标完成率(实际完成/计划完成)、比值
3、集中趋势的描述——平均指标
3.1 众数
(1)定义:出现次数最多的变量值
(2)表示符号:Mo
(3)众数的不唯一性,可能有也可能没有
3.2 分位数
定义:是指根据对数据位置进行划分,处于某些特定位置上的数
3.2.1 中位数
定义:数据排序后,处于中间位置上的值
符号:Me
3.2.2 四分位数
定义:四分位数分为:下四分位数和上四分位数两种,指排序后处于25%和75%位置上的值
符号:下四分位数QL,上四分位数QU
3.3 均值
3.3.1 算术平均数
定义:数据和与数据个数之比
表示符号:x̄
3.3.2 几何平均数
定义:n个变量值乘积的n次方根 一般适用于算增长率、或者利率这些;
表示符号:G
3.3.3 调和平均数 (用的比较少)
定义:变量值倒数的算术平均数的倒数
表示符号:H
4、离散程度的描述——变异指标
定义:反映各变量值远离其中心值的程度,是数据分布的另一个重要特征。离散程度越大,均值代表的东西就越少。
4.1 极差
定义:一组数据的最大值与最小值之差。这组数据整体处在数轴的什么位置
表示符号:R
计算 : R=max(Xi)−min(Xi)
4.2 平均差
定义 :所有样本值到均值的平均距离
表示符号:Md
计算
4.3 方差和标准差
4.4 离散系数
上图结果:离散系数相同
需要对比两件事物的离散程度,是利用变异系数进行对比。
4.5 标准化值
定义: 度量的样本值到均值之间的差值是标准差的多少倍,这个倍数即标准化值。
分子的作用:把原来的点平移到y轴,分母——让数据的分布情况产生伸缩
最后一行即是标准化值。
示例:-1.5 度量的:原始25这个数据距离均值34的差值是标准差的 -1.5倍
切比雪夫不等式
5、分布形态的描述——偏态与峰态
看分布图的尾巴在哪,在右则叫右偏分布