excel统计分析——偏度、峰度

参考链接:

偏度与峰度的正态性分布判断 - 知乎

描述统计学 - 知乎

样本偏度(skewness)与随机变量的偏度及三阶统计量之间的关系和计算估计-CSDN博客

数据分析中如何衡量数据的分布 - 知乎

KURT 函数 - Microsoft 支持

SKEW 函数 - Microsoft 支持

Standard errors of skewness and kurtosis are all the same for a set of variables

用偏度系数、峰度系数考察正态性假设 - 知乎

1、偏度

        偏度衡量随机变量概率分布的不对称性,是相对于平均值不对称程度的度量,通过对偏度系数的测量,我们能够判定数据分布的不对称程度以及方向。
       具体来说,对于随机变量X,我们定义偏度为其的三阶标准中心距。我们可以基于矩估计,得到总体的偏度为:

SK=\frac{m_{3}}{m_{2}^{3/2}}=\frac{\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{3}}{[\frac{1}{n}\sum_{n=1}^{n}(x_{i}-\bar{x})^{2}]^{\frac{3}{2}}}

其中,\bar{x}为总体均值,m_{3}为三阶中心距,m_{2}为二阶中心距。

样本量为n的样本偏度,可表示为:

SK=\frac{\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{3}}{[\frac{1}{n-1}\sum_{n=1}^{n}(x_{i}-\bar{x})^{2}]^{\frac{3}{2}}}

而在许多文献中,尤其对小样本来说,一个常用的样本偏度的估计,计算公式为:

        SK=\frac{n^{2}}{(n-1)(n-2)}\frac{m_{3}}{s^{3}}=\frac{n^{2}}{(n-1)(n-2)}\times \frac{\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{3}}{[\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}]^{\frac{3}{2}}}

       偏度的衡量是相对于正态分布来说,正态分布的偏度为0,即若数据分布是对称的,偏度为0。若偏度大于0,则分布右偏,即分布有一条长尾在右;若偏度小于0,则分布为左偏,即分布有一条长尾在左(如下图);同时偏度的绝对值越大,说明分布的偏移程度越严重。【注意:数据分布的左偏或右偏,指的是数值拖尾的方向,而不是峰的位置。】

2、峰度

        峰度,是研究数据分布陡峭或者平滑的统计量,通过对峰度系数的测量,我们能够判定数据相对于正态分布而言是更陡峭还是更平缓。比如正态分布的峰度为0,均匀分布的峰度为-1.2(平缓),指数分布的峰度6(陡峭)。

峰度定义为四阶中心距除以方差的平方减3(这也被称为超值峰度,“减3”是为了让正态分布的峰度为0),总体的超值峰度公式可表示为:

K=\frac{m_{4}}{m_{2}^{2}}-3=\frac{\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{4}}{(\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^2)^{2}}-3

样本为n的样本峰度,可表示为:

K=\frac{n(n+1)(n-1)}{(n-2)(n-3)}\times \frac{\sum_{i=1}^{n}(x_{i}-\bar{x})^{4}}{(\sum_{i=1}^{n}(x_{i}-\bar{x})^{2})^{2}}-\frac{3(n-1)^{2}}{(n-2)(n-3)} =\frac{n^{2}(n+1)}{(n-1)(n-2)(n-3)}\times \frac{\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{4}}{(\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2})^{2}}-\frac{3(n-1)^{2}}{(n-2)(n-3)}

        若峰度 ≈ 0 , 分布的峰态服从正态分布;
        若峰度>0,分布的峰态陡峭(高尖);
        若峰度<0,分布的峰态平缓(矮胖)。

3、正态性判断

        对于一组数据来说,如果计算出来的偏度和峰度都在0附近,那么可以初步判断其分布服从正态分布。

      我们可以把偏度系数和峰度系数转换为标准正态分布的Z值。转换为Z值后:

  1. 可以比较不同样本的不同单位数据的偏度系数和峰度系数。
  2. 可以根据Z值表计算出如果数据符合分布,出现目前样本偏度系数/峰度系数或更极端值的可能性大小,即可以对偏度系数或者峰度系数是否为0做假设检验。

        将某统计量转换为标准正态分布Z值,只需要将该统计量减去该统计量分布的均值后再除以该统计量的标准差(标准误)就行了。这里我们假设检验中原假设是系数为0,所以减去的均值用0来带入。标准正态分布下双侧尾部面积0.05对应Z值为1.96。因此转换后的Z值如果绝对值大于1.96(也可以将其近似为2),对应P值就小于0.05。

        应用时需要注意:大样本量下标准误会较小,即使系数距离0很近得到的Z值也会很大,容易拒绝原假设。当样本量小于100时,尝试峰度和偏度系数来判断样本的正态性会比较合理。当样本量大于100时,这种显著性检验意义就不大了(因为即使很小的差异也很容易有统计学意义),更需要结合作图观察数据分布的形状。

Z值转换步骤如下:

Z=|K-0|/SK (K为偏度,SK为偏度的标准误)

其中,SK=\sqrt{\frac{6\times N\times (N-1)}{(N-2)\times (N+1)\times (N+3)}},N为样本量。

        

Z=|S-0|/SS (S为峰度,SS为峰度的标准误)

其中,SS=\sqrt{\frac{4\times (N^{2}-1)\times SK^{2}}{(N-3)(N+5)}},N为样本量,SK为样本偏度的标准误

        在α=0.05的情况下,Z值绝对值大于1.96时,即可认为K系数或S系数显著不等于0,即样本数据非正态。

4、excel操作步骤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/261253.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python中的函数

创建和使用 创建函数的语法如下&#xff1a; def 函数名(参数):代码块(函数体) 函数的参数 形参&#xff1a;在定义函数的时候传递的参数 实参&#xff1a;在调用函数时传递的参数 无参&#xff1a;没有任何参数 位置参数 实参的位置和形参一一对应&#xff0c;不能多也不…

PowerDesigner画模型工具下载安装及基本操作

进行大型项目代码开发之前&#xff0c;一般会进行模型设计&#xff0c;画概念模型&#xff08;CDM&#xff09;、逻辑模型&#xff08;LDM&#xff09;、物理模型&#xff08;PDM&#xff09;。下面说一下PowerDesigner画模型工具下载安装及基本操作 一、下载与安装&#xff1…

如何解决苹果应用商城审核拒绝的Guideline 2.3.1 - Performance问题

当您的应用程序在苹果应用商城审核过程中被拒绝时&#xff0c;苹果会向您发送一封邮件&#xff0c;其中提供了关于拒绝原因的详细信息。本文将深入探讨如何正确处理Guideline 2.3.1 - Performance问题&#xff0c;并提供解决方案和优化建议&#xff0c;以确保您的应用程序能够通…

LeetCode刷题--- 括号生成

个人主页&#xff1a;元清加油_【C】,【C语言】,【数据结构与算法】-CSDN博客 个人专栏 力扣递归算法题 http://t.csdnimg.cn/yUl2I 【C】 http://t.csdnimg.cn/6AbpV 数据结构与算法 http://t.csdnimg.cn/hKh2l 前言&#xff1a;这个专栏主要讲述递归递归、搜…

韩语中的一次多用-柯桥基础韩语学习

1.动词&#xff0c;写 일기를 쓰다 写日记 2.动词&#xff0c;戴&#xff08;帽子&#xff0c;眼镜&#xff0c;口罩&#xff09; 안경을 쓰다 戴眼镜 3.动词&#xff0c;使用&#xff08;材料&#xff0c;道具&#xff0c;手段&#xff09; 세제를 쓰다 使用洗剂 4.动词&am…

【openwrt学习笔记】IPV6 ND协议学习和socket编程

目录 一、参考链接二、学习目标三、代码解析3.1 仅解析NA报文保存设备mac和ipv6地址信息3.1.1 open_ns_socket3.1.2 recv_ns_pack 3.2 解析NA和NS报文中DAD报文保存设备mac和ipv6地址信息3.2.1 open_ns_na_socket3.2.2 recv_ns_na_pack 四、代码优化4.1 BPF参考学习资料4.2 代码…

软件工程--设计工程--学习笔记(软件设计原则、软件质量属性设计、架构风格......)

软件设计在软件工程中处于技术核心&#xff0c;其目的是把需求分析模型转变为设计模型&#xff0c;以知道软件的实现&#xff0c;本章讲解软件设计的基本原则和基本实践 本文参考教材&#xff1a;沈备军老师的《软件工程原理》 软件设计概述 软件设计分为两个阶段&#xff0…

SpringBoot之IOCDI的详细解析

3.3.2 IOC详解 通过IOC和DI的入门程序呢&#xff0c;我们已经基本了解了IOC和DI的基础操作。接下来呢&#xff0c;我们学习下IOC控制反转和DI依赖注入的细节。 3.3.2.1 bean的声明 前面我们提到IOC控制反转&#xff0c;就是将对象的控制权交给Spring的IOC容器&#xff0c;由…

计算机网络实验速成

目录 网络实验速成 自动连接类型&#xff1a; 指示灯状态说明&#xff1a; 显示接口&#xff1a; 放置注释信息&#xff1a; 配置计算机&#xff1a; 同理&#xff0c;配置服务器&#xff1a; 配置路由器&#xff1a; router0 配置&#xff1a; router1 配置&…

2024年建立电子商务知识库的终极指南

Insider Intelligence报告称&#xff0c;2020年全球电子商务购物市场规模达到了近4万亿美元&#xff0c;并且没有放缓增长的迹象。 随着亚马逊通过一流的产品、快速的配送、无忧的退款等优势主导数字领域&#xff0c;电子商务行业的竞争变得越来越激烈。随着每年有越来越多的公…

第五节TypeScript 运算符

一、描述 运算符用于执行程序代码运算。 二、运算符主要包括&#xff1a; 算术运算符逻辑运算符关系运算符按位运算符赋值运算符三元/条件运算符字符串运算符类型运算符 1、算术运算符 y5&#xff0c;对下面算术运算符进行解释&#xff1a; 运算符 描述 例子 x 运算结果…

自己制作指定格式的bmp文件

1、CAD绘制形状&#xff0c;设置区域方便接下里操作 2、导出为pdf&#xff08;导出的png或者Jpg极度不清晰&#xff09; 打印->自己设置->框选范围 3、截图截取制作的bmp范围&#xff0c;保存为bmp或png 我这里是通过snagit保存为png的&#xff08;也可以直接保存为bm…

基于华为atlas的烟火检测实战

1、下载官方yolov5的v6.1版本 git clone https://github.com/ultralytics/yolov5.git git checkout v6.1 2、烟火数据集准备&#xff1a; tree -d Images/train/目录下图片 Labels/train/目录下标签 3、数据格式转化&#xff1a; 数据集采用labelimg标注&#xff0c;xml文件…

jmeter如何参数化?Jmeter参数化设置的5种方法

jmeter如何参数化&#xff1f;我们使用jmeter在进行测试的时候&#xff0c;测试数据是一项重要的准备工作&#xff0c;每次迭代的数据当不一样的时候&#xff0c;需要进行参数化&#xff0c;从参数化的文件中来读取测试数据。那么&#xff0c;你知道jmeter如何进行参数化吗&…

PHP-PhpSpreadsheet导出带图片方法

需求描述 导出表格&#xff0c;项目名称对应项目详情页面二维码。 实现方法 1&#xff0c;先将各个项目生成的二维码存放到了一个指定目录里面&#xff1b; 2&#xff0c;导出数据到excel表格 <?phpuse PhpOffice\PhpSpreadsheet\Spreadsheet; use PhpOffice\PhpSpread…

图像分割与修复

图像分割的方法 &#xff08;1&#xff09;传统的图像分割方法 &#xff08;2&#xff09;基于深度学习的图像分割方法 传统的图像分割方法 &#xff08;1&#xff09;分水岭法 &#xff08;2&#xff09;GrabCut法 &#xff08;3&#xff09;MeanShift法 &#xff08;4…

基于SpringBoot的校园电商物流云平台 JAVA简易版

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 商品数据模块2.3 快递公司模块2.4 物流订单模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 商品表3.2.2 快递公司表3.2.3 物流订单表 四、系统展示五、核心代码5.1 查询商品5.2 查询快递公司5.3 查…

[Unity错误解决]There are 2 audio listeners in the scene.

There are 2 audio listeners in the scene. Please ensure there is always exactly one audio listener in the scene. 从组件中找出包含 Audio Listener 的&#xff0c;只激活一个&#xff0c;其他的关掉

POI2012 PRE-Prefixuffix

P3546 [POI2012] PRE-Prefixuffix 题目大意 对于两个字符串 S 1 , S 2 S_1,S_2 S1​,S2​&#xff0c;如果将 S 1 S_1 S1​的一个后缀移动到开头后这个字符串变成了 S 2 S_2 S2​&#xff0c;则称 S 1 , S 2 S_1,S_2 S1​,S2​循环同构。 给定一个长度为 n n n的字符串 S S …

Android Studio打包有哪些优势

大家好&#xff0c;现在移动应用程序的快速发展&#xff0c;开发者需要一个强大又可靠的开发环境来创建和打包高质量的 Android 应用程序。Android Studio 是一款由 Google 官方开发的 Android 应用程序开发环境&#xff0c;提供了许多的优势和便利&#xff0c;那究竟都有哪些优…