概率论的学习和整理21:用EXCEL来做假设检验(未完成草稿)

目录

1 EXCEL可以用来做假设检验

1.1 如何打开 数据分析 和 规划求解

1.2  EXCEL里关于正态分布的准备知识

2 基本的假设检验

2.1 最基本的假设检验,单边的Z检验

2.1 双样本F检验

2.1.1 例题

2.1.2 进行F检验之前需要满足一些假设条件

2.1.3 计算步骤

2.1.4 如何查表:下面这个图是 显著度a=0.05的F值表

 2.1.5 如何分析F检查的结果

2.2

2.5 方差分析(one-way ANOVA)


1 EXCEL可以用来做假设检验

  • EXCEL里可以做假设检验的
  • 但是需要打开加载项,数据分析才可以

1.1 如何打开 数据分析 和 规划求解

  • 开始-----选项-----加载项

  • 加载项里选择 数据分析 & 规划求解

1.2  EXCEL里关于正态分布的准备知识

  • 正态分布,
  • 正态分布曲线图,横轴是x,纵轴是概率p
  • 而normsinv是正态分布的反函数,可以根据概率求出 自变量的值
  • 函数 normsinv()
  • 函数 norm.s.inv()
  • 函数 norm.s.dist()
  • 作用是在EXCEL里配合使用  normsinv(rand()) 或 normsinv(rand()) 生成一些本身就符合正态分布的数据。
  • 如果有其他分布的反函数,理论上也可以生成符合其他分布的数据。

2 基本的假设检验

2.1 最基本的假设检验,单边的Z检验

2.2 双样本F检验

  • 最常用的应该就是用来于比较两个或多个组间的平均值是否有显著差异。
  • 原假设:一般就是认为符合,没差异等天真假设
  • F检验的原假设是所有组之间的差异是出于偶然。换句话说,原假设认为各组之间的平均值没有显著差异。
  • F检验的原理是,如果两个或多个组间的平均值或其他统计量之间存在显著差异,则组间方差(inter-group variance)会较大,而组内方差(intra-group variance)较小。
  • 因此F值=组间方差 / Σj 组内方差,如果F值越大,证明组间方差>>组内方差
  • P值 = 概率(F值 ≥ 实际F值 | 原假设) ,也就是p越小,证明 原假设--相信方差相同/期望相同的概率很小,不是观测造成,而是其他原因造成的。

​参考下面的文档

F检验结果应该怎么看? - 知乎F检验是一种统计检验,可用来比较两个或多个组间的平均值是否有显著差异。它是由Ronald Fisher发明的,因…https://www.zhihu.com/question/453744187/answer/2805042211

2.2.1 例题

2.2.2 进行F检验之前需要满足一些假设条件

  • 样本是随机取样的,也就是说,每个组中的观测值是独立的。
  • 样本是来自正态分布的总体。
  • 每个组的样本容量应该相等

2.2.3 计算步骤

  • 需要计算出三组数据的平均值,
  • 平均值等于所有数加起来的和除以数据个数。
  • 然后计算出组内方差和组间方差。    

α (alpha)是显著度           

组内方差(intra-group variance)              

  • 使用样本方差公式,组内方差等于每个数据与其所在组的平均值的差的平方和除以(组内数据个数-1)。
  1. 因为每种数据的样本容量要相同,i相同
  2. u1,u2  ... ... 是每组平均数
  3. 平均数就是最简单得算术平均数,u1=(x1+x2+....+xi)/i
  4. 如第1组组内方差,δ^2=((u1-x1)^2+(u1-x2)^2+....++(u1-xi)^2)/(i-1)
  5. 如第2组组内方差,δ^2=((u2-x1)^2+(u2-x2)^2+....++(u2-xi)^2)/(i-1)

组间方差(inter-group variance)

  • 使用样本方差公式,组间方差等于每个数据与其所在组的平均值的差的平方和除以(组的数量个数-1)。
  1. U是多组数据之和=全部数据 的平均值
  2. 假设有 j 组数组
  3. 组间方差,δ^2=((U-u1)^2+(U-u2)^2+....++(U-uj)^2)/(j-1)

F值

  • F= 组间方差除以组内方差的和。
  • F= 组间方差 / Σj 组内方差
  • 然后查表,k1组间自由度等于组数减1,k2组内自由度等于每组个数减去组数。
  • 下面的例子里,k1=2-1,k2=30-2=28
  • 如果F值打羽查表得到的F值,说明差异显著,否则说明差异不显著。

P值的计算公式如下:

  • P值 = 概率(F值 ≥ 实际F值 | 原假设)
  • 其中,原假设是所有组之间的差异是出于偶然。通过计算,P值可以得到一个概率值,表示在原假设下,观察到如此极端的结果(即F值大于或等于实际观察到的F值)的概率。
  • 通常情况下,P值小于0.05被认为是有统计学显著性的,即我们有95%的信心认为样本数据中差异的存在不是偶然造成的,而是由于实验因素或其他因素导致的。

2.2.4 如何查表:下面这个图是 显著度a=0.05的F值表 : F0.05(1,28) =4.2

  • k1,组间自由度 =j-1 =2-1   =1
  • k2,组内自由度 =i-j  =30-2 =28
  • 查表得出F值是4.2
  • 也就是 F0.05(1,28) =4.2

第一章 绪论

 ​​​​​

 2.2.5 指标意义

  • 在F检验中,p值是指在进行方差分析时,对于给定的数据集,假设所有组之间的差异是出于偶然,计算得到这个假设的的概率。
  • 具体来说,p值越小,就说明数据集的差异越显著,越有理由拒绝原假设(即所有组之间的差异是出于偶然),而接受备择假设(即存在显著差异)。换句话说,当p值小于0.05时,我们有95%的信心认为样本数据中差异的存在不是偶然造成的,而是由于实验因素或其他因素导致的。
  • 需要注意的是,p值小于0.05只表明差异是显著的存在的,但并不能说明这种差异是否有实际意义或重要性。因此,在进行统计推断时,除了p值外,还需要考虑其他因素,例如效应量的大小和样本大小等,以更全面地评估数据的结果。
  • F值表示整个拟合方程的显著性,F越大,表示方程越显著,拟合程度也就越好。
  • 另外在统计解释时一般不看F值,只需要看P值就可以了,但是在写论文时还是要将F值写出来,并把P值放在后面用括号括起来

 2.2.6 如何分析F检查的结果

 结果如下

  • 因为这是F-检验的双样本方差分析
  • p=0.48> 0.05 显著度,说明两者方差无明显差异,即方差齐性
  • 接着 选用 分析工具 中 的 t 检验 : 双 样本等方差假设

 

2.3 反向验证结果

因为数据是我用 normsinv() 生造出来的,所以一定是符合正态分布的,所以我打算用这些数据来反向验证F检验的合理性,可靠性。

 

2.3.1  生造2个有偏移量的正态数据

  • 两列数据
  • 第1列是标准正态数据
  • 第2列是标准正态数据+0.5
  • p=0.004<0.05 ,说明方差是显著有差异的

 

2.3.2 生造正态分布和其他分布的数据对比

2.2

2.5 方差分析(one-way ANOVA)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/45696.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Langchain 新手完全指南

原文&#xff1a;Langchain 新手完全指南 Langchain 可能是目前在 AI 领域中最热门的事物之一&#xff0c;仅次于向量数据库。 它是一个框架&#xff0c;用于在大型语言模型上开发应用程序&#xff0c;例如 GPT、LLama、Hugging Face 模型等。 它最初是一个 Python 包&#x…

实战攻防Demo|如何轻松形成自动响应的安全闭环?

从威胁阻断角度来说&#xff0c;拦住黑客的第一步攻击尤为重要。同样&#xff0c;对于攻击者来说&#xff0c;第一步攻击的成本也往往是最高的。日常工作中人们会遇到很多类型的攻击&#xff0c;但暴力破解或者撞库攻击往往被作为黑客的第一步攻击。这主要源于其技术含量低&…

【网络教程】如何快速的解决WordPress“另一更新正在进行”的问题

文章目录 WordPress提示“另一更新正在进行”解决方案手动删除数据库记录使用插件WordPress提示“另一更新正在进行” 当我们在更新WordPress的插件或者升级WordPress时会出现后台提示“另一更新正在进行”,如下图 当我们点击更新后,出现下图提示 出现上述问题是由于在升级Wo…

平板用的触控笔什么牌子好?ipad第三方电容笔推荐

随着技术的发展&#xff0c;出现了各种各样的平板电容笔。一支好的电容笔&#xff0c;不但可以极大地提升我们的工作效率&#xff0c;还可以极大地提升我们的学习效果。平替的电容笔&#xff0c;无论是在技术方面&#xff0c;还是在质量方面&#xff0c;都还有很大的提升空间&a…

在家下载论文使用哪些论文下载工具比较好

在家下载论文如果不借助论文下载工具是非常艰难的事情&#xff0c;因为很多查找下载论文的数据库都是需要账号权限才可使用的。 例如&#xff0c;我们查找中文论文常用的知网、万方等数据库以及众多国外论文数据库。 在家下载知网、万方数据库论文可用下面的方法&#xff1a;…

Apache pulsar 技术系列-- 消息重推的几种方式

导语 Apache Pulsar 是一个多租户、高性能的服务间消息传输解决方案&#xff0c;支持多租户、低延时、读写分离、跨地域复制&#xff08;GEO replication&#xff09;、快速扩容、灵活容错等特性。在很多场景下&#xff0c;用户需要通过 MQ 实现消息的重新推送能力&#xff0c…

RTI无线电层析成像Matlab仿真数据生成

文章目录 概述初始化环境参数 概述 无线电层析成像是一种通过获取一定区域内多对相对固定的无线通信节点间的某种测量数据后,按照一定的数学处理方法,对区域内的障碍物目标以图像的形式 展现出来的成像技术。 开山之作&#xff1a; J. Wilson and N. Patwari, “Radio tomogra…

教师ChatGPT的23种用法

火爆全网的ChatGPT&#xff0c;作为教师应该如何正确使用&#xff1f;本文梳理了教师ChatGPT的23种用法&#xff0c;一起来看看吧&#xff01; 1、回答问题 ChatGPT可用于实时回答问题&#xff0c;使其成为需要快速获取信息的学生的有用工具。 从这个意义上说&#xff0c;Cha…

天气越热越不能开空调,这是什么道理?

如今正值盛夏&#xff0c;炎热的太阳仿佛要把人烤化。相信很多小伙伴一回到家都会迫不及待地打开空调&#xff0c;在干爽的凉风中完成“自我复活”。然而需要警惕的是&#xff0c;相对密闭的空调房其实早已“暗藏杀机”&#xff0c;VOC、细菌、灰尘等室内“健康杀手”在房间里不…

Latex | 将MATLAB图并导入Latex中的方法

一、问题描述 用Latex时写paper时&#xff0c;要导入MATLAB生成的图进去 二、解决思路 &#xff08;1&#xff09;在MATLAB生成图片的窗口中&#xff0c;导出.eps矢量图 &#xff08;2&#xff09;把图上传到overleaf的目录 &#xff08;3&#xff09;在文中添加相应代码 三…

[ 容器 ] consul 容器服务更新与发现

目录 什么是服务注册与发现什么是consulconsul 部署consul 服务器 registrator服务器consul-templateconsul 多节点 什么是服务注册与发现 服务注册与发现是微服务架构中不可或缺的重要组件。起初服务都是单节点的&#xff0c;不保障高可用性&#xff0c;也不考虑服务的压力承…

ftp和sftp区别,以及xftp的使用

网上找链接找的很辛苦对吧&#xff01; 网上下载的破解版还不用。而且用没多久又说要更新了&#xff0c;又得重新找。 这下直接把官方免费获取链接发给你&#xff0c;就不用在被这种事情麻烦了。 家庭/学校免费 - NetSarang Website (xshell.com):家庭/学校免费 - NetSarang W…

CAN bus off ——ISO11898

什么是can bus off&#xff1f; CAN总线关闭&#xff08;CAN bus off&#xff09;是指CAN节点进入一种错误状态&#xff0c;无法继续正常的数据通信。当一个CAN节点的错误计数器超过了设定的阈值时&#xff0c;该节点将进入CAN总线关闭状态。在这种状态下&#xff0c;该节点将停…

NoSQL之Redis配置与优化

目录 关系数据库和非关系数据库 关系型数据库 非关系型数据库 关系数据库和非关系数据库的区别 Redis安装部署 优点 Redis数据库常用命令 Redis持久化 Redis性能管理 非关系数据库产生背景 总结关系与非关系 了解redis redis优点 redis为什么这么快 1、线程池优化…

Doris(二) -通过外部表同步数据

前言 参考网址 1.官网 2.ODBC External Table Of Doris 3.Apache doris ODBC外表使用方式 第一步 创建 RESOURCE DROP RESOURCE IF EXISTS mysql_test_odbc; CREATE EXTERNAL RESOURCE mysql_test_odbc PROPERTIES ( "type" "odbc_catalog", "…

java 支持jsonschema

入参校验产品化 schema_xsd可视化编辑器_个人渣记录仅为自己搜索用的博客-CSDN博客 jsonchema的生成 支持v4的jackson-jsonSchema GitHub - mbknor/mbknor-jackson-jsonSchema: Generate JSON Schema with Polymorphism using Jackson annotations jackson-module-jsonSchema …

WPF实现DiagramChart

1、文件架构 2、FlowChartStencils.xaml <ResourceDictionary xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml"xmlns:s"clr-namespace:DiagramDesigner"xmlns:c&…

大语言模型LLM技术赋能软件项目管理和质量保障︱微软中国高级研发经理步绍鹏

微软中国高级研发经理步绍鹏先生受邀为由PMO评论主办的2023第十二届中国PMO大会演讲嘉宾&#xff0c;演讲议题&#xff1a;大语言模型LLM技术赋能软件项目管理和质量保障。大会将于8月12-13日在北京举办&#xff0c;敬请关注&#xff01; 议题内容简要&#xff1a; 本次分享将…

DSSAT模型教程

详情点击链接&#xff1a;R语言与作物模型&#xff08;DSSAT模型&#xff09;教程 前言 随着基于过程的作物生长模型&#xff08;Process-based Crop Growth Simulation Model&#xff09;的发展&#xff0c;R语言在作物生长模型和数据分析、挖掘和可视化中发挥着越来越重要的…

mac brew安装 node 踩坑日记- n切换node不生效

最近用了一个旧电脑开发&#xff0c;发现里面node管理混乱&#xff0c;有nvm、n和homebrew&#xff0c;导致切换node 切换不了&#xff0c;开发也有莫名其妙的错误。所以我打算重新装一下node&#xff0c;使用n做为管理工具。 1. 删除nvm cd ~ rm -rf .nvm2. 删除n sudo rm -…