《机器学习》2.4假设检验 t分布 F分布

目录

 t发布

注意是这个东西服从t分布

数据服从t分布通常是在以下情况下:

以下是一些具体的例子,说明在何种情况下数据会服从t分布:

t检验

交叉验证t检验

样本方差​编辑

F分布(fisher

Friedman检验是一种非参数统计方法,

Friedman检验中提到的“F分布”和之前提到的F分布不是同一个东西,

Friedman检验=》所有的算法的相同=》被拒绝的话=》后续检验=》某两个算法相同=?拒绝否

 


 t发布

t分布,也称为学生t分布(Student's t-distribution),是一种概率分布,它被用来估计一个或多个小样本的均值,当总体的标准差未知时。t分布由威廉·戈塞特(William Gosset)在1908年以笔名“学生”(Student)发表,因此得名。

t分布的形状类似于正态分布(高斯分布),但它的尾部更厚,这意味着它在尾部有更高的概率密度。这种分布的形状由一个参数决定,即自由度(degrees of freedom,df)。自由度通常等于样本大小减去1(n-1)。随着自由度的增加,t分布逐渐接近正态分布。

t分布的数学表达式为:

其中:

  • XˉXˉ 是样本均值
  • μμ 是总体均值
  • ss 是样本标准差
  • nn 是样本大小

t分布常用于假设检验,特别是当样本量较小且总体标准差未知时。在这些情况下,t检验(t-test)可以用来确定两个样本均值之间的差异是否统计上显著。t分布也用于构建小样本均值的置信区间。

注意是这个东西服从t分布

变量符合t分布通常是在以下情况下:

  1. 样本均值的分布:当你从正态分布的总体中抽取一个样本,并且样本量较小(通常认为小于30),那么样本均值除以其标准误差(即样本标准差除以样本量的平方根)将遵循t分布。

  2. 未知总体标准差:当总体标准差未知,并且需要用样本标准差来估计时,样本均值的标准误差将使用t分布来计算置信区间或进行假设检验。

  3. 小样本数据:在样本量较小的情况下,t分布比正态分布更能准确地描述样本均值的分布情况,因为它考虑了样本量小所引起的额外变异性。

具体来说,以下变量或统计量符合t分布:

  • t统计量:在假设检验中,t统计量通常定义为

    t=Xˉ−μs/nt=s/n​Xˉ−μ​

    其中,XˉXˉ 是样本均值,μμ 是总体均值,ss 是样本标准差,nn 是样本量。当总体是正态分布且样本量较小时,这个统计量遵循t分布。
  • 置信区间:在构建均值的置信区间时,如果样本量较小且总体标准差未知,那么置信区间的计算将基于t分布。

  • 差异检验:在比较两个独立样本均值或配对样本均值差异的假设检验中,如果样本量较小,那么这些检验的统计量通常遵循t分布。

需要注意的是,t分布的准确性依赖于数据来自正态分布的假设。如果总体分布不是正态的,或者数据存在异常值,那么t分布可能不是一个准确的模型。在实际应用中,通常通过样本数据的正态性检验(如Shapiro-Wilk检验)来评估数据是否符合正态分布的假设。如果数据不满足正态性假设,可能需要使用非参数统计方法。

数据服从t分布通常是在以下情况下:

  1. 小样本量:当样本量较小(通常小于30)时,样本均值的分布更接近t分布而不是正态分布。这是因为小样本量下,样本标准差对总体标准差的估计不够精确,导致样本均值的分布有更厚的尾部。

  2. 总体标准差未知:当总体标准差未知,且需要使用样本标准差来估计时,样本均值的分布会服从t分布。这是因为样本标准差的变异性会增加样本均值分布的不确定性。

  3. 正态性假设:t分布的使用假设数据来自一个正态分布的总体。如果数据显著偏离正态分布,那么t分布可能不是最合适的分布来描述样本均值的分布。

  4. 独立性:数据点之间应该是独立的。如果数据点之间存在相关性,那么t分布的假设可能不成立。

在实际应用中,t分布常用于t检验(t-test),这是一种统计检验,用于比较两个小样本均值的差异是否显著。t检验包括独立样本t检验(用于比较两个独立样本的均值)和配对样本t检验(用于比较同一组样本在两种不同条件下的均值)。

此外,t分布也用于构建小样本均值的置信区间,以及在回归分析中对回归系数进行假设检验。

总之,当样本量小、总体标准差未知、数据来自正态分布总体且数据点独立时,数据会服从t分布

以下是一些具体的例子,说明在何种情况下数据会服从t分布:

  1. 小样本均值的置信区间

    • 假设你想要估计某种新药对降低血压的效果。你随机选取了10名高血压患者作为样本,测量他们在服用药物前后的血压变化。由于样本量较小(n=10),你使用样本标准差来估计总体标准差,并构建均值血压变化的置信区间。这种情况下,样本均值的分布会服从t分布。
  2. 小样本均值的假设检验

    • 一个研究者想要比较两组学生的考试成绩,一组接受了新的教学方法,另一组接受了传统教学方法。每组只有15名学生。研究者想要检验新教学方法是否有效。由于样本量较小,他使用独立样本t检验来比较两组的均值,这个检验基于t分布。
  3. 配对样本的假设检验

    • 一个心理学家想要研究冥想对减少焦虑的效果。她让一组志愿者在冥想前后完成焦虑量表。由于数据是配对的(冥想前后的焦虑分数),并且样本量较小(比如n=20),她使用配对样本t检验来确定冥想是否有显著效果。这个检验同样基于t分布。
  4. 单样本均值的假设检验

    • 一个工厂的质量控制部门想要检验他们生产的零件的平均重量是否符合标准。他们随机抽取了25个零件进行称重。由于他们不知道总体标准差,他们使用样本标准差来估计,并进行单样本t检验来比较样本均值和标准重量。这种情况下,样本均值的分布会服从t分布。
  5. 回归分析中的假设检验

    • 在回归分析中,研究者可能会使用t检验来检验单个回归系数是否显著不为零。例如,一个经济学家可能使用回归模型来预测房价,其中一个自变量是房屋的面积。他使用t检验来确定房屋面积对房价是否有显著影响。在这种情况下,回归系数的检验统计量服从t分布。

这些例子展示了在实际研究中,当样本量较小且总体标准差未知时,t分布是如何被用来构建置信区间和进行假设检验的。

t检验

交叉验证t检验

2.4 P40

5*2交叉验

样本方差

F分布(fisher

F分布,也称为Fisher-Snedecor分布,是一种连续概率分布,它在统计学中被用来比较两个样本的方差。F分布由两个独立的卡方分布变量的比值构成,每个变量都除以其相应的自由度。F分布的形状由两个参数决定,即分子的自由度(df1)和分母的自由度(df2)。

F分布的数学表达式为:

其中:

  • χ12χ12​ 是分子的卡方分布变量
  • χ22χ22​ 是分母的卡方分布变量
  • df1df1​ 是分子的自由度
  • df2df2​ 是分母的自由度

F分布常用于方差分析(ANOVA)和回归分析中。在方差分析中,F检验被用来确定三个或更多样本均值之间的差异是否统计上显著。在回归分析中,F检验被用来检验模型中所有自变量的联合显著性。

F分布的形状通常是偏斜的,且只有正值。随着自由度的增加,F分布逐渐接近正态分布。F分布的均值和方差取决于自由度的大小。

总之,F分布是一种用于比较两个样本方差的分布,它在统计学中被广泛应用于方差分析和回归分析。

Friedman检验是一种非参数统计方法,

Friedman检验是一种非参数统计方法,它用于比较多个相关样本的差异。 这种检验特别适用于处理重复测量或匹配组的情况,因此在心理学、医学和社会科学等领域中非常受欢迎。

Friedman检验与F分布的关系在于,Friedman检验的结果可以用来计算一个统计量,这个统计量在零假设下(即所有相关样本的总体没有差异)近似地服从F分布。 具体来说,Friedman检验的统计量是通过比较各个相关样本的秩和来计算的,而这个统计量的分布与F分布有关。

在Friedman检验中,如果检验的结果是统计量较大,对应的p值较小(通常小于显著性水平,如0.05),那么我们拒绝原假设,认为至少有两个样本之间存在显著差异。 这个统计量的分布与F分布相似,因为它涉及到两个自由度的比值,这两个自由度分别对应于组间和组内的变异。

总结来说,Friedman检验的统计量在原假设下近似地服从F分布,这使得我们可以使用F分布的特性来确定检验的显著性。

Friedman检验中提到的“F分布”和之前提到的F分布不是同一个东西,

  1. Friedman检验的“F分布”

    • Friedman检验是一种非参数统计方法,用于比较多个相关样本的均值是否存在显著差异。
    • 在Friedman检验中,统计量(通常是卡方统计量)的分布被用作检验的基础,这个统计量在原假设下近似服从卡方分布,而不是直接服从F分布。
    • Friedman检验的结果通常需要查表或使用软件来确定p值,这个p值与卡方分布的临界值有关。
  2. 传统的F分布

    • F分布是由两个独立的卡方分布变量各除以其自由度后的比值构成的,是一种非对称分布,且位置不可互换。
    • F分布广泛应用于方差分析(ANOVA)、回归方程的显著性检验等,它描述了两个样本方差的比率分布。
    • F分布的统计量(F值)是通过比较两个样本方差(或方差的估计)来计算的,这个F值的分布与F分布有关。

简而言之,Friedman检验中的“F分布”是指检验统计量在原假设下近似服从的分布,而传统的F分布是指在方差分析和回归分析中使用的统计量的分布。两者虽然都与统计量的分布有关,但它们描述的是不同类型的统计检验和不同的应用场景。Friedman检验的统计量近似服从卡方分布,而传统的F分布是描述两个方差比值的分布。

Friedman检验=》所有的算法的相同=》被拒绝的话=》后续检验=》某两个算法相同=?拒绝否

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/934785.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

图像识别 | Matlab基于卷积神经网络(CNN)的宝可梦识别源程序,GUI界面。附详细的运行说明。

图像识别 | Matlab基于卷积神经网络(CNN)的宝可梦识别源程序,GUI界面。附详细的运行说明。 目录 图像识别 | Matlab基于卷积神经网络(CNN)的宝可梦识别源程序,GUI界面。附详细的运行说明。预测效果基本介绍程序设计参考资料 预测效果 基本介绍 Matlab基…

全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之计数器与累加器(一)

学习背景: 在现实生活中一些需要计数的场景下我们会用到计数器,如空姐手里记录乘客的计数器,跳绳手柄上的计数器等。累加器是累加器求和,以得到最后的结果。计数器和累加器它们虽然是基础知识,但是应用广泛&#xff0…

计算机毕业设计Python动物图像识别分类系统 机器学习 深度学习 数据可视化 爬虫 卷积神经网络CNN 预测算法 图像识别

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

ASP.NET Core API + MySql

环境 数据库: mysql8.0 后端: vs2022 ASP.NET Core API .net 8 前端: Hbuilderx bootstrap 5.3.0 jquery v3.7.1 bootstrap-table 1.23.5 创建项目 添加资源包 AutoMapper Microsoft.EntityFrameworkCore.Tools 8.0.0 Pomelo.EntityFramew…

vmware vsphere5---部署vCSA(VMware vCenter Server)附带第二阶段安装报错解决方案

声明 因为这份文档我是边做边写的,遇到问题重新装了好几次所以IP会很乱 ESXI主机为192.168.20.10 VCSA为192.168.20.7,后台为192.168.20.7:5480 后期请自行对应,后面的192.168.20.57请对应192.168.20.7,或根据自己的来 第一阶段…

【QT】:QT(介绍、下载安装、认识 QT Creator)

背景 🚀 在我们的互联网中的核心岗位主要有以下几种 开发(程序员)测试运维(管理机器)产品经理(非技术岗位,提出需求) 而我们这里主要关注的是开发方向,开发岗位又分很…

STM32 出租车计价器系统设计(一) 江科大源码改写

STM32 出租车计价器系统设计 功能目标 驱动步进电机模拟车轮旋转,并实现调速功能。 设置车轮周长和单价,检测车轮转速和运转时间。 计算并显示行驶里程和价格。 硬件材料 28BYJ48 五线四相步进电机和 ULN2003 驱动板模块 测速传感器模块 嵌入式小系统…

Datawhale AI冬令营(第一期)--零基础定制你的专属大模型

本文主要简述如何快速完成和一些小细节 第一步下载嬛嬛数据集 数据来源:self-llm/dataset/huanhuan.json at master datawhalechina/self-llm GitHub 注意:1.一定是数据集下载完成一定是.json结尾的 2.这个是github的网址,可能会遇到打不开的情况 …

Android 车载虚拟化底层技术-Kernel 5.10 -Android12(multi-cards)技术实现

详细代码实现见 Android Display Graphics系列文章-汇总​​​​​​Android Display Graphics系列文章-汇总 Android Display Graphics系列文章-汇总 Android Display Graphics系列文章-汇总 本文主要包括部分: 一、Android12的Kernel 5.10版本 1.1 Kernel 5…

qemu安装arm64架构银河麒麟

qemu虚拟化软件,可以在一个平台上模拟另一个硬件平台,可以支持多种处理器架构。 一、安装 安装教程:https://blog.csdn.net/qq_36035382/article/details/125308044 下载链接:https://qemu.weilnetz.de/w64/2024/ 我下载的是 …

前端入门之VUE--vue组件化编程

前言 VUE是前端用的最多的框架;这篇文章是本人大一上学习前端的笔记;欢迎点赞 收藏 关注,本人将会持续更新。 文章目录 2、Vue组件化编程2.1、组件2.2、基本使用2.2.1、VueComponent 2、Vue组件化编程 2.1、组件 组件:用来实现…

day08 接口测试(3)——postman工具使用

下载 postman 的历史版本:Postman 历史版本下载 - 简书 我自己根据我的电脑,安装的地址为:https://dl.pstmn.io/download/version/9.31.32/osx_64 今天开始学习 postman 这个测试工具啦。 【没有所谓的运气🍬,只有绝…

C++游戏开发探秘【3】

成长路上不孤单😊😊😊😊😊😊 【14后😊///计算机爱好者😊///持续分享所学😊///如有需要欢迎收藏转发///😊】 今日分享关于C游戏开发的相关内容! …

python基础:(七)类

目录 一.创建和使用类二.使用类和实例2.1给属性指定默认值2.2修改属性的值2.2.1直接修改属性的值2.2.2通过方法修改属性的值2.2.3通过方法对属性的值进行递增 三.继承3.1子类的方法__init__()3.2给子类定义属性和方法3.3重写父类的方法 四.导入类4.1语法--1:4.2语法--2 前言 p…

TortoiseGit的下载、安装和配置

一、TortoiseGit的简介 tortoiseGit是一个开放的git版本控制系统的源客户端,支持Winxp/vista/win7.该软件功能和git一样 不同的是:git是命令行操作模式,tortoiseGit界面化操作模式,不用记git相关命令就可以直接操作,读…

Avalonia实战实例一:使用Prism创建项目,并创建窗口

文章目录 一、安装Avalonia的项目模板二、安装Prism框架三、简单更改App.axaml为Prism基类四、创建窗口一、安装Avalonia的项目模板 这里安装的是Avalonia 11.2.1,.Net 6.0 安装完成,创建Avalonia项目。 二、安装Prism框架 打开Nuget,搜索Prism: 不要安装Prism.Core: …

【Spark】Spark的两种核心Shuffle工作原理详解

Spark 的shuffle机制 一、Spark ShuffleManager 发展历程 Spark 1.1.0 之前 在 Spark 1.1.0 之前,Spark 使用 BlockStoreShuffleFetcher 来处理 Shuffle 操作。这个实现主要依赖于直接从 BlockManager 获取 Shuffle 数据,并通过网络进行交换。 Spark …

Y3编辑器文档4:触发器1(对话、装备、特效、行为树、排行榜、不同步问题)

文章目录 一、触发器简介1.1 触发器界面1.2 ECA语句编辑及快捷键1.3 参数设置1.4 变量设置1.5 实体触发器1.6 函数库与触发器复用 二、触发器的多层结构2.1 子触发器(在游戏内对新的事件进行注册)2.2 触发器变量作用域2.3 复合条件2.4 循环2.5 计时器2.6…

Scala递归中求汉罗塔游戏的步骤

记:f(n,"A","B","C")表示n个盘子从A柱子上移动到C柱子上,借用B柱子的过程 f(要移动的盘子的个数,起点,辅助柱子,终点) 1.基本情况(直接能求的):f(1,"A","B&…

UE5制作简单水材质

首先准备一张水材质法线贴图,也可以去 爱给网 和 花瓣网 找一张 导入后创建一个材质,如图所示 根据 Unreal 文档,吸收系数设置为红色 0.0033、绿色 0.0016、蓝色 0.0011。水看起来会更真实 然后放到一块平面上,就成功了&#xf…