[闲聊统计]之参数估计是什么?(下)

  我们在前面说了一下参数估计中的点估计,接下来,我们来讲一下区间估计。

区间估计——在点估计的基础上,给出总体参数估计的一个估计区间,该区间由样本统计量加减估计误差而得到。

  • 置信水平——如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数(confidence coefficient)。常用的置信水平有90%、95%和99%。


  如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。
  也就是说,我现在有100个总体,现在随机抽取20个作为样本,那么这样的样本就会有很多个。假设有100个样本,那么就对应100个置信区间,在这100个置信区间里面,有95个区间包含总体参数的真值,就说明这是置信水平为95%的置信区间。**所以说,置信水平是所构造的区间中包含真值的比例,而不是所构造的某个区间包含真值的概率。**一个特定区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。例如,区间为【60,70】,那么80就没在这个区间内,不存在“80以90%的概率在【60,70】内”的这样的说法。


  如上图所示,我们依据不同的样本构造了20个置信区间。在这些区间中,有些包含了总体参数真值 μ \mu μ,有些就没有包含。
  实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。我们希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。

若我们按照99%的置信水平构造置信区间,也就是说,所构造的区间中包含真值的比例为99%,说明包含真值的区间很多,那我们随机抽取一个,就会觉得抽中包含真值的区间的概率很大。

对于区间估计而言,我们只考虑 μ \mu μ σ 2 σ^2 σ2区间估计,例如两个正态总体就是考虑 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 σ 1 2 / σ 2 2 σ_1^2/σ_2^2 σ12/σ22的区间估计,这是因为我们只知道 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 σ 1 2 / σ 2 2 σ_1^2/σ_2^2 σ12/σ22分布函数(分布函数说白了就是规律分布,没有规律就无法进行预测),而我们没办法知道 μ 1 / μ 2 \mu_1/\mu_2 μ1/μ2 σ 1 2 − σ 2 2 σ_1^2-σ_2^2 σ12σ22分布函数,所以就不能对这两个进行参数估计。

1.一个总体参数的区间估计

1.1 总体均值的区间估计

1.1.1 正态总体,方差已知,或非正态总体,大样本

  当总体服从正态分布且 σ 2 σ^2 σ2已知时,或者总体不是正态分布但为大样本时,样本均值 x ‾ \overline{x} x的抽样分布均为正态分布,其数学期望为总体均值 μ μ μ,方差为 σ 2 / n σ^2/n σ2/n。而样本均值经过标准化以后的随机变量服从标准正态分布,即


  总体均值 μ μ μ 1 − α 1-α 1α置信水平下的置信区间为

  • 如果总体服从正态分布但 σ 2 σ^2 σ2未知,或总体并不服从正态分布,只要是在大样本条件下,上式中的总体方差 σ 2 σ^2 σ2就可以用样本方差 s 2 s^2 s2代替,这时总体均值 μ μ μ 1 − α 1-α 1α置信水平下的置信区间可以写为:
1.1.2 正态总体,方差未知,小样本

  如果总体方差 σ 2 σ^2 σ2未知,而且是在小样本情况下,则需要用样本方差 s 2 s^2 s2代替 σ 2 σ^2 σ2,这时,样本均值经过标准化以后的随机变量服从自由度为 ( n − 1 ) (n-1) (n1) t t t分布,即


  根据 t t t分布建立的总体均值 μ μ μ 1 − α 1-α 1α置信水平下的置信区间为:

1.1.3 一个总体均值的区间估计小结

总而言之,如果总体参数已知,那么我们就用总体参数的真实值,毕竟是要估计总体参数。若未知,则用样本来代替。常用的是样本均值代替总体均值,样本方差代替总体方差。

1.2 总体比例的区间估计

  当样本量足够大时,比例 p p p的抽样分布可用正态分布近似。 p p p的数学期望为 E ( p ) = π E(p)=π E(p)=π;p的方差为 σ p 2 = π ( 1 − π ) n \sigma_{\mathfrak{p}}^2=\frac{\pi\left(1-\pi\right)}{\mathfrak{n}} σp2=nπ(1π)。样本比例经标准化后的随机变量服从标准正态分布,即


  在样本比例 p p p的基础上加减估计误差 Z α / 2 σ p Z_{\alpha/2}\sigma_{p} Zα/2σp,即得总体比例 π π π 1 − α 1−α 1α置信水平下的置信区间为:


  用样本比例 p p p来代替 π π π时,总体比例的置信区间可表示为:

1.3 总体方差的区间估计

  建立总体方差 σ 2 σ^2 σ2的置信区间,也就是要找到一个 χ 2 χ2 χ2值,使其满足


  由于 ( n − 1 ) s 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)s^2}{\sigma^2}\sim\chi^2(n-1) σ2(n1)s2χ2(n1),可用它来代替 χ 2 χ2 χ2,于是有


  根据上式可推导出总体方差 σ 2 σ^2 σ2 1 − α 1−α 1α置信水平下的置信区间为:

2.两个总体参数的区间估计

1.1 两个总体均值之差的区间估计-独立大样本

独立样本(independent sample)——如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立

  如果两个总体都为正态分布,或两个总体不服从正态分布但两个样本都为大样本 ( n 1 ≥ 30 和 n 2 ≥ 30 ) (n_1≥30和n_2≥30) (n130n230),根据抽样分布的知识可知,两个样本均值之差KaTeX parse error: Expected 'EOF', got '̅' at position 3: x ̲̅_1-x ̅_2的抽样分布服从期望值为 ( μ 1 − μ 2 ) (μ_1−μ_2) (μ1μ2)、方差为 ( σ 1 2 / n 1 + σ 2 2 / n 2 ) (σ_1^2/n_1+σ_2^2/n_2) (σ12/n1+σ22/n2)的正态分布,两个样本均值之差经标准化后服从标准正态分布,即

  当两个总体的方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22都已知时,两个总体均值之差 μ 1 − μ 2 μ_1−μ_2 μ1μ2 1 − α 1−α 1α置信水平下的置信区间为:


  当两个总体的方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知时,可用两个样本方差 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22来代替,这时,两个总体均值之差 μ 1 − μ 2 μ_1−μ_2 μ1μ2 1 − α 1-α 1α置信水平下的置信区间为:

1.2 两个总体均值之差的区间估计-独立小样本

  • 方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知但相等
      当两个总体的方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知但相等时,即 σ 1 2 = σ 2 2 σ_1^2=σ_2^2 σ12=σ22,需要用两个样本的方差 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22来估计,这时,需要将两个样本的数据组合在一起,以给出总体方差的合并估计量 s p 2 s_p^2 sp2,计算公式为:

      这时,两个样本均值之差经标准化后服从自由度为 ( n 1 + n 2 − 2 ) (n1+n2−2) (n1+n22) t t t分布,即


  因此,两个总体均值之差 μ 1 − μ 2 μ_1−μ_2 μ1μ2 1 − α 1−α 1α置信水平下的置信区间为:

  • 方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知且不相等
      当两个总体的方差 σ 1 2 σ_1^2 σ12 σ 2 2 σ_2^2 σ22未知但相等时,即 σ 1 2 = σ 2 2 σ_1^2=σ_2^2 σ12=σ22,需要用两个样本的方差 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22来估计,这时,需要将两个样本的数据组合在一起,以给出总体方差的合并估计量 s p 2 s_p^2 sp2,计算公式为:
      两个样本均值之差经标准化后近似服从自由度为 v v v t t t分布,自由度 v v v的计算公式为:


  两个总体均值之差在 1 − α 1−α 1α置信水平下的置信区间为:

1.3 两个总体均值之差的区间估计——匹配样本

匹配样本,就是两个样本有关系,不独立。例如:A班期中和期末成绩,这就是一个匹配样本,存在一一对应的关系;而A班期中和B班期中则就是独立样本。

  在大样本情况下,两个总体均值之差 μ d = μ 1 − μ 2 μ_d=μ_1−μ_2 μd=μ1μ2 1 − α 1−α 1α置信水平下的置信区间为:

  式中, d d d表示两个匹配样本对应数据的差值;KaTeX parse error: Expected 'EOF', got '̅' at position 3: d ̲̅表示各差值的均值; σ d σ_d σd表示各差值的标准差。当总体的 σ d σ_d σd未知时,可用样本差值的标准差 s d s_d sd来代替。
  在小样本情况下,假定两个总体各观察值的配对差服从正态分布。两个总体均值之差 μ d = μ 1 − μ 2 μ_d=μ_1−μ_2 μd=μ1μ2 1 − α 1−α 1α置信水平下的置信区间为:

1.3 两个总体比例之差的区间估计

  由样本比例的抽样分布可知,从两个二项总体中抽出两个独立的样本,则两个样本比例之差的抽样分布服从正态分布。同样,两个样本的比例之差经标准化后服从标准正态分布,即


  两个总体比例 π 1 π_1 π1 π 2 π_2 π2未知时,可用样本比例 p 1 p_1 p1 p 2 p_2 p2来代替,根据正态分布
建立的两个总体比例之差 π 1 − π 2 π_1−π_2 π1π2 1 − α 1−α 1α置信水平下的置信区间为:

1.3 两个总体方差比的区间估计

  建立两个总体方差比的置信区间,也就是要找到一个 F F F值,使其满足


  由于 s 1 2 s 2 2 ⋅ σ 2 2 σ 1 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{s_1^2}{s_2^2}\cdot\frac{\sigma_2^2}{\sigma_1^2}\sim F(n_1-1,n_2-1) s22s12σ12σ22F(n11,n21),故可用它来代替 F F F,于是有


  由此可以推导出两个总体方差比 σ 1 2 / σ 2 2 σ_1^2/σ_2^2 σ12/σ22 1 − α 1−α 1α置信水平下的置信区间为:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/531751.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

三:synchronized 关键字

目录 1、共享带来的问题2、synchronized 用法3、类加载器对 Class 锁的影响4、synchronized 实现原理4.1、同步方法、同步代码块4.2、对象内存布局4.3、Monitor 对象定义 5、synchronized 与原子性6、synchronized 与可见性7、synchronized 与有序性8、synchronized 锁升级8.1、…

UDS(ISO14229) ———— 0x10(DiagnosticSessionControl)

前言 在UDS协议中,我们首先接触到的是诊断和通信管理功能单元(Diagnostic and communication management functional unit)模块。在这个模块里面,DiagnosticSessionControl是我们第一个需要掌握的内容。 按照ISO 14229上面的划分,我们可以将诊断会话模式分为两大类; 一类…

Pytest精通指南(02)对比Unittest的差异

文章目录 前言用例编写规则不同用例前置与后置条件不同断言功能不同测试报告失败重跑机制参数化用例分类执行Unittest 前后置示例Pytest 前后置示例总结 前言 在Python中,unittest和pytest是两个主流的测试框架; 它们都旨在支持自动化测试、使用断言验证…

通信分类3G,4G,5G,通信专用名词

Generation: 2G: GSM全名为:Global System for Mobile Communications,中文为全球移动通信系统,俗称"全球通",是一种起源于欧洲的移动通信技术标准,是第二代移动通信技术 3G:WCDMA 4G&#xff1a…

C++奇迹之旅:探索类对象模型内存的存储猜想

文章目录 📝前言🌠 类的实例化🌉类对象模型 🌠 如何计算类对象的大小🌉类对象的存储方式猜想🌠猜想一:对象中包含类的各个成员🌉猜想二:代码只保存一份,在对象…

特征融合篇 | RTDETR引入基于内容引导的特征融合方法 | IEEE TIP 2024

本改进已集成到 RT-DETR-Magic 框架。 摘要—单幅图像去雾是一个具有挑战性的不适定问题,它从观察到的雾化图像中估计潜在的无雾图像。一些现有的基于深度学习的方法致力于通过增加卷积的深度或宽度来改善模型性能。卷积神经网络(CNN)结构的学习能力仍然未被充分探索。本文提…

Prometheus+grafana监控nacos和spring-boot服务(增加自定义指标)(七)

前面记录了项目中常用的各种中间件的指标采集器的用法及搭建方式 , 由于所有组件写一篇幅过长,所以每个组件分一篇方便查看,前六篇链接如下 Prometheusgrafana环境搭建方法及流程两种方式(docker和源码包)(一)-CSDN博客 Prometheusgrafana…

【3GPP】【核心网】核心网/蜂窝网络重点知识面试题二(超详细)

1. 欢迎大家订阅和关注,3GPP通信协议精讲(2G/3G/4G/5G/IMS)知识点,专栏会持续更新中.....敬请期待! 目录 1. 对于主要的LTE核心网接口,给出运行在该接口上数据的协议栈,并给出协议特征 2. 通常…

电压继电器SRMUVS-220VAC-2H2D 导轨安装 JOSEF约瑟

系列型号: SRMUVS-58VAC-2H欠电压监视继电器;SRMUVS-100VAC-2H欠电压监视继电器; SRMUVS-110VAC-2H欠电压监视继电器;SRMUVS-220VAC-2H欠电压监视继电器; SRMUVS-58VAC-2H2D欠电压监视继电器;SRMUVS-100…

python爬虫 爬取网页图片

http://t.csdnimg.cn/iQgHw //爬虫爬取图片其实是很简单的,但是大多数同学,可能对 url的设置一直有困惑(这点本人也在研究),而本篇文章,对于想要爬取图片的小白简直是福利。你只需要将文章代码运行即可&am…

自动化测试面试题及答案大全

🔥 交流讨论:欢迎加入我们一起学习! 🔥 资源分享:耗时200小时精选的「软件测试」资料包 🔥 教程推荐:火遍全网的《软件测试》教程 📢欢迎点赞 👍 收藏 ⭐留言 &#x1…

【YOLOv9】完胜V8的SOTA模型Yolov9(论文阅读笔记)

官方论文地址: 论文地址点击即可跳转 官方代码地址: GitCode - 开发者的代码家园 官方代码地址点击即可跳转 1 总述 当输入数据经过各层的特征提取和变换的时候,都会丢失一定的信息。针对这一问题:

顺序表讲解

一.数据结构 在学习顺序表之前,我们先需要了解什么是数据结构。 1.什么是数据结构呢? 数据结构是由“数据”和结构两词组合而来。 什么是数据呢? 你的游戏账号,身份信息,网页里的信息(文字&#xff0c…

onSaveInstanceState()与onRestoreInstanceState()

目录 1.二者作用 2.onSaveInstanceState调用时机 2.1 五种情况 前4种情况Activity生命周期: 2.2 注意事项:确定会被系统回收并销毁,不会调用此方法 两个例子 3.onRestoreInstanceState调用时机 3.1实例——屏幕切换生命周期 3.2 极端…

Python实现读取dxf文件的所有字符

Python实现读取dxf文件的所有字符 import ezdxfdef read_dxf_and_print_text(filename):# 加载DXF文件doc ezdxf.readfile(filename)# 遍历所有的实体for entity in doc.entities:# 检查实体是否是TEXT、MTEXT或DIMENSIONif isinstance(entity, ezdxf.entities.Text):print(f…

初识--数据结构

什么是数据结构?我们为什么要学习数据结构呢....一系列的问题就促使我们不得不了解数据结构。我们不禁要问了,学习C语言不就够了吗?为什么还要学习数据结构呢?这是因为:数据结构能够解决C语言解决不了的问题&#xff0…

Unity多线程简单示例

using UnityEngine; using System.Threading;public class texxxst : MonoBehaviour {Thread thread;void Start(){// 创建一个新的线程,并传入要执行的方法thread new Thread(new ThreadStart(DoWork));// 启动线程thread.Start();}void DoWork(){for (int i 0; …

数据降维方法-主成分分析(PCA)

目录 一、前言 二、向量的表示及基变换 三、基变换 四、协方差矩阵 五、协方差 六、优化目标 一、前言 主成分分析(Principal Component Analysis) 用途:降维中的常用手段 目标:提取最有价值的信息(基于方差) 问题&#x…

【项目精讲】RESTful简洁描述

RESTful是什么 是一种架构风格/API设计规范将一切数据视为资源利用HTTP请求方式 POST、GET、PUT、DELETE,描述对资源的操作 GET 获取资源POST 新建资源PUT 更新资源DELETE 删除资源 通过HTTP响应状态码,描述对资源的操作结果请求数据和英大数据均为JSO…

YOLOv8模型剪枝实战:DepGraph(依赖图)方法

课程链接:YOLOv8模型剪枝实战:DepGraph(依赖图)方法_在线视频教程-CSDN程序员研修院 YOLOv8是一个当前非常流行的目标检测器,本课程使用DepGraph(依赖图)剪枝方法对YOLOv8进行网络剪枝,使其更加轻量和实用…