OLS样本估计量抽样分布模拟

OLS样本估计量抽样分布模拟

文章目录

  • OLS样本估计量抽样分布模拟
      • 1 OLS估计量分布
      • 2 R语言实现

1 OLS估计量分布

对于线性回归方程
Y = β 0 + β 1 X + ε Y = \beta_0+\beta_1 X + \varepsilon Y=β0+β1X+ε
利用普通最小二乘法(OLS)估计上述方程参数使的假定(之一)是扰动项 ε \varepsilon ε必须满足正态分布,这样才能保证估计量也服从正态分布。当扰动项服从正态分布,如果自变量是确定性的,那么被解释变量也服从正态分布。根据OLS估计量的线性性性质
β 1 = ∑ k i Y i \beta_1 = \sum k_iY_i β1=kiYi
其中常数列 k i k_i ki一定满足 ∑ k i = 0 \sum k_i =0 ki=0, ∑ k i X i = 1 \sum k_iX_i =1 kiXi=1。当样本估计量抽样分布知晓后,就可以进行推断统计,包括假设检验和区间估计等。下面通过R语言进行模拟这一过程。


2 R语言实现

数据模拟

# OLS抽样分布
# 数据模拟
set.seed(1110)
# 总体容量
N = 5000
ID = seq(1,N,1)
# 自变量
x1 = rnorm(N,2,3)
x2 = rnorm(N,1,2)
x3 = rnorm(N,2,1)
# 残差
e = rnorm(N,0,3)

# 直方图与核密度曲线
par(mar = c(2,2,2,2),mfrow =c(1,1))
hist(e,prob = T,col = "blue",main = "残差e分布")
lines(density(e), col="red", lwd=2)

# 被解释变量
y = 1 + 2*x1 + 3*x2 + 4*x3 + e
# 被解释变量分布
op <- par(fig=c(.03,.3,.5,.98), new=TRUE)
hist(y,prob = T,col = "red",main = "y分布")
lines(density(y), col = "blue", lwd=2)
box()
par(op)

# 合并为数据框
data = data.frame(ID,y,x1,x2,x3)

残差与被解释变量的经验分布如下图
在这里插入图片描述

接下来进行样本抽取(简单随机抽样,抽取一次,样本容量为500)

# 样本抽取
sample1 = sample(N,500,replace = FALSE) 
mydata1 = data[sample1,]
# OLS回归
OLS = lm(y~1 + x1+ x2 + x3,data = mydata1)
B = OLS$coefficients
B[1]
B[2]
B[3]
B[4]

现在抽取10000次,样本容量为500

# 参数抽样分布
B1 = numeric()
B2 = numeric()
B3 = numeric()
B4 = numeric()
for (i in 1:10000){
  sampling = sample(N,500,replace = FALSE) 
  mydata = data[sampling,]
  OLS = lm(y~1 + x1+ x2 + x3,data = mydata)
  B1[i] = OLS$coefficients[1]
  B2[i] = OLS$coefficients[2]
  B3[i] = OLS$coefficients[3]
  B4[i] = OLS$coefficients[4]
}
mypar = data.frame(B1,B2,B3,B4)
# OLS估计量的线性性质,回归参数也服从正态分布
par(mfrow = c(2,2))

hist(B1,prob = T,col = "red",main = "截距系数抽样分布")
lines(density(B1), col = "blue", lwd=2)

hist(B2,prob = T,col = "red",main = "x1的系数抽样分布")
lines(density(B2), col = "blue", lwd=2)

hist(B3,prob = T,col = "red",main = "x2的系数抽样分布")
lines(density(B3), col = "blue", lwd=2)

hist(B4,prob = T,col = "red",main = "x3的系数抽样分布")
lines(density(B4), col = "blue", lwd=2)

各个参数的经验分布如下图:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/20361.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[译] Flutter 3.10 的新功能

[译] Flutter 3.10 的新功能 原文 https://medium.com/flutter/whats-new-in-flutter-3-10-b21db2c38c73 无缝的Web和移动端集成&#xff0c;Impeller稳定版的突破性图形性能&#xff0c;以及更多 欢迎使用Flutter 3.10&#xff01;我们非常期待展示我们令人惊叹的Flutter社区所…

示波器的数据处理怎么记录?

示波器的使用 - 记录和保存示波器测试结果 安泰测试为您分享如何记录示波器的数据。 "从您把示波器探头连接到器件的那一刻起&#xff0c;信号就开启了一次瞬间即可完成的重大旅程。它必须 跨过五个不同的“模块”&#xff0c;才能完成从器件到示波器&#xff0c;最后返回…

十五、Gateway网关

目录 Zuul网关和gateway网关的区别&#xff1a; Gateway路由配置 1、新建服务网关项目&#xff0c;并在项目pom文件中引入gateway网关依赖 2、在application.yml配置gateway 3、如果不用配置的方式配置gateway路由&#xff0c;还可以通过代码的形式配置 4、启动网关服务&…

Reed-Muller序列

Reed-Muller函数的由来 我们知道对于连续信号&#xff0c;时间和频率是对偶域(duality)&#xff0c;其中正弦函数是时移的特征函数&#xff08;where sinusoids are eigenfunctions of time shifts&#xff09;。而在汉明空间(Hamming space)中&#xff0c;there are discrete…

【软考|软件设计师】某计算机系统的CPU主频为2.8GHz

目录 题&#xff1a; CPI MIPS 题&#xff1a; 某计算机系统的CPU主频为2.8GHz。某应用程序包括3类指令&#xff0c;各类指令的CPI &#xff08;执行每条指令所需要的时钟周期&#xff09;及指令比例如下表所示。执行该应用程序时 的平均CPI为______&#xff1b; 运算速度…

ASP.NET Core 8 中身份验证的改进

ASP.NET Core 团队正在改进 .NET 8 中的身份验证、授权和身份管理(统称为“身份验证”)。新的 APIs 将使自定义用户登录和身份管理体验变得更加容易。新的端点将在没有外部依赖的单页应用程序(SPA)中启用基于令牌的身份验证和授权。我们还将改进我们的指引和文档&#xff0c;使…

基于SSM+JSP的人体健康信息管理系统

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

JMeter入门配置

目录 场景&#xff1a; 环境及工具 &#xff1a; JMeter中文配置&#xff1a; 配置登录接口&#xff1a; 配置响应结果&#xff1a; 配置json提取器 测试json提取器 配置Beanshell后置处理器&#xff1a; http请求右键-->添加---->后置处理器--->Beanshell后置处理…

第五章 面向对象-7.hashCode()和toString()

hashCode()和toString() hashCode() hashCoed 的特性&#xff1a; &#xff08;1&#xff09;HashCode的存在主要是用于查找的快捷性&#xff0c;如Hashtable&#xff0c;HashMap等&#xff0c;HashCode经常用于确定对象的存储地址&#xff1b; &#xff08;2&#xff09;如果…

MySQL基础(二十九)数据库的设计规范

1 范式 1.1 范式简介 在关系型数据库中&#xff0c;关于数据表设计的基本原则、规则就称为范式。可以理解为&#xff0c;一张数据表的设计结 构需要满足的某种设计标准的 级别 。要想设计一个结构合理的关系型数据库&#xff0c;必须满足一定的范式。 1.2 范式都包括哪些 目…

医院内导航及智能导医,医院导诊图怎么制作?

在大型综合性医院&#xff0c;由于专业分工精细&#xff0c;一个诊疗过程涉及的功能单元往往分布在不同的楼宇、不同楼层的不同位置&#xff0c;再加上多数患者对医院环境不熟悉&#xff0c;导致滞院的时间长、诊疗效率低、患者对服务的满意度下降。为解决这一问题&#xff0c;…

空中下载技术(OTA)电控信息安全

随着汽车电子控制系统功能复杂度和数据颗粒度呈阶梯式增加&#xff0c;其发展速度逐渐超越网络安全防护方法、技术和标准的发展&#xff0c;现阶段汽车电子正面临巨大的网络信息安全风险&#xff0c;对功能安全的潜在影响也仍在探索和解决中&#xff0c;信息安全问题已经成为影…

C++ 中到底是应该include .h文件还是应该include .cpp文件

在阅读一个较大的解决方案中&#xff0c;对于其他文件夹下的.h和.cpp文件&#xff0c;有时候#include“XXX.h”文件&#xff0c;有时候是#include“XXX.cpp”文件&#xff0c;而且二者还不能更换。下面就好好分析一下他们二者的区别。 测试 测试&#xff1a;XXX.h和XXX.cpp…

Linux内核(十四)Input 子系统详解 IV —— 配对的input设备与input事件处理器 input_register_handle

文章目录 input_handle结构体详解配对的input设备与input事件处理器实例input核心层对驱动层和事件层之间的框架建立流程图 本文章中与input子系统相关的结构体可参考input子系统结构体解析 input函数路径&#xff1a;drivers/input/input.c input_handle结构体详解 input_ha…

(转)雪花算法(SnowFlake)

简介 现在的服务基本是分布式、微服务形式的&#xff0c;而且大数据量也导致分库分表的产生&#xff0c;对于水平分表就需要保证表中 id 的全局唯一性。 对于 MySQL 而言&#xff0c;一个表中的主键 id 一般使用自增的方式&#xff0c;但是如果进行水平分表之后&#xff0c;多…

第八章结构型模式—装饰者模式

文章目录 装饰者模式解决的问题概念结构 案例使用装配者进行改进 使用场景JDK源码分析 静态代理和装饰者的区别 结构型模式描述如何将类或对象按某种布局组成更大的结构&#xff0c;有以下两种&#xff1a; 类结构型模式&#xff1a;采用继承机制来组织接口和类。对象结构型模式…

【Wi-Fi】802.11/802.11b/802.11g/802.11n/802.11a/802.11ac/802.11ax/802.11be

WiFi发展历史 IEEE 802.11 Protocol Release Date Frequency Band Bandwidth Max Throughput 802.11-1997 1997 2.4GHz 22MHz 2Mbps 802.11b 1999 2.4GHz 22MHz 11Mbps 802.11a 1999 5GHz 20MHz 54Mbps 802.11g 2003 2.4GHz 20MHz 54Mbps 802.11n (W…

计算机组成原理基础练习题第一章

有些计算机将一部分软件永恒地存于只读存储器中&#xff0c;称之为&#xff08;&#xff09; A.硬件    B.软件C.固件    D.辅助存储器输入、输出装置以及外界的辅助存储器称为&#xff08;&#xff09; A.操作系统    B.存储器 C.主机      D.外围设备完整的计算机系…

OpenCL编程指南-4.1OpenCL C编程

使用OpenCL C编写数据并行内核 OpenCL中的数据并行性表述为一个N维计算域&#xff0c;其中N1、2或3。N-D域定义了可以并行执行的工作项的总数。下面通过一个简单的例子来了解如何用OpenCL C编写一个数据并行内核&#xff0c;将两个浮点数数组相加。这个代码的串行版本求和时需…

力扣19删除链表的倒数第 N 个结点:思路分析+图文全解+方法总结(快慢指针法递归法)+深入思考

文章目录 第一部分&#xff1a;题目描述第二部分&#xff1a;代码实现2.1 快慢指针法2.2 递归 第一部分&#xff1a;题目描述 &#x1f3e0; 链接&#xff1a;19. 删除链表的倒数第 N 个结点 - 力扣&#xff08;LeetCode&#xff09; ⭐ 难度&#xff1a;中等 第二部分&#…