自选择问题和处理效应模型

这里写目录标题

  • 自选择问题和处理效应模型
        • Tobit 模型假定
        • Heckman过程
        • 逆米歇尔比率推导过程
        • 逆米希尔比率推导过程
        • 自选择问题
        • 典型事实分析一定要列出来的
        • 关于OLS,Heckman-2sls,Heckman三种模型的估计结果对比
        • Heckman两阶段算逆米希尔比率分解
  • 处理效应模型

自选择问题和处理效应模型

在这里插入图片描述
在这里插入图片描述

  • DGP
    在这里插入图片描述
    在这里插入图片描述
  • 注意:
    这里的概率密度超过了1,这是正常的。概率密度的三原则,
  • 1是大于等于0;
  • 2是积分等于1;
  • 对于连续型随机变量,给定一个具体的x值,f(x)并不是该事件发生的概率。而是f(x)描述了在x处的概率密度,即随机变量取值落在x附近单位长度内的概率。

在这里插入图片描述

在这里插入图片描述
Tobit模型的适用数据

  • 简言之,y值有大部分是0(占比还不小),如果直接估计或者删除估计,都是有偏的。那么使用Tobit。
    在这里插入图片描述
  • 观察统计特征的代码
    在这里插入图片描述
    在这里插入图片描述
  • 下面是理论部分
Tobit 模型假定

在这里插入图片描述

  • P ( y i = 0 ∣ x i ) P(y_i=0|x_i) P(yi=0∣xi)
    在这里插入图片描述
    在这里插入图片描述
  • 这里的示性函数应该是 I y i > 0 I_{y_i>0} Iyi>0
    在这里插入图片描述
    结论
  • 如果用y和截断后的y去reg,都会低估参数值

在这里插入图片描述

h tobit的帮助命令
在这里插入图片描述

  • 几种模型的对比
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 数据是不是随机缺失还是非随机缺失 问题很大

  • 随机缺失,可以直接扔掉,非随机缺失,不能直接扔掉

  • 非随机缺失,缺失背后的原因很重要–【模仿学霸表象的学习】
    在这里插入图片描述

处理效应的随机和非随机
给的例子

  • 随机下:1000个样本,抓阄选取400个当实验对象。
  • 非随机下:1000个样本,按照一定条件(LEV ROE CG),有条件的充当实验对象。
    在这里插入图片描述
    自选择:
    若果在模型中有一个D(虚拟变量),那么一定要考虑取1(实验组),是不是随机选出来的?
Heckman过程

这里面有很多理解的点
但是最重要的:

  • 预设的模型,因为各种原因,可能会遗漏变量

在这里插入图片描述
在这里插入图片描述

逆米歇尔比率推导过程

在这里插入图片描述

逆米希尔比率推导过程

在这里插入图片描述
注意 λ ( − c ) \lambda(-c) λ(c)

在这里插入图片描述
在这里插入图片描述

  • 推广
  • 其实就是一个换元,将z换成 u / σ u/\sigma u/σ
    在这里插入图片描述
  • 读到这里,就解释了为什么逆米希尔比率可以代替“补丁”
    在这里插入图片描述
自选择问题

一定有两个方程

  • 选择方程-样本被观测到的条件
    i f     z i r + γ i > 0    y   c a n   b e   o b s e r v e d if \space \space \space z_ir+\gamma_i>0 \space \space y \space can \space be \space observed if   zir+γi>0  y can be observed
    i f   z i r + γ i < 0     y   c a n ′ t   b e   o b s e r v e d if \space z_ir+\gamma_i<0 \space \space \space y \space can't \space be \space observed if zir+γi<0   y cant be observed

  • 结果方程-构建的X对Y的影响方程

y i = x i β + u i y_i=x_i\beta+u_i yi=xiβ+ui

如果还看不懂 下面是著名的书籍
在这里插入图片描述

典型事实分析一定要列出来的

在这里插入图片描述

关于OLS,Heckman-2sls,Heckman三种模型的估计结果对比

在这里插入图片描述
在这里插入图片描述

Heckman两阶段算逆米希尔比率分解

在这里插入图片描述

内容小结:
在这里插入图片描述

Heckman Correction,又称两阶段方法)。赫克曼矫正法分两个步骤进行:第一步骤,研究者根据管理学理论设计出一个计算企业披露R&D投入概率的模型,而该模型的统计估计结果可以用来预测每个个体的概率;第二步骤,研究者将这些被预测个体概率合并为一个额外的解释变量,与其他控制变量等变量一起来矫正自选择问题。这个比率叫逆米尔斯比率,inverse Mills ration, imr,也就是说,在第一步计算出imr,在第二步把imr当作一个控制变量。

以企业R&D投入问题为例,假设全样本是1000家公司,其中800家公司披露了其R&D投入。

第一阶段的模型,是一个包括全样本(1000家)的Probit模型,用来估计一家公司是否会披露其R&D投入的概率。这里的因变量是二元的,表示是否披露R&D投入;自变量是一些会影响是否披露R&D的外生变量,比如其他收入营业收入,杠杆率,公司规模,所属行业等等。然后根据这个Probit模型,为每一个样本计算出imr,imr作用是为每一个样本计算出一个用于修正样本选择偏差的值。

第二阶段,在原来的回归方程,也就是原来只有800家公司的样本的方程假如imr作为控制变量,其他都不变,然后估计出回归参数。这时不管imr显著不显著都不重要,imr显著说明样本选择偏差的确影响了你最初模型的估计,这正表明了使用Heckman两步法纠正样本选择偏差的必要性。imr不显著说明原模型不存在严重的样本选择偏差,这时Heckman第二步得到的结果应该与原模型得到的结果差不多。(关于imr的显著性是否说明样本选择偏差存在目前还有争议,不过imr不是关注的变量)。第二步关注的对象是核心解释变量是否显著。只要核心解释变量显著,就说明结果稳健。

*描述性统计数据
sum age educ married children wage

*简单的ols模型,存在选择性偏误
reg wage educ age
est store OLS

*第一种方法  heckman maximum likelihood
heckman wage educ age, select(married children educ age) //默认最大似然估计  
est store HeckMLE

*第二种方法  heckman two-step  all-in-one 不可以进行cluster调整
heckman wage educ age, select(married children educ age) twostep  
est store Heck2s

*第二种方法  heckman two-step  step-by-step 可以进行cluster调整
probit work married children educ age
est store First  
predict y_hat, xb
gen pdf = normalden(y_hat)  //概率密度函数
gen cdf = normal(y_hat)     //累积分布函数
gen imr = pdf/cdf           //计算逆米尔斯比率
reg  wage educ age imr if work == 1  //女性工作子样本
est store Second
vif  //方差膨胀因子

*对比结果
local m "OLS HeckMLE Heck2s First Second"  
esttab `m', mtitle(`m') nogap compress pr2 ar2

代码来源:
https://bbs.pinggu.org/thread-10568456-1-1.html

如果你觉得你的样本与大的样本有一些区别,就可以用Heckman方程纠偏。

在这里插入图片描述

处理效应模型

这是的y变成了0-1,
同时,mills “补丁”也有区别
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/875317.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

labview禁用8080端口

需求背景 最近电脑上安装了labview全家桶,发现idea的8080端口项目启动报错,一直提示8080端口被占用。最简单的办法就是找到8080端口的服务,然后关闭这个服务。但是我不想这么做,我想把labview的web服务器的端口给修改了。 操作教程 1、cmd查看8080端口 2、windows进程 同…

pgAdmin 4备份数据库失败,解决

pgAdmin4中&#xff0c;必须先设置二进制路径&#xff1b;binary paths pgAdmin4操作路径&#xff0c;File—>Preferences—>Paths—>Binary paths 找到postgreSQL的安装目录&#xff0c;bin目录复制&#xff0c;然后设置在截图标记位置&#xff1b; 再去备份数据库就…

flux.1模型在40hx上绘图实践

flux.1是新成立的AI绘画团队。核心成员来自于Stability AI。Stability AI曾经开创了AIGC的新纪元&#xff0c;但管理团队在经营理念上一直有分歧&#xff0c;到了SD3的推出后&#xff0c;团队在开源还是闭源的问题上&#xff0c;产生了重大冲突&#xff0c;直到模型又一次无意外…

零基础5分钟上手亚马逊云科技-为网站服务器配置DNS域名

简介 欢迎来到小李哥全新亚马逊云科技AWS云计算知识学习系列&#xff0c;适用于任何无云计算或者亚马逊云科技技术背景的开发者&#xff0c;通过这篇文章大家零基础5分钟就能完全学会亚马逊云科技一个经典的服务开发架构方案。 我会每天介绍一个基于亚马逊云科技AWS云计算平台…

SAP 公司间采购配置简介

SAP 公司间采购配置简介 说明后台配置说明 上一篇博文中我们演示了公司间采购的前台的操作,本文将针对公司间采购的后台的配置进行说明。 后台配置 1、定义工厂的装运数据 路径:IMG—物料管理—采购—采购订单—设置库存调拨订单—定义工厂的装运数据 在这里插入图片描述 …

集成电感器TPS82130

集成电感器TPS82130 简介 TPS82130是集成了电感跟0603一样大的BUCK降压模块。输入电压3-17V&#xff0c;输出电压0.9-6V&#xff0c;输出电流3A&#xff0c;0.8V参考电压。 TPS82130属于系统级的封装电源模块&#xff0c;目前价格大概是4.5元。它可以实现100%的占空比&#x…

Zookeeper工作机制、特点、数据结构、应用场景、配置参数解读

ZK工作机制 从涉及模式角度来理解&#xff1a;是一个基于观察者模式设计的分布式服务管理框架&#xff0c;负责存储和管理大家都关心的数据&#xff0c;然后接受观察者的注册&#xff0c;一旦这些数据的状态发生变化&#xff0c;zk就负责通知已在zk上注册的那些观察者做出相应…

什么是CPU、GPU、NPU?(包懂+会)

目录 举例子 CPU&#xff1a;主厨 GPU&#xff1a;大量的厨房助理 NPU&#xff1a;面包机 总结 讲理论 CPU&#xff08;中央处理器&#xff09; GPU&#xff08;图形处理单元&#xff09; NPU&#xff08;神经网络处理单元&#xff09; 对比分析 举例子 CPU&#xff…

基于SpringBoot+Vue的个性化旅游推荐系统

作者&#xff1a;计算机学姐 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等&#xff0c;“文末源码”。 专栏推荐&#xff1a;前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于JavaSpringBootVueMySQL的…

监控系统添加vcenter上的esxi主机

监控系统的软件选择&#xff1a; 监控系统要求 快速搭建 能快捷地添加vcenter上的主机&#xff08;esxi&#xff09; 能实现动态添加主机监控 可供选择的监控软件 Prometheus vmware_exporter添加 vcenter及esxi监控&#xff0c;报奇怪的错误&#xff0c;解决时间比较长&a…

端口安全老化细节

我们都知道port-security aging-time命令用来配置端口安全动态MAC地址的老化时间&#xff0c;但是后面还可以加上类型&#xff1a; [SW1-GigabitEthernet0/0/1]port-security aging-time 5 type absolute Absolute time 绝对老化 inactivity Inactivity time相对老化 …

Qt 中openMp 配置

Qt 中openMp 配置 前言 openMP是使用CPU进行并行计算&#xff0c;在实际项目中处理耗时的for循环等&#xff0c;简单有效&#xff0c;本文记录下使用Qt \C项目开发时如何配置openMP 二、工程配置 1.Qt Creator pro工程 区分编译器&#xff0c;配置pro文件 MSVXXX编译器&am…

曝光破21亿,新茶饮行业如何掘金抖音?

沪上阿姨CEO单卫钧曾说&#xff1a;“新茶饮有几个特点&#xff0c;第一个是资本化&#xff0c;第二个是连锁化&#xff0c;第三个就是线上化。” 具体到线上化&#xff0c;除了美团、饿了么这些传统渠道之外&#xff0c;越来越多茶饮咖啡品牌开始布局抖音、快手等内容平台。在…

【kubernetes】配置管理中心Configmap运用

一&#xff0c;介绍 Configmap&#xff08;简写 cm&#xff09;是k8s中的资源对象&#xff0c;用于保存非机密性的配置的&#xff0c;数据可以用key/value键值对的形式保存&#xff0c;也可通过文件的形式保存。 【局限性】&#xff1a;在ConfigMap不是用来保存大量数据的&am…

腾讯云使用

注&#xff1a;本文的所有演示的代码都基于尚硅谷的尚乐代驾项目 对象存储COS 一种云存储器 官方文档&#xff1a; 对象存储 快速入门-SDK 文档-文档中心-腾讯云 (tencent.com) 一 上传文件 1 初始化客户端 官方示例&#xff1a; // 1 传入获取到的临时密钥 (tmpSecret…

Qt | ubuntu20.04安装Qt6.5.3并创建一个example完整教程(涉及诸多开发细节,商用慎重)

点击上方"蓝字"关注我们 01、下载 >>> 下载Qt在线安装包 这里采用镜像地址进行下载,避免网络过慢。 镜像地址:http://mirrors.ustc.edu.cn/qtproject/archive/online_installers/4.5/ 选择最新版本下载,如截至目前最新版本为qt-unified-linux-x64-4.5.2…

Python数据分析于可视化

Python数据分析于可视化 一、前言二、引言三、需求分析四、系统设计1.系统功能结构2.系统业务流程图 五、系统开发必备 一、前言 个人主页: ζ小菜鸡大家好我是ζ小菜鸡&#xff0c;让我们一起来学习Python数据分析于可视化。如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连…

计算机网络 --- 计算机网络的分类

一、计算机网络分类 1.1 按分布范围分类 举例&#xff1a;广域网&#xff08;WAN&#xff09;、局域网&#xff08;LAN&#xff09; 举例&#xff1a;个域网&#xff08;PAN&#xff09; 1.2 按传输技术分类 广播式网络――当一台计算机发送数据分组时&#xff0c;广播范围…

国外创意二维码应用案例:迪卡侬太会搞事情了!

想必大家还记得前不久轰动全球的蓝屏事件。多个国家多个行业的大量用户都受到了影响&#xff0c;就在航空公司、银行、超市、酒店、电信、媒体……因为突发的电脑蓝屏故障而手忙脚乱的时候&#xff0c;迪卡侬&#xff08;Decathlon&#xff09;却在这场“危机”中看到了机会。 …

VScode安装和使用教程,2024最新最全,零基础入门到精通,看完这一篇就够了!

# VSCode 安装使用教程&#xff08;图文版&#xff09; 工欲善其事&#xff0c;必先利其器 对于我们每一位软件工程师来说&#xff0c;都要有自己顺手的 IDE 开发工具&#xff0c;它就是我们的武器。 一个好用的 IDE 不仅能提升我们的开发效率&#xff0c;还能让我们保持愉悦…