【因果推断python】19_局部平均效应2

目录

局部平均干预效果:后期

对参与度的影响

关键思想


局部平均干预效果:后期

局部平均处理效应明确了我们可以估计因果效应的人群。这也是查看 IV 的另一种方式,它提供了我们可以使用的其他很酷的直觉。在现代 IV 中,我们将工具视为启动因果链:Z 导致 T 导致 Y。在这种情况下,排除限制意味着 Z 不会导致 Y,除非通过其对 T 的影响。现在将第一阶段视为Z 对 T 的因果效应。我们还用双索引符号重写潜在结果,其中第一个索引表示工具的反事实,第二个索引表示处理

\text{potential outcome}=\begin{cases}Y_i(1,1)\operatorname{if}T_i=1,Z_i=1\\Y_i(1,0)\operatorname{if}T_i=1,Z_i=0\\Y_i(0,1)\operatorname{if}T_i=0,Z_i=1\\Y_i(0,0)\operatorname{if}T_i=0,Z_i=0&\end{cases}

从某种意义上说,干预成为结果,至少在第一阶段是这样。这意味着我们也可以用潜在的结果符号来写它:

\text{potential treat}=\begin{cases}T_0\text{ if }Z_i=0\\T_1\text{ if }Z_i=1\end{cases}

工具变量假设现在可以重写如下E[Y_i|Z_i=1]=E[Y_{i0}+T_{i1}(Y_{i1}-Y_{i0})]

  1. T_{0i},T_{1i}\perp Z_i和 Y_i(T_{1i},1),Y_i(T_{0i},0)\perp Z_i。这就是独立性假设。这表示该仪器与随机分配的一样好。换句话说,工具变量 Z 与潜在干预无关,这与说不同工具变量组的人具有可比性是相同的。

  2. Y_i(1,0)=Y_i(1,1)=Y_{i1} 和 Y_i(1, 0)=Y_i(1, 1)=Y_{i0}。这是排除限制。它说,如果我正在考虑接受干预的潜在结果,那么两个工具变量组的结果都是一样的。换句话说,该工具变量不影响潜在结果,这与说该工具变量仅通过干预影响结果相同。

  3. E[T_{1i}-T_{0i}]\neq0。这是第一阶段的存在。据说第一阶段的潜在结果,即潜在的干预,是不一样的。另一种说法是工具变量确实会影响干预。

  4. T_{i1}>T_{i0}。这就是单调性假设。据说如果每个人都打开工具变量,干预水平会高于每个人都关闭干预的水平。

现在,让我们回顾一下 Wald 估计量,以进一步了解 IV:ATE=\frac{E[Y|Z=1]-E[Y|Z=0]}{E[T|Z=1]-E[T|Z=0]}

让我们取它的第一位,E[Y|Z=1]。使用排除限制,我们可以根据这样的潜在结果重写 Y。E[Y_i|Z_i=1]=E[Y_{i0}+T_{i1}(Y_{i1}-Y_{i0})|Z=1]使用独立性,我们可以去掉 Z 上的条件。E[Y_i|Z_i=1]=E[Y_{i0}+T_{i1}(Y_{i1}-Y_{i0})]用类似的论证,我们得到E[Y_i|Z_i=0]=E[Y_{i0}+T_{i0}(Y_{i1}-Y_{i0})]我们现在可以像这样重写 Wald 估计量的分子E[Y|Z=1]-E[Y|Z=0]=E[(Y_{i1}-Y_{i0})(T_{i1}-T_{i0})]使用单调性,我们知道 T_{i1}-T_{i0} 是 0 或 1,所以E[(Y_{i1}-Y_{i0})(T_{i1}-T_{i0})]=E[(Y_{i1}-Y_{i0})|T_{i1}>T_{i0}]P(T_{i1}>T_{i0})使用类似的论点来解决分母,我们得到E[T|Z=1]-E[T|Z=0]=E[T_{i1}-T_{i0}]=P(T_{i1}>T_{i0})所有这一切让我们可以这样看待 Wald 估计量:ATE=\frac{E[(Y_{i1}-Y_{i0})|T_{i1}>T_{i0}]P(T_{i1}>T_{i0})}{P(T_{i1}>T_{i0})}=E[(Y_{i1}-Y_{i0})|T_{i1}>T_{i0}]

也就是说,由 IV 估计的 ATE 是子群上的 ATE,其中 Ti1>Ti0��1>��0。如果您考虑合规性,这是哪个人群?这是那些工具变量影响通道打开后干预水平高于关闭工具变量影响通道的人群。换句话说,这是服从人群。我们可以记住如下几类,

  1. 服从者意味着 T_{i1}>T_{i0}
  2. 永不接受者意味着 T_{i1}=T_{i0}=0
  3. 总是接受者意味着 T_{i1}=T_{i0}=1

结论是,IV 没有说明对永不接受者、总是接受者或拒绝者的影响,因为对他们的干预没有改变! IV 仅查找服从者的处理效果

对参与度的影响

让我们看看所有这一切在案例研究中如何发挥作用,我们尝试估计推送对应用内购买的影响。因果图就是我们上面描述的那个图,这里就不再赘述了。我们拥有的数据是关于推送分配的随机工具和推送交付的干预变量。

data = pd.read_csv("./data/app_engagement_push.csv")
    
data.head()

首先,让我们先跑一个普通线性回归来看看能得到什么

ols = IV2SLS.from_formula("in_app_purchase ~ 1 + push_assigned + push_delivered", data).fit()
ols.summary.tables[1]

OLS 说的干预效果是 R$27.60,也就是说,消息推送增加了 27.6 雷亚尔(巴西货币单位)的应用内购买。 然而,我们有理由相信这是一个有偏的估计。 我们知道旧手机在接收推送时遇到问题,因此,使用新手机的富裕客户可能是服从者。 由于接受干预的人也有更多的钱,我们认为这种有偏是积极的,消息推送(PUSH)的真正影响较小。 换句话说,我们可能有E[Y_0|T=0] < E[Y_0|T=1]

现在,让我们尝试使用工具变量来估计这种影响。 首先,让我们运行第一阶段。

first_stage = IV2SLS.from_formula("push_delivered ~ 1 + push_assigned", data).fit()
first_stage.summary.tables[1]

看起来我们有一个强大的第一阶段。 那些被指派获得推送的人有 71.8% 的时间得到推送。 这意味着我们有大约 28% 的人从不接受。 我们也有充分的理由相信没有总是接受者,因为截距参数估计为零。 这意味着如果没有分配给它,就没有人得到推送。 鉴于我们的实验设计,这是意料之中的。

现在让我们运行简化的形式的估计:

reduced_form = IV2SLS.from_formula("in_app_purchase ~ 1 + push_assigned", data).fit()
reduced_form.summary.tables[1]

简化形式显示进行干预分配的因果效应为 2.36。 这意味着分配某人接收推送会使应用内购买平均增加 2.36 雷亚尔。

如果我们将简化形式除以第一阶段,我们将工具变量的效果按有实际干预的比例进行缩放,我们得到 2.3636/0.7176=3.292.3636/0.7176=3.29。 运行 2SLS,我们得到这些相同的估计,加上正确的标准误差。

iv = IV2SLS.from_formula("in_app_purchase ~ 1 + [push_delivered ~ push_assigned]", data).fit()
iv.summary.tables[1]

这表明 2SLS 的结果远低于我们使用 OLS 得到的结果:3.29 对 27.60。 这是有道理的,因为使用 OLS 估计的因果效应是正偏差的。 我们还需要记住 LATE。 3.29 是对编译器的平均因果效应。 不幸的是,对于那些从不接受者,我们无话可说。 这意味着我们正在评估对拥有更新手机的较富裕人群的影响。

关键思想

在这里,我们从现代的视角对工具变量加以了更深刻的认识。 我们看到工具变量可以被视为一个因果链,其中工具变量导致干预,干预进而导致结果。 从这个视角出发中,我们学习了服从性,从而理解 IV 估计中的 ATE,并且我们发现它是有服从行为对象的局部平均干预效应(LATE)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/686644.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

气膜乒乓球馆:新型体育设施的投资机遇—轻空间

乒乓球作为我国的国球&#xff0c;不仅在世界舞台上表现卓越&#xff0c;在国民的心目中也占有重要位置。随着科技的进步&#xff0c;气膜乒乓球馆作为一种新型体育设施&#xff0c;正逐渐走入大众视野&#xff0c;为乒乓球爱好者提供了一个舒适、安全、环保的运动场所。那么&a…

加强校园气膜体育馆建设的必要性—轻空间

在现代教育中&#xff0c;体育运动作为学生全面发展的重要组成部分&#xff0c;受到越来越多的重视。为了满足学生的运动需求&#xff0c;提供更好的运动场所&#xff0c;加强气膜体育馆在校园中的建设变得尤为重要。气膜体育馆作为一种新型体育设施&#xff0c;凭借其独特的优…

打造精细化运维新玩法(一)

一、SLO介绍——为什么需要SLO 二、SLO健康度——从0到1构建SLO 三、AIOps赋能——SLO和智能化结合 四、案例介绍——实践场景和运营探索 五、总结 精细化运维是运维演进的必由之路&#xff0c;是综合业务需求、研发效能、稳定性保障、成本优化、架构治理等多种因素驱动的必…

纷享销客集成平台(iPaaS)的应用与实践

案例一 企业系统集成的产品级解决方案 概况 随着国家出台一系列鼓励LED照明产业发展与创新的规划和政策&#xff0c;以及国际市场全球演唱会、音乐会的活跃以及线上零售、商业地产等行业回暖&#xff0c;LED显示行业发展形势积极向好。深圳市艾比森光电股份有限公司&#xff…

【Java】static 类方法中注意事项

static 类方法中注意事项 目录 代码示例&#xff1a; package suziguang_d4_staticNote;public class Student {public int score 66;public static String name "zhangsan";// 1.类方法中可以直接访问类的成员&#xff0c;不可以直接访问实例成员public static v…

Virustotal查询恶意进程

1、使用netstat查看可疑进程 执行ls -al /proc/$PID/exe确认可疑进程对应的文件&#xff1b;若文件未被删除&#xff0c;则直接上传文件到Virustotal进行检测&#xff0c;或者计算出文件对应的md5&#xff0c;使用md5去Virustotal进行查询&#xff1b;若文件已被删除&#xff0…

MacOS M系列芯片一键配置多个不同版本的JDK

第一步&#xff1a;下载JDK。 官网下载地址&#xff1a;Java Archive | Oracle 选择自己想要下载的版本&#xff0c;一般来说下载一个jdk8和一个jdk11就够用了。 M系列芯片选择这两个&#xff0c;第一个是压缩包&#xff0c;第二个是dmg可以安装的。 第二步&#xff1a;编辑…

十年数据分析经验分享

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

企业研发数据泄露损失严重,研发数据保护到底怎么才能有效落地?

数据已成为企业毋庸置疑的核心资产&#xff0c;而企业众多数据中&#xff0c;研发数据则占据着重要的角色&#xff0c;近年来&#xff0c;发生了多起企业研发数据被窃取或泄露的事件&#xff0c;给企业带来严重的名誉、经济损失&#xff1a; 小米公司&#xff1a;2023年1月&am…

java学习笔记(持续更新中...)

Java 中的基本数据类型主要包括以下7种&#xff1a; byte&#xff1a;字节型&#xff0c;占用 1 字节&#xff0c;范围-128 到 127。char&#xff1a;字符型&#xff0c;占用 2 字节&#xff0c;范围 0 到 65535。short&#xff1a;短整型&#xff0c;占用 2 字节&#xff0c;…

针对多智能体协作框架的元编程——METAGPT

M ETA GPT: M ETA P ROGRAMMING FOR M ULTI -A GENT COLLABORATIVE F RAMEWORK 1.概述 现有的多智能体系统主要面临以下问题&#xff1a; 复杂性处理不足&#xff1a;传统的多智能体系统主要关注简单任务&#xff0c;对于复杂任务的处理能力有限&#xff0c;缺乏深入探索和…

Dvws靶场

文章目录 一、XXE外部实体注入二、No-SQL注入三、Insecure Direct Object Reference四、Mass Assignment五、Information Disclosure六、Command Injection七、SQL注入 一、XXE外部实体注入 访问http://192.168.92.6/dvwsuserservice?wsdl&#xff0c;发现一个SOAP服务。在SO…

vite项目启动后用局域网不能访问

今天来解决一个问题&#xff1a;基于Vite构建的Vue项目在启动后只能通过localhost这种形式访问 如果把localhost换成本主机的局域网ip地址之后页面无法访问了。 就连用127.0.0.1都无法访问。尝试多次之后&#xff0c;最后证明只有使用localhost这种形式才可以 原因&#xff1…

解锁机器学习的无限可能:深入探究scikit-learn的强大功能

解锁机器学习的无限可能&#xff1a;深入探究scikit-learn的强大功能 第一部分&#xff1a;背景和功能介绍 在数据科学和机器学习领域&#xff0c;scikit-learn&#xff08;简称sklearn&#xff09;是一个广泛使用的Python库。它提供了简单高效的工具用于数据挖掘和数据分析&a…

德勤报告:税务合规与转型过程中的技术应用

在当前数据驱动的时代&#xff0c;税务管理已不再是简单的合规问题&#xff0c;而是涉及到企业战略和运营的各个层面。德勤最新发布的《2023年税务转型趋势调研》详细探讨了全球企业在面对日益复杂的税务环境时&#xff0c;如何通过技术手段实现税务合规、税务转型和税务运营的…

乙二醇水溶液物性参数

1.1 乙二醇水溶液的冰点、沸点 乙二醇水溶液作为重要的载冷剂&#xff0c;其物理性质对设备和系统的设计都十分重要&#xff0c;下面是乙二醇水溶液的冰点沸点和其浓度的关系。&#xff08;数据来源 ASHRAE 手册 2005&#xff09; 1.2 乙二醇水溶液粘度 乙二醇水溶液作为重要…

【debug】vscode配置c/c++环境及查看调试信息m1 mac

之前用的一直是clion 但是经过反复调整&#xff0c;发现始终查看不了vector里面的数值&#xff08;只有指针地址&#xff09;&#xff0c;改用常用的vscode后调试成功 安装 安装vscode 以及vscode中的扩展安装 c/c,c/c extension pack,cmake,cmake tools,code runner,codeLLD…

深度学习笔记: 最详尽LinkedIn Feed 排名系统设计

欢迎收藏Star我的Machine Learning Blog:https://github.com/purepisces/Wenqing-Machine_Learning_Blog。如果收藏star, 有问题可以随时与我交流, 谢谢大家&#xff01; LinkedIn Feed 排名 1. 问题陈述 设计一个个性化的LinkedIn Feed&#xff0c;以最大化用户的长期参与度…

2.2 窗口的创建

本书使用C语言编写Windows程序&#xff0c;因此需要搭建C语言开发环境&#xff0c;使用Visual Studio作为C语言的开发工具。 本节必须掌握的知识点&#xff1a; 第8练&#xff1a;Windows程序模型 第9练&#xff1a;注册窗口类 第10练&#xff1a;创建、显示和更新窗口 第11练…