【斯坦福因果推断课程全集】2_无混淆和倾向分1

目录

Beyond a single randomized controlled trial

Aggregating difference-in-means estimators

Continuous X and the propensity score


随机试验的一个最简单的扩展是无约束下的干预效果估计。从定性上讲,当我们想估计一种并非随机的治疗效果,但一旦我们控制了一组协变量Xi,其效果就和随机的一样好时,无边界性就与此相关。

本讲座的目的就是讨论在这种无边界假设下平均干预效果的识别和估计。与之前一样,我们将采用非参数方法: 我们不会假设任何参数模型的良好规范,平均治疗效果的识别将完全由设计(即与潜在干预结果和治疗相关的条件独立性声明)驱动。

Beyond a single randomized controlled trial

我们通过潜在干预结果来定义治疗的因果效应。对于二元干预 w∈{0, 1},我们定义潜在结果 Yi(1)和 Yi(0),分别对应第 i 个受试者在接受或不接受干预时会经历的结果。我们假设 SUTVA,Y_i = Y_i(W_i),并希望估计平均干预效果

\text{ATE}=\mathbb{E}\left[Y_i(1)-Y_i(0)\right]

在第一讲中,我们假设随机干预分配,\{Y_i(0), Y_i(1)\}\perp W_i,并研究了 ATE 的几个 √n 一致性估计器。

超越一个 RCT 的最简单方法是考虑两个 RCT。举个具体例子,假设我们对给予青少年现金奖励以阻止他们吸烟感兴趣。加利福尼亚州帕洛阿尔托市 5%的青少年和瑞士日内瓦 20%的青少年有资格参加这项研究。

在每个城市内,我们都进行了随机对照研究,事实上很容易看到干预有所帮助。然而,查看总体数据会产生误导,看起来干预会造成伤害;这就是有时被称为辛普森悖论的一个例子:一旦我们汇总数据,这就不再是一项 RCT,因为日内瓦人既更有可能接受治疗,也更有可能无论是否接受治疗都吸烟。为了得到一致的 ATE 估计值,我们需要分别估计每个城市的干预效果:\begin{aligned} &\hat{\tau}_{\mathrm{PA}}=\frac{5}{152+5}-\frac{122}{2362+122}\approx-1.7\%, \\ &\hat{\tau}_{\mathrm{GVA}}=\frac{350}{350+581}-\frac{1979}{2278+1979}\approx-8.9\% \\ &\begin{aligned}\hat{\tau}=\frac{2641}{2641+5188}\hat{\tau}_{\mathrm{PA}}+\frac{5188}{2641+5188}\hat{\tau}_{\mathrm{GVA}}\approx-6.5\%.\end{aligned} \end{aligned}

这个估计器的统计特性是什么?这个想法是如何推广到连续的x呢?

Aggregating difference-in-means estimators

假设协变量 Xi 在离散空间 Xi∈X 中取值,|\mathcal{X}|=p<\infty。再假设治疗分配是以 Xi 为条件的随机分配(即每组都有一个由 x 水平定义的 RCT):\{Y_i(0), Y_i(1)\} \perp W_i \big| X_i=x, \text{for all} x\in\mathcal{X}.

定义组内平均治疗效果为\tau(x)=\mathbb{E}\begin{bmatrix}Y_i(1)-Y_i(0)&X_i=x\end{bmatrix}

然后,如上所述,我们可以通过聚合组级治疗效果估计来估计ATE τ,

\begin{aligned}\hat{\tau}_{AGG}=\sum_{x\in\mathcal{X}}\frac{n_x}{n}\hat{\tau}(x),\quad\hat{\tau}(x)=\frac{1}{n_{x1}}\sum_{\{X_i=x,W_i=1\}}Y_i-\frac{1}{n_{x0}}\sum_{\{X_i=x,W_i=0\}}Y_i,\end{aligned}

其中 n_x=|\{i:X_i=x\}|\begin{aligned}n_{xw}=|\{i:X_i=x, W_i=w\}|\end{aligned}。这个估计值有多好?直观地说,我们需要估计 |\mathcal{X}|=p 个 "参数",因此我们可能期望方差与 p 成线性关系?

为了研究这个估计值,我们可以把它写成下面这样。首先,对于任何具有协变量 x 的组,将 e(x) 定义为在该组中得到治疗的概率,e(x)=\mathbb{P}\left[W_{i}=1 \big| X_{i}=x\right] ,并注意到

\sqrt{n_x}\left(\hat{\tau}(x)-\tau(x)\right)\Rightarrow\mathcal{N}\left(0, \frac{\text{Var}\left[Y_i(0) \big| X_i=x\right]}{1-e(x)}+\frac{\text{Var}\left[Y_i(1) \big| X_i=x\right]}{e(x)}\right)

此外,根据 \mathrm{Var}\begin{bmatrix}Y(w)&X=x\end{bmatrix} =\sigma^{2}(x) 不依赖于 w 的简化假设,我们可以得到

\sqrt{n_x}\left(\hat{\tau}(x)-\tau(x)\right)\Rightarrow\mathcal{N}\left(0, \frac{\sigma^2(x)}{e(x)(1-e(x))}\right).

接下来,对于集合估计器,将 \hat{\pi}(x) = n_x/n 定义为 X_{i}=x 的观测值的比例,将 \pi(x)=\mathbb{P}\left[X_i=x\right] 定义为其期望值,我们可以得出

把这些部分放在一起,我们得到了\sqrt{n}\left(\hat{\tau}_{AGG}-\tau\right)\Rightarrow\mathcal{N}\left(0,V_{AGG}\right)

\begin{gathered} V_{AGG} =\mathrm{Var}\left[\tau(X_{i})\right]+\sum_{x\in\mathcal{X}}\pi^{2}(x)\frac{1}{\pi(x)}\frac{\sigma^{2}(x)}{e(x)(1-e(x))} \\ =\mathrm{Var}\left[\tau(X_i)\right]+\mathbb{E}\left[\frac{\sigma^2(X_i)}{e(X_i)(1-e(X_i))}\right]. \end{gathered}

值得注意的是渐近方差 VAGG 并不依赖于组数 |\mathcal{X}|=p,正如我们稍后将看到的,这一事实在观察研究中有效地进行平均干预效果的半参数推断方面起着关键作用。

Continuous X and the propensity score

在上文,我们考虑了 X 是离散的、水平数有限的情况,治疗 Wi 如(2.1)中 Xi = x 的条件一样是随机的。在这种情况下,我们发现仍然可以通过汇总组内治疗效果估计值来准确估计 ATE,而且组的确切数目 |X | = p 并不影响推论的准确性。然而,如果 X 是连续的(或 X 的卡方数非常大),这一结果就不能直接应用--因为我们无法为 x∈X 的每个可能值获得足够的样本,从而无法像(2.3)中那样定义 τ (x)。

为了将我们的分析推广到离散-X 的情况之外,我们不能再简单地试图通过简单平均来估计每个 x 值的τ (x),而是要使用更间接的论证。为此,我们首先需要概括 "每组都有 RCT "的假设。在形式上,我们只需写出同样的内容

\{Y_i(0),Y_i(1)\}\perp W_i \big| X_i,\quad(2.6)

尽管现在 Xi 可能是一个任意的随机变量,对这句话的解释可能需要更加谨慎。从定性的角度来看,对(2.6)的一种理解是,我们已经测量了足够多的协变量来捕捉 Wi 与潜在结果之间的任何依赖关系,因此在给定 Xi 的情况下,Wi 无法 "窥视"{Yi(0), Yi(1)} 。我们称这一假设为unconfoundedness.

假设 (2.6) 似乎很难在实际中使用,因为它涉及到连续随机变量的条件。然而,正如 Rosenbaum 和 Rubin(1983 年)所指出的,通过考虑倾向得分 e(x)=\mathbb{P}\begin{bmatrix}W_i=1 \big| X_i=x\end{bmatrix}

从统计学上看,倾向得分的一个关键属性是,它是一个平衡得分:如果(2.6)成立,那么实际上

\{Y_i(0),Y_i(1)\}\perp W_i | e(X_i),\quad(2.8)

 也就是说,实际上只需要控制 e(X)而不是 X,就可以消除与非随机干预分配相关的偏差。我们可以通过以下方法验证这一说法:

\begin{aligned} &\mathbb{P}\left[W_{i}=w \big| \{Y_{i}(0), Y_{i}(1)\big\} , e(X_{i})\right] \\ &=\int_{\mathcal{X}}\mathbb{P}\left[W_i=w \big| \{Y_i(w)\} ,X_i=x\right]\mathbb{P}\left[X_i=x \big| \{Y_i(w)\} , e(X_i)\right] dx \\ &=\int_{\mathcal{X}}\mathbb{P}\left[W_i=w \big| X_i=x\right]\mathbb{P}\left[X_i=x \big| \big\{Y_i(w)\big\} , e(X_i)\right] dx\quad\text{(unconf.)} \\ &=e(X_{i})\mathbf{1}_{w=1}+(1-e(X_{i}))\mathbf{1}_{w=0}. \end{aligned}

(2.8)的含义是,如果我们能将观察结果划分为倾向得分 e(x)值(几乎)恒定的组别,那么我们就能通过 \hat{\tau}_{AGG} 的变体持续估计平均干预效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/793370.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PyTorch | 加速模型训练的妙招

引言 提升机器学习模型的训练速度是每位机器学习工程师的共同追求。训练速度的提升意味着实验周期的缩短&#xff0c;进而加速产品的迭代过程。同时&#xff0c;这也表示在进行单一模型训练时&#xff0c;所需的资源将会减少。简而言之&#xff0c;我们追求的是效率。 熟悉 PyT…

mybatis的拦截器

文章目录 第三个是参数拦截器第四个是结果集拦截器mybatis拦截器-笔试题1.笔试题 JDBC的执行流程3.执行sql语句,返回执行结果 mybatis的四种拦截器 第一个是执行拦截器: Executor&#xff08;执行器拦截器&#xff09;&#xff1a; 用途&#xff1a;拦截MyBatis执行器方法的…

AI版Siri要明年见,研究表明ChatGPT暂无法取代程序员,Kimi推出浏览器插件

ChatGPT狂飙160天&#xff0c;世界已经不是之前的样子。 更多资源欢迎关注 根据彭博社记者马克古尔曼的最新消息&#xff0c;苹果公司今年不会推出全新的Apple Intelligence驱动的Siri&#xff0c;该公司计划在明年1月开始测试&#xff0c;并在iOS 18.4中才推出正式版本。 此前…

未来工业革命:区块链在工业4.0中的角色与应用

随着科技的迅猛发展&#xff0c;人类社会正在逐步迈向工业4.0时代。在这一新时代的背景下&#xff0c;区块链技术作为一种创新性的分布式账本技术&#xff0c;正逐步在工业领域展示其独特的价值和潜力。本文将深入探讨区块链在工业4.0中的角色与应用&#xff0c;分析其对工业生…

windows安装Docker Desktop及国内镜像

简介 Docker 是一个开源的应用容器引擎&#xff0c;它让开发者可以打包他们的应用以及依赖包到一个可移植的容器中&#xff0c;然后发布到任何流行的 Linux 机器上&#xff0c;也可以实现虚拟化。通过Docker工具&#xff0c;简化了应用的部署、配置和管理过程&#xff0c;提高…

dataX入门

下载dataX https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202308/datax.tar.gz 然后 下载后解压至本地某个目录&#xff0c;进入bin目录&#xff0c;即可运行同步作业&#xff1a; $ cd {YOUR_DATAX_HOME}/bin $ python datax.py {YOUR_JOB.json} 要求你有python…

FPGA上板项目(一)——点灯熟悉完整开发流程、ILA在线调试

目录 创建工程创建 HDL 代码仿真添加管脚约束添加时序约束生成 bit 文件下载ILA 在线调试 创建工程 型号选择&#xff1a;以 AXU9EG 开发板为例&#xff0c;芯片选择 xczu9eg-ffvb1156-2-i 创建 HDL 代码 注意&#xff1a;由于输入时钟为 200MHz 的差分时钟&#xff0c;因此…

【Python】已解决:ModuleNotFoundError: No module named ‘nltk’

文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决&#xff1a;ModuleNotFoundError: No module named ‘nltk’ 一、分析问题背景 在使用Python进行自然语言处理或文本分析时&#xff0c;我们经常会用到各种库来辅助我们的工…

【ACM 独立出版,高录用EI稳检索】2024年大数据与数字化管理国际学术会议 (ICBDDM 2024,8月16-18)

2024年大数据与数字化管理国际学术会议 (ICBDDM 2024)&#xff0c;将于2024年8月16-18日在中国上海召开。 “大数据与数字化管理”作为会议主题&#xff0c;旨在聚焦这一跨学科领域中最新的理论研究、技术进展、实践案例和未来趋势。本主题探讨的研究方向涵盖了大数据的收集、…

GD32F303RET6读取SGM58031电压值

1、SGM58031芯片详解 &#xff08;1&#xff09;SGM58031是一款低功耗&#xff0c;16位精度&#xff0c;delta-sigma (ΔΣ)模数转换器(ADC)。它从3V到5.5V供电。 &#xff08;2&#xff09;SGM58031包含一个片上参考和振荡器。它有一个I2C兼容接口&#xff0c;可以选择四个I2…

15、电科院FTU检测标准学习笔记-基本性能

作者简介&#xff1a; 本人从事电力系统多年&#xff0c;岗位包含研发&#xff0c;测试&#xff0c;工程等&#xff0c;具有丰富的经验 在配电自动化验收测试以及电科院测试中&#xff0c;本人全程参与&#xff0c;积累了不少现场的经验 ———————————————————…

Nginx七层(应用层)反向代理:SCGI代理scgi_pass篇

Nginx七层&#xff08;应用层&#xff09;反向代理 SCGI代理scgi_pass篇 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite&#xff1a;http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this art…

利用Altair One 云平台,轻松实现全球企业产品研发创新与优化

在过去的几十年里&#xff0c;工程师和数据科学家引入了大量改变世界的技术&#xff0c;但他们的工作方式却出人意料地停滞不前。技术的革新也带来了效率的不断提升。 面对众多企业的同样难题&#xff0c;Altair整合产品&#xff0c;创造出了用于协作工程、数据工程和分析应用程…

数列分块<2>

本期是数列分块入门<2>。该系列的所有题目来自hzwer在LOJ上提供的数列分块入门系列。 Blog:http://hzwer.com/8053.html sto hzwer orz %%% [转载] 好像上面的链接↑打不开&#xff0c;放一个转载:https://www.cnblogs.…

【C++】C++-机房收费管理系统(源码+注释)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

RK3568平台开发系列讲解(内存篇)Linux进程内存的消耗统计

🚀返回专栏总目录 文章目录 一、VSS(Virtual Set Size)二、RSS(Resident Set Size)三、PSS(Proportional Set Size)四、USS(Unique Set Size)五、其他工具Linux 提供了多种进程内存占用的度量指标, 它们反映了不同的内存使用特征: VSS 反映进程虚拟内存总需求, 包括未…

Oracle基础以及一些‘方言’(一)

1、什么是Oracle ORACLE数据库系统是美国ORACLE公司&#xff08;甲骨文&#xff09;提供的以分布式数据库为核心的一组软件产品&#xff0c;是最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。 ORACLE 通常应用于大型系统的数据库产品。 ORACLE 数据库是目前世界…

企业内多个系统如何实现单点登录/SSO统一认证

背景 在现代化企业中&#xff0c;随着业务的不断扩展和技术的不断进步&#xff0c;企业通常会使用多个系统来支持其日常运营&#xff0c;如OA、HR、CRM、研发应用&#xff08;Git、Jira等&#xff09;、财务系统、档案管理系统等。然而&#xff0c;这些系统往往各自为政&#…

基于Spring Boot的高校后勤餐饮管理系统

1 项目介绍 1.1 研究背景 “互联网”时代的到来&#xff0c;既给高校后勤管理发展带来了机遇&#xff0c;也带来了更大的挑战。信息化应用已经开始普及&#xff0c;传统的高校后勤餐饮管理模式往往存在着效率低下、信息不透明、资源浪费等问题&#xff0c;已经难以满足现代高…

Chromium源码阅读(7):了解WTF的静态字符串机制

在浏览器的实现中&#xff0c;处理HTML和CSS涉及大量的字符串操作&#xff0c;这些操作通常包括字符串的比较、查找和匹配。如果使用普通的字符串对这些进行操作&#xff0c;在面临大量DOM元素和CSS规则时会导致效率低下。 例如&#xff0c;当解析CSS时&#xff0c;属性名如col…