因果发现31种高效经典方案汇总,附配套算法和代码

因果发现(Causal Discovery)是一个复杂的过程,其目标是从大量的数据中确定变量之间的因果关系。这个过程通常涉及到的是如何从纷繁复杂的数据中发现其中隐含的因果关系。有时,研究者可以通过随机实验进行干预来发现因果关系,但由于开销、道德考虑等原因有时无法进行这样的实验,通常只有观测数据,而缺乏干预数据。

因此,如何有效地进行因果发现,成为了一个非常具有挑战性的问题。目前,有许多研究者正在努力开发新的方法。而在已有的方法中,也有许多成果很值得我们学习。

我这次就帮大家整理了31种使用观测数据/观测和干预数据混合进行结构发现的方法,主要分为2大类:基于组合/搜索的算法和基于连续优化的算法。篇幅原因只做简单介绍,建议同学们收藏了仔细学习。

方法原文及源码需要的同学看文末

基于组合/搜索的算法

1.Distinguishing cause from effect using quantiles: Bivariate quantile causal discovery

二元分位数因果发现

算法简述:论文通过最小描述长度原则,将因果关系与分位数回归联系起来,开发了一种新方法,称为二元分位数因果发现(bQCD),它假设没有混淆、选择偏见或反馈,并使用多个分位数水平来区分因果关系。这种方法不仅适应于加法,还适应于乘法或位置-尺度产生机制。在合成和真实数据集上的实证比较表明,bQCD在各种实现中表现出稳健性,计算效率高,优于现有方法。

2.Learning DAGs without imposing acyclicity

在不强加非周期性的情况下学习DAG

算法简述:论文探讨是否有可能在不显式施加无环性约束的情况下从数据中学习一个有向无环图(DAG)。 作者将结构性学习作为稀疏矩阵分解问题来解决,并通过经验表明解决 ℓ1-penalized optimization 可以很好地恢复真实图,而且通常可以恢复几乎所有DAG图。 此外,这种方法计算效率高,并且不会像经典结构性学习算法那样受到组合复杂性爆炸的影响。

3.Learning directed graphical models from Gaussian data

从高斯数据中学习有向图形模型

算法简述:本文介绍了一种新的有向图形模型——高斯图形交互模型(GGIM),它基于图上平稳高斯过程和拉普拉斯矩阵的方程。通过简单理论,作者解释了图形模型中的边代表的含义。当限制在无向图上时,GGIM的拉普拉斯矩阵相当于标准逆协方差矩阵,表示条件依赖关系。作者还定义了平稳高斯过程中两个元素之间的有向条件独立性。学习稀疏GGIM的问题可以转化为LASSO问题。

4.Chacterizing distribution equivalence and structure learning for cyclic and acyclic directed graphs

循环和非循环有向图的分布等价性和结构学习的特征

算法简述:这篇文章提出了一个通用、统一的等价性概念,用于线性高斯因果定向图形模型。在这个概念中,两个结构被视为等价,如果它们可以生成相同的数据分布。此外,作者还提出了一个较弱的等价性概念quasi-equivalence,它表示从观察数据中可以识别的程度。文章还提出了分析和图形方法来表征两个结构的等价性,并提出了一个基于得分的从观察数据中学习结构的方法,可以成功地处理不同类型的结构。

5.Causal structure learning from time series: large regression coefficients may predict causal links better in practice than small p-values

从时间序列中学习因果结构

算法简述:论文考察了如何将现有思想结合起来,在具有现实世界地球科学数据常见挑战的半现实和现实时间序列数据上取得具有竞争力的性能。作者还讨论了a)利用线性方法识别非线性系统中因果联系的原理,b)基于模拟的解释,说明为什么大的回归系数在实践中可能比小的p值更好地预测因果联系,以及为什么归一化数据有时会妨碍因果结构学习。

  • 6.Bayesian causal structure learning with zero-inflated Poisson Bayesian networks

  • 7.Causal learning with sufficient statistics: an information bottleneck approach

  • 8.Causal discovery from heterogeneous/nonstationary data with independent changes

  • 9.Causal discovery from soft interventions with unknown targets: characterization and learning

  • 10.A simultaneous discover-identify approach to causal inference in linear models

基于连续优化的算法

1.Disentangled generative causal representation learning

解耦生成式因果表征学习

算法简述:本文提出了一种解耦生成式因果表示学习(DEAR)方法,用于处理潜在变量之间存在因果关系的情况。该方法使用结构因果模型作为双向生成模型的先验,并通过GAN损失和监督信息进行联合训练。实验证明,DEAR方法在因果可控生成和下游任务中具有有效性和优势。

2.Causal adversarial network for learning conditional and interventional distributions

用于学习条件分布和干预分布的因果对抗网络

算法简述:论文提出了一种新的因果对抗网络(CAN),它可以从数据中学习因果关系,并根据条件或干预生成样本。与现有的因果GAN不同,CAN不需要预先给出的因果图。CAN包括两个部分:标签生成网络(LGN)和条件图像生成网络(CIGN)。LGN学习并从标签的因果模型中采样,然后将这些标签提供给CIGN,它学习标签与像素之间的关系,并根据这些关系生成图像。这个框架还具有一个干预机制,使模型能够从干预分布中生成样本。

3.DAGs with No Fears: A closer look at continuous optimization for learning Bayesian networks

深入了解贝叶斯网络学习的连续优化

算法简述:论文重新审视了一个名为NOTEARS的连续优化框架,用于学习贝叶斯网络。文章首先将现有循环性的代数特征推广到一类矩阵多项式,重点关注每条边只有一个参数的情况,证明了NOTEARS公式中Karush-Kuhn-Tucker(KKT)最优条件无法满足,除非在特殊情况下。然后为等价改写的问题求得了KKT条件,并证明了它们确实是必要的,并将它们与图中某些边缺失的显式约束联系起来。如果得分函数是凸的,那么这些KKT条件对于局部最小性也是充分的,尽管约束是非凸的。在KKT条件的启发下,作者提出了一种局部搜索后处理算法,并证明它通常可以将所有测试算法的结构Hamming距离提高2倍或更多。

4.On the role of sparsity and DAG constraints for learning linear DAGs

稀疏性和DAG约束对学习线性DAG的作用

算法简述:论文研究了如何学习DAG(有向无环图)的结构。由于DAG的搜索空间很大,这使得学习其结构非常具有挑战性。以前的方法使用了最小二乘目标和DAG的代数特征,但需要硬性DAG约束,这可能会导致优化困难。作者提出了一种新的方法,它考虑了稀疏性和DAG约束在学习DAG模型中的作用。

在理论和实验中,作者证明了软稀疏性和DAG约束可以用来学习DAG,还提出了一种基于似然的评分函数,它不需要硬性DAG约束,可以更容易地解决优化问题。

5.Differentiable causal discovery under unmeasured confounding

可微分的未测量混杂因素下的因果发现

算法简述:本文提出了一种基于不同微分代数约束的因果发现方法,用于处理混杂系统中由于未测量变量的存在而导致的数据混杂问题。该方法使用离散搜索过程选择编码观察变量之间普通条件独立约束的无环有向混合图(ADMGs),特别是祖传ADMGs。通过推导出完全表征祖传ADMGs空间的不同微分代数约束,并将因果发现问题转化为连续优化问题,设计了可微程序来寻找最佳拟合的ADMG。

  • 6.DYNOTEARS: Structure learning from time-series data

  • 7.Learning neural causal models from unknown interventions

  • 8.A critical view of the structural causal model

  • 9.Causal discovery with reinforcement learning

  • 10.Amortized learning of neural causal representations

  • 11.Amortized causal discovery: Learning to infer causal graphs from time-series data

  • 12.Causal discovery in physical systems from videos

  • 13.CASTLE: regularization via auxiliary causal graph discovery

  • 14.Gradient-based neural DAG learning

  • 15.Masked gradient-based causal structure learning

  • 16.CausalVAE: disentangled representation learning via neural structural causal models

  • 17.Causal autoregressive flows

  • 18.Learning DAGs without imposing acyclicity

  • 19.Learning sparse nonparametric DAGs

  • 20.Causal discovery from incomplete data: a deep learning approach

  • 21.Efficient and scalable structure learning for Bayesian networks: Algorithms and Applications

关注下方《学姐带你玩AI》🚀🚀🚀

回复“因果发现”领取方法原文及源码

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/181381.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Windows Python3安装salt模块失败处理

复现CVE-2020-11651时候运行CVE-2020-11651的poc时候需要salt模块 在下载时出现了错误 尝试在网上寻找解决方法: 1.更新 setuptools 和 wheel pip install --upgrade setuptools wheel 2. 安装Microsoft Visual C 14.0 因为salt模块包包使用了 C/C 扩展&#x…

【速看】如何提高微信权重?影响微信权重的加分、扣分行为

微信具有一套权重判定系统,类似于搜索引擎的PR值,可以看做是一个“积分系统”。好的操作会增加积分,负面操作会减少积分。 当积分低于特定标准(即底线)时,将会被严重惩罚或封号。这样,微信确保了…

C# Onnx PP-Vehicle 车辆分析(包含:车辆检测,识别车型和车辆颜色)

目录 效果 模型信息 mot_ppyoloe_s_36e_ppvehicle.onnx vehicle_attribute_model.onnx 项目 代码 下载 其他 C# Onnx PP-Vehicle 车辆分析(包含:车辆检测,识别车型和车辆颜色) 效果 模型信息 mot_ppyoloe_s_36e_ppvehi…

代码随想录算法训练营Day 59 || 503.下一个更大元素II、42. 接雨水

503.下一个更大元素II 力扣题目链接(opens new window) 给定一个循环数组(最后一个元素的下一个元素是数组的第一个元素),输出每个元素的下一个更大元素。数字 x 的下一个更大的元素是按数组遍历顺序,这个数字之后的第一个比它更…

docker 安装常用环境

一、 安装linux(完整) 目前为止docker hub 还是被封着,用阿里云、腾讯云镜像找一找版本直接查就行 默认使用latest最新版 #:latest 可以不写 docker pull centos:latest # 拉取后查看 images docker images #给镜像设置标签 # docker tag […

某基金公司赵哥“逆袭”了!!!

赵哥,在上海一家基金公司做运维主管。 平时工作的首要任务,就是保障公司各项信息系统的安全运行。 万一系统运行中出现了一些重要问题,他还要负责进行调查、记录与汇报... 总之,责任很重,该说不说,搞不好…

10.分组循环练习题

分组循环 https://leetcode.cn/problems/longest-even-odd-subarray-with-threshold/solutions/2528771/jiao-ni-yi-ci-xing-ba-dai-ma-xie-dui-on-zuspx/?envTypedaily-question&envId2023-11-16 分组循环 适用场景: 按照题目要求,数组会被分割成若…

大型养殖场需要哪些污水处理设备

大型养殖场是一个涉及环境保护和可持续发展的关键行业,对于处理养殖场产生的污水有着明确的要求和标准。为了确保污水得到有效处理和处理效果达到国家排放标准,大型养殖场需要配备一系列污水处理设备。以下是几种常见的污水处理设备: 1. 水解…

厦门市委常委、常务副市长黄晓舟调研极狐(GitLab)

11 月 22 日,厦门市委常委、常务副市长黄晓舟,厦门市工信局副局长许文恭,厦门市高新技术创业中心有限公司董事长邸国栋等一行人员莅临极狐(GitLab)进行参观调研,深入了解极狐(GitLab)的发展情况。 黄晓舟副市长(左&…

TikTok历史探秘:短视频中的时间之旅

在数字时代的浪潮中,TikTok崭露头角,成为社交媒体领域的一颗耀眼新星。这款短视频应用以其独特的创意、时尚和娱乐性质,吸引了全球数以亿计的用户。 然而,TikTok并非一夜之间的奇迹,它背后蕴藏着丰富而有趣的历史故事…

解决ElementUI时间选择器回显出现Wed..2013..中国标准时间.

使用饿了么组件 时间日期选择框回显到页面为啥是这样的? 为什么再时间框中选择日期,回显页面出现了这种英文格式呢???? 其实这个问题直接使用elementui的内置属性就能解决 DateTimePicker 日期时间选择…

qs-一个序列化和反序列化的JavaScript库

起因 一个业务场景中,最终得到一串字符"status[0]value1&status[1]value2" 通过解析,理应得到一个数组,却得到一个对象 于是展开问题排查 最终发现是qs.parse 这个地方出了问题 排查结果 qs解析这种带下标的字符串时&#xff…

内网穿透隐秘隧道搭建

别低头,皇冠会掉;别流泪,贱人会笑。 本文首发于先知社区,原创作者即是本人 0x00 前言 构建内网隐蔽通道,从而突破各种安全策略限制,实现对目标服务器的完美控制。 当我们从外网成功获得攻击点的时候&…

实时截留抖音询价的用户:10个合规方法,让你的业务迅速增长!

先来看实操成果,↑↑需要的同学可看我名字↖↖↖↖↖,或评论888无偿分享 一、引言 随着抖音的普及度越来越高,越来越多的商家开始关注抖音询价用户。这些潜在客户对于企业的发展至关重要,如何实时截留这些用户成为商家关注的重点…

leetcode:645. 错误的集合(python3解法)

难度:简单 集合 s 包含从 1 到 n 的整数。不幸的是,因为数据错误,导致集合里面某一个数字复制了成了集合里面的另外一个数字的值,导致集合 丢失了一个数字 并且 有一个数字重复 。 给定一个数组 nums 代表了集合 S 发生错误后的结…

python避坑指南(更新中)

os.path.join 避免连续的/,看示例即清楚,最好的避免方法是字符串首末都不要加’/: join用法 用join前面的符号将参数数组里面的字符串连接起来,注意join只有一个参数

合并两个有序链表,剑指offer,力扣

目录 力扣题目地址: 原题题目: 我们直接看题解吧: 解题方法: 审题目事例提示: 解题思路: 具体流程如下: 代码实现: 知识补充: 力扣题目地址: 21. 合并两个有序…

品牌如何利用情绪营销打出知名度

“悦己文化”和“她经济”的兴起让人们更加关注自己的内心感受,同时“发疯文学”、“精神内耗”等热词都体现了当代人为了缓解压力而为情绪消费的趋势,品牌想要留住消费者,就必须不断迭代,直面消费者需求,今天媒介盒子就来和大家聊…

【拿完年终奖后】想要转行网络安全,一定不要错过这个时间段。

网络安全,作为当下互联网行业中较为热门的岗位,薪资可观、人才需求量大,作为转行必考虑。 在这里奉劝所有零基础想转行(入门) 网络安全的朋友们 在转行之前,一定要对网络安全行业做一个大概了解&#xf…

投标文件的注意事项

一、检查标书 1.1有时候标书需要从别的地方复制黏贴文件,记住复制内容可以,但是不要复制“落款和时间”的格式,落款和时间的格式借鉴你的招标文件中给响应文件格式的落款和时间,切记! 1.2检查标书是否有空页&#xf…