NEJM一篇新文为例,聊聊孟德尔随机化研究mr 连锁不平衡(linkage disequilibrium)

2019年3月14日,新英格兰医学杂志发表了一篇论著,Mendelian Randomization Study of ACLY and Cardiovascular disease, 即《ACLY和心血管疾病的孟德尔随机化研究》。与小咖在2017年1月9日报道的一篇发表在新英格兰医学的孟德尔随机化研究——精读NEJM:基因变异与冠心病/糖尿病的发病风险,是同一个团队的成果。

本篇文章意在简单介绍ACLY这篇文章的脉络,并梳理孟德尔随机化研究的基本原则。

研究背景

ATP柠檬酸裂合酶(ATP citrate lyase,此后简称ACLY)是胆固醇生物合成途径中的一种酶,此酶的作用位置在3-羟基-3-甲戊二酸辅酶A还原酶(HMGCR,他汀类药物靶点)的上游。

研究者提出的科学问题是通过抑制ACLY来降低低密度脂蛋白(LDL),是否可以达到与HMGCR抑制剂相同的减少心血管疾病事件的效果。

Bempedoic Acid 是一种口服的ACLY抑制剂。在名为CLEAR的临床试验中,在受试者已经接受他汀类治疗的情况下,服用Bempedoic Acid组的LDL水平较基线水平降低,且比安慰剂组的下降幅度要多18.1个百分点。虽然与安慰剂组相比,Bempedoic Acid组的心血管事件数目降低,但心血管疾病造成的死亡数和癌症数目却增加了。

由此引发疑问,Bempedoic Acid这种ACLY抑制剂或者其他ACLY的抑制剂是否会带来巨大的负面效应。

所以,研究者想利用模拟ACLY抑制剂效应的遗传变异和模拟HMGCR抑制剂效应的遗传变异,来比较两者对LDL和临床结局的影响,进而评估通过ACLY抑制来降低LDL所产生的临床效应。

考虑到Bempedoic Acid可能和他汀类药物或依折麦布(ezetimibe)联用,研究者还评估了ACLY变异与另外两种变异联合作用的效果,这两种变异名为 HMGCR 和 NPC1L1,分别编码他汀类药物和依折麦布的靶点蛋白。这一研究旨在为ACLY抑制剂的效应提供生物学背景信息。

研究方法

分别用编码ACLY和HMGCR的基因中的变异构建遗传分数作为工具变量,工具变量可以模拟ACLY抑制剂和HMGCR抑制剂的效应。研究者比较了遗传分数与血脂水平、血脂蛋白水平、心血管事件风险和癌症风险的关系。

研究结果

总共654783名参与者纳入研究(包括105429名伴有主要心血管事件)。ACLY遗传分数和HMGCR遗传分数与血脂水平、血脂蛋白水平变化有着相同模式的关联,与心血管事件的风险有着相同效应的关联。

对于ACLY遗传分数来说,LDL水平每降低10mg/dL,心血管事件的风险相应降低17.7%(OR值为0.823,95%置信区间为0.78-0.87,P=4.0×10-14)。

对于HMGCR遗传分数来说,LDL水平每降低10mg/dL,心血管事件的风险相应降低16.4%(OR值为0.836,95%置信区间为0.81-0.87,P=3.9×10-14)。ACLY抑制和HMGCR抑制都不与癌症风险增加有关。

文章主要大的框架如下图所示

图1:本文的框架

除此之外,文章还应用ACLY遗传分数和HMGCR遗传分数结合,ACLY遗传分数和HMGCR遗传分数结合,做了因子孟德尔随机化研究(Factorial Mendelian randomization)。本文旨在讲明孟德尔随机化研究的基本原则,在此处不再过多展开。小咖2017年初关于孟德尔随机的文章中详细解释了这种因子孟德尔随机化研究。(精读NEJM:基因变异与冠心病/糖尿病的发病风险)

我们可以用随机对照分组试验的设计思路来帮助理解孟德尔随机化研究的原理(比较可见图2)。孟德尔随机化研究的使用背景是研究人员无法确认暴露对于结局的效应(可能是有混杂因素,也可能是“暴露”和“结局”的实际关系为因果倒置,或者常规的随机对照分组试验面临伦理风险而难以进行,比如CLEAR研究发现ACLY抑制剂组有可能会带来更多的风险)。

它的假设是基因在减数分裂时随机分配到子代,这就相当于把基因的效应随机分配给“受试者”,从而“控制”其他因素对基因效应的影响。研究者运用基因变异作为工具变量研究工具变量和结局的关系,由这两者的关系来推出暴露(基因效应)对于结局的效应。

图2:孟德尔随机化研究和随机对照分组试验的对比(图片来源:https://www.acc.org/latest-in-cardiology/articles/2015/06/11/13/17/mendelian-randomization-studies)

有一个研究例子可以帮助我们理解,该研究的目的是关于低水平血浆胆固醇浓度和癌症风险的关系。在80年代中期存在一个争议:低血浆胆固醇水平是否会直接增加癌症风险。有人推测,可能是癌症导致了胆固醇水平降低(因果倒置),也有可能有饮食等混杂因素同时作用于胆固醇水平和癌症的风险。

为了验证两者是否存在直接的因果关系,一位叫Katan的研究者巧妙利用了一种叫 ApoE2 的基因变异,该变异会导致低水平胆固醇。Katan的想法是,ApoE2 变异的携带者出生时就拥有更低的胆固醇水平,这些携带者和其他正常ApoE 基因的携带者不会有系统性的差异,因此ApoE 基因到胆固醇水平的因果关系上应该不存在混杂因素。

类比到传统的随机对照分组试验中,不同基因的携带者即对应着被随机分配到不同处理中的受试者。如果低胆固醇水平是癌症风险增高的直接原因,那么与非癌症对照组相比,癌症病人中 ApoE2 的携带者比例将会更高。反之,癌症病例组和对照组,ApoE 基因分布情况应该大致相同。

ApoE 基因的变异会导致胆固醇浓度降低,因此 ApoE 变异可以作为工具变量,在新英格兰的文章中对应的是ACLY遗传分数。胆固醇浓度即为风险暴露,在本文中对应的点是ACLY抑制效应。癌症即为结局,在本文中对应的点是心血管事件风险(关系可见图3)。

本文设想到有的读者对混杂因素(confounding factors)这个概念可能不太熟悉,想稍微介绍一下。混杂因素同时与暴露和结局有关联,所以通过观察性数据得到的暴露和结局的关系,并非是暴露和结局的单纯关系,还掺杂着混杂因素对两者关系的影响。所以为了揭示暴露和结局的真正关系,必须考虑可能存在的混杂因素。

对应到ACLY的研究中,研究者为了阐明ACLY抑制(暴露)与心血管事件风险(结局)之间的关系,首先分析证明ACLY遗传分数与ACLY抑制(暴露)有很强的关联性,然后应用ACLY遗传分数作为工具变量,得出ACLY遗传评分和心血管事件风险(结局)的关系,从而解答研究问题。

图3:综述上的例子

其中,若遗传变异可以作为工具变量,需要满足以下三个假设:

1. 基因变异( ApoE 变异)与混杂因素(Confounding Factors)不相关。

2. 基因变异( ApoE 变异)与暴露(低胆固醇水平)直接的关联可靠。

3. 基因变异( ApoE 变异)只通过暴露(低胆固醇水平)这条途径影响结局(癌症),没有其他的通路,或者其他中介者使基因变异的效应作用于结局。

第一条和第三条假设其实是无法用统计学的方法完全证实的,因为有的混杂因素是无法观察得到的。好在孟德尔随机分析是建立在基因在减数分裂时随机分配到下一代个体的假设上,因此基因的效应较少受到混杂的影响。

第三条假设也应该建立在对于整个体系生物学背景的理解下,需要一些临床经验。第一条和第三条涉及到孟德尔随机化研究的一个局限性,就是作为工具变量的基因变异的作用可能存在多向性(pleiotropy),即基因变异通过其他除暴露之外的途径作用于结局。

那收集的基因变异和结局的观察性数据显示的两者联系,将不单纯是基因通过暴露作用于结局的关系。多向性很难完全检测到,但统计上有方法可以帮助检测。有文章提到过,可以检查基因变异与暴露和结局的回归模型中的残差(residual)有无相关性,若有,则提示该基因变异对于暴露和结局的关系可能存在多向性的问题。

而第二条假设是可以通过观察性的数据验证的,两者关联越强越好。若是用全基因组关联分析(GWAS)去寻找可作为工具变量的基因变异,那么理想的显著性水平应设置为5×10-8。工具变量可以是单个变异位点(单核苷酸多态性),也可以是复合多个位点的遗传分数。

在新英格兰的文章中,作者用了9个变异来构建ACLY的遗传分数,单个的变异和LDL水平(即ACLY抑制效应)的关系实际上是不强的,但9个变异构建的ACLY遗传分数却和LDL水平强相关(robustly associated)。在用多个变异来构建遗传分数时也有讲究,通常这些变异之间的关联性是低的,也即是这类文章中常提到的低连锁不平衡(linkage disequilibrium)

在三条假设满足的前提下,若基因变异和暴露的关系、基因暴露和结局的关系呈线性,那则可以通过数学乘除的方法,得到暴露和结局的因果效应(暴露对于结局的效应=工具变量对结局的效应/工具变量对暴露的效应)。

在实际操作中,也可以直接使用两阶段最小二乘法(Two-Stage Least Squares)去估计暴露对于结局的因果效应。这一方法可以通过统计软件Stata实现。这个方法的使用有它的限制条件,有兴趣的朋友可以搜索相关的文献进行了解。(还可以查看医咖会既往发的一篇文章:控制混杂因素,再给你支个大招:工具变量分析

其实孟德尔随机化研究不是完美的。虽然在孟德尔第二定律中不同位点的等位基因是随机遗传给子代的,但这并不适用于所有基因位点。当同一染色体上的两个基因位点位置比较靠近,那么它们一起遗传的几率会增大,也就是连锁不平衡现象。其次,不同人群中的等位基因频率(allele frequency)和疾病流行率(prevalence)可能不一样,因此若研究对象是混杂的人种,那么人群分层(population stratification)会成为孟德尔随机分析的混杂因素。还有一个比较常见的缺陷就是基因的多向性很难完全检测到。

随着时间的推移,孟德尔随机化研究在方法学上有了更多的发展和衍生,Smith在2014年的一篇综述中总结了这些衍生方法,如two sample Mendelian randomization,bidirectional and network Mendelian randomization,Hypothesis-free Mendelian randomization和新英格兰这篇文章应用到的Factorial Mendelian randomization。感兴趣的伙伴,不如从新英格兰的这篇文章入手,去了解孟德尔随机化的基本原理和高阶应用。

参考文献:

1 N Engl J Med 2019; 380:1033-1042.
2 N Engl J Med 2016; 375:2144-2153.
3 PLoS Med. 2008; 5(8):e177.
4 Hum Mol Genet. 2014; 23(R1): R89-98.

(想要及时获得更多内容可关注“医咖会”微信公众号和网站:传播研究进展,探讨临床研究设计与医学统计学方法)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/178197.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Python】重磅!这本30w人都在看的Python数据分析畅销书更新了!

Python 语言极具吸引力。自从 1991 年诞生以来,Python 如今已经成为最受欢迎的解释型编程语言。 【文末送书】今天推荐一本Python领域优质数据分析书籍,这本30w人都在看的书,值得入手。 目录 作译者简介主要变动导读视频购书链接文末送书 pan…

【GUI】-- 13 贪吃蛇小游戏之食物及成绩判断

GUI编程 04 贪吃蛇小游戏 4.4 第四步:食物及成绩判断 首先,添加食物与分数的数据定义: //食物的坐标int foodX;int foodY;Random random new Random();//积分面板数据结构int score;在初始化方法中,添加(画出)食物与分数&…

编译 CUDA加速的 OpenCV-4.8.0 版本

文章目录 前言一、编译环境二、前期准备三、CMake编译四、VS编译OpenCV.sln五、问题 前言 由于项目需要用上CUDA加速的OpenCV,编译时也踩了不少坑,所以这里记录一下。 一、编译环境 我的编译环境是: Win10 RTX4050 CUDA-12.0 CUDNN 8.9.…

Windows、VMware问题集合

Windows、VMware问题集合 一. Windows11安装VMware17提升虚拟机性能1. 桌面右击图标点击属性——>兼容性,找到“以管理员身份运行此程序”勾选,最后点击确定即可。2. 关闭win11的内核隔离功能。 二. VMware虚拟机报错(虚拟化性能计数器需要…

【人工智能入门学习资料福利】

总目录如下(部分截取): 百度网盘链接:https://pan.baidu.com/s/1bfDVG-xcPR3f3nfBJXxqQQ?pwdifu6 提取码: ifu6

【电子通识】USB3.0和USB2.0有什么区别?

版本 USB2.0是2000年4月27日由USB-IF组织提出了USB2.0总线协议规范。 USB3.0是2008年11月17日由USB-IF组织提出了超高速USB3.0规范。 图标对比 USB2.0的标志就是和USB1.1的标志基本上没啥区别,还是以前的那个样子,使用黑色颜色用标识 USB3.0它有一个S…

变态跳台阶,剑指offer

目录 题目: 我们直接看题解吧: 相似题目: 解题方法: 审题目事例提示: 解题思路: 代码实现: 题目地址: 【剑指Offer】9、变态跳台阶 难度:简单 今天刷变态跳台阶&#xf…

不停的挖掘硬盘的最大潜能

从 NAS 上退休的硬盘被用在了监控的存储上了。 随着硬盘使用寿命的接近尾声,感觉就是从高附加值数据到低附加值数据上。监控数据只会保留那么几个月的时间,很多时候都会被覆盖重新写入。 有人问为什么监控数据不保留几年的,那是因为监控数据…

Golang 中的良好代码与糟糕代码

最近,有人要求我详细解释在 Golang 中什么是好的代码和坏的代码。我觉得这个练习非常有趣。实际上,足够有趣以至于我写了一篇关于这个话题的文章。为了说明我的回答,我选择了我在空中交通管理(ATM)领域遇到的一个具体用…

Apache POI简介

三十二、Apache POI 32.1 介绍 Apache POI 是一个处理Miscrosoft Office各种文件格式的开源项目。简单来说就是,我们可以使用POI在Java程序中对Miscrosoft Office各种文件进行读写操作。 一般情况下,POI都是用于操作Excel文件。 Apache POI 的应用场…

【开源】基于JAVA的开放实验室管理系统

项目编号: S 013 ,文末获取源码。 \color{red}{项目编号:S013,文末获取源码。} 项目编号:S013,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、研究内容2.1 实验室类型模块2.2 实验室模块2.3 实…

LeetCode 2304. 网格中的最小路径代价:DP

【LetMeFly】2304.网格中的最小路径代价:DP 力扣题目链接:https://leetcode.cn/problems/minimum-path-cost-in-a-grid/ 给你一个下标从 0 开始的整数矩阵 grid ,矩阵大小为 m x n ,由从 0 到 m * n - 1 的不同整数组成。你可以…

#gStore-weekly | ​gAnswer源码分析:基于通用数据集的NE、RE服务开发

PART1 简 介 目前基于知识图谱的问答模式有两种,一种是基于信息检索的方式,一种是基于语义分析的方式。前者较之于后者,没有真正关心语义,主要是ranker算法,擅于处理简单问题,后者则是从语义的角度将用户…

数环通入选中国信通院《高质量数字化转型技术方案集(2023)》,积极推动企业数字化转型

近日,中国信息通信研究院“铸基计划”发布《高质量数字化转型技术方案集(2023)》,数环通《数字化协同管理解决方案》成功入选。 随着科技的快速发展和市场竞争的日益激烈,数字化转型已成为企业持续发展和提升竞争力的关…

JetLinks设备接入的认识与理解【woodwhales.cn】

为了更好的阅读体验,建议移步至笔者的博客阅读:JetLinks设备接入的认识与理解 1、认识 JetLinks 1.1、官网文档 官网:https://www.jetlinks.cn/ JetLinks 有两个产品:JetLinks-lot和JetLinks-view 官方文档: JetLi…

WPF树形控件TreeView使用介绍

WPF 中的 TreeView 控件用于显示层次结构数据。它是由可展开和可折叠的 TreeViewItem 节点组成的&#xff0c;这些节点可以无限嵌套以表示数据的层次。 TreeView 基本用法 例如实现下图的效果&#xff1a; xaml代码如下&#xff1a; <Window x:Class"TreeView01.Mai…

优秀智慧园区案例 - 上海世博文化公园智慧园区,先进智慧园区建设方案经验

一、项目背景 世博文化公园是上海的绿色新地标&#xff0c;是生态自然永续、文化融合创新、市民欢聚共享的大公园。作为世博地区的城市更新项目&#xff0c;世博文化公园的建设关乎上海城市风貌、上海文化展示、城市生态环境、市民游客体验、上海服务品牌等&#xff0c;被赋予…

防火墙部署模式 -- 镜像流量(旁路模式)

镜像流量&#xff08;旁路模式&#xff09; 如图&#xff0c;与单臂路由模式不同&#xff0c;旁路模式中&#xff0c;PC的流量不会流经防火墙&#xff0c;就算防火墙宕机也不会影他们之间的数据传输。 镜像的原理是交换机把被镜像端口的流量复制一份&#xff0c;发到监听端口&…

打不开clickonce问题解决过程

1.用户电脑user文件夹下有xx和xx.1两个账户,原先安装在xx账户下,后修了电脑原数据保留在xx.1,新创建XX,之后clickonce就打不开了表现为没有反应,,删除注册表和appdata都只能正常安装,但是不能打开,没有任何报错,发现在我的电脑下打开有这样的提示,,在用户电脑上没有 尝试通过修…

了解CCC认证流程,确保产品合规通过

CCC认证是指中国强制性产品认证制度&#xff0c;也是中国国家质量监督检验检疫总局实施的一项重要认证制度。对于想要在中国市场销售的产品来说&#xff0c;CCC认证是必不可少的步骤。本文将详细介绍CCC认证的流程&#xff0c;帮助您了解并确保产品顺利通过认证。 第一步&#…