7+共病思路。WGCNA+多机器学习+实验简单验证,易操作


今天给同学们分享一篇共病+WGCNA+多机器学习+实验的生信文章“Shared diagnostic genes and potential mechanism between PCOS and recurrent implantation failure revealed by integrated transcriptomic analysis and machine learning”,这篇文章于2023年5月16日发表在Front Immunol期刊上,影响因子为7.3。

8bda768a2270fc6d7f5c83fcb6c6c6ae.jpeg

多囊卵巢综合征(PCOS)是一种复杂的内分泌代谢紊乱疾病,影响着5-10%的生育年龄妇女。PCOS患者的子宫内膜存在改变的免疫细胞,导致慢性低度炎症,这是反复植入失败(RIF)的原因之一。

5c4660147c13eac0e3bb660b2f08bd4e.jpeg

图1 整个设计的流程图


1. GEO信息

根据作者的纳入标准,共选择了四个数据集进行发现性分析:GSE10946、GSE34526、GSE103465和GSE111974。其中,GSE10946和GSE34526被用作PCOS的发现队列,而GSE103465和GSE111974被视为RIF的发现队列。此外,GSE80432和GSE26787分别是PCOS和RIF的验证队列。在本研究中,作者简称这两个疾病组为PCOS和RIF。


2. 差异基因的鉴定

在进行生物信息分析之前,作者测试了收集的数据集的批次效应,并发现两种疾病的批次效应明显(图2A,E)。使用“sva”软件包,作者去除了PCOS(图2B)和RIF组(图2F)的批次效应,以获得可靠的分析结果。然后使用LIMMA软件包对两组之间的差异表达基因(DEGs)进行表征。对于PCOS,获得了201个DEGs(P<0.05,|log2 FC|>0.585),其中101个上调基因和100个下调基因。对于RIF,有253个DEGs(adj. P<0.05,|log2 FC|>1),其中167个上调基因和86个下调基因。火山图显示了PCOS(图2C)和RIF(图2G)组的所有DEGs。总体而言,通过热图(图2D,H)可视化了这两组中包含的DEGs。与PCOS和RIF相关的DEGs可能在它们的发生和发展中起到一定作用。

34593971d39cdd0ad7eb39cfc29ad9dc.jpeg

图2 去除批次效应并在PCOS和RIF中识别差异表达基因(DEGs)


3.&nbsp;通过WGCNA筛选关键模块

为了调查疾病和关键基因是否相关,作者除了分析两组之间的差异表达外,还进行了WGCNA。使用软阈值方法,本研究构建了一个共表达网络。这个参数β对于共表达网络保持无标度拓扑结构至关重要。基于基因表达数据的生物网络很可能是无标度的。因此,在PCOS组中,拟合指数大于0.85被认为是无标度拓扑结构,β被设定为9(图3A)。通过使用邻接函数,生成了邻接矩阵。如图3B所示,使用TOM差异度量构建了层次聚类。作者总共确定了20个共表达模块。P<0.05的模块被视为关键模块。如图3C所示,antiquewhite4模块具有最强的正相关性,其中包含180个基因。同样,WGCNA也应用于RIF组,β=10是软功率的最佳值(图3D)。作者总共确定了19个模块,其中深灰色、深绿色和皇家蓝显示出强烈的正相关性,而绿黄色、鲑鱼色、深青色和浅黄色模块显示出强烈的负相关性(图3E,F)。在RIF组的这7个关键模块中的基因中,作者进一步选择了334个具有|MM| > 0.8和|GS| > 0.5的基因。这些来自两组关键模块的基因可能被用作候选的细胞特异性标记物。

c59fb1f89008b7e98bbf1b346ab9340d.jpeg

图3 加权基因共表达网络分析(WGCNA)在多囊卵巢综合征(PCOS)和反复植入失败(RIF)中的应用


4.&nbsp;共享基因的分析和功能富集

为了探索多囊卵巢综合征(PCOS)和反复流产(RIF)的共同发病机制,作者分别取上述差异表达基因(DEGs)和WGCNA筛选的基因的交集。图4A显示了PCOS和RIF的DEGs之间的交集,共有11个基因(CHST11,FAM150B,GLIPR1,SLC16A6,MAMLD1,SLC46A2,ENPP3,HAPLN1,PLCXD3,FAM110C,GAS1)。WGCNA分析的基因中只有一个与之交集(CCND2,图4B)。作者推测这12个基因可能与PCOS和RIF的发病机制有关,并且存在共同关系(图4C)。通过对这些基因进行功能注释和富集分析(图4D,E),作者试图研究PCOS和RIF之间的潜在生物学变化。共享基因的GO分析显示它们在早期胚胎器官形态发生相关通路中过度表达。值得注意的是,在所有富集的GO术语中,作者注意到有几个显著富集的生物过程通路,例如调节T细胞凋亡过程、肥大细胞激活和白细胞稳态,这表明免疫细胞的激活和凋亡可能对PCOS和RIF的共同发病机制有着重要贡献。此外,KEGG富集结果与GO分析一致。另外,作者还注意到几个与卵泡发育相关的通路富集,例如p53信号通路、FOXO信号通路、Hippo信号通路和PI3K-Akt信号通路。

3aa172ac351fe793b3e31357870369d9.jpeg

图4 PCOS和RIF之间的共享基因签名和功能富集


5.&nbsp;基于机器学习算法,识别潜在的共享诊断基因

为了进一步选择具有显著特征值以区分疾病组和对照组的最佳诊断基因靶点,作者基于上述12个共享基因应用了三种不同的算法(LASSO、SVM-RFE和随机森林)。在PCOS组中,根据LASSO系数曲线和最佳调参选择图,将λ设定为0.06851194(PCOS)(图5A)。随后,找到了8个具有非零系数的基因。然后,作者将上述12个基因输入RF分类器,并在重要性尺度上显示了前10个基因。作者选择了0.9作为重要性筛选阈值,并确定了一组包含9个基因的集合(图5B)。此外,SVM算法确定了5个具有最低5点交叉验证误差和最佳5点交叉验证准确性的基因(图5C)。通过将这三种算法重叠,作者确定了5个共享生物标志物(CHST11、GLIPR1、SLC16A6、MAMLD1、HAPLN1、GAS1)用于PCOS组(图5D,I)。

d5089877567c185dfa97742d4593f29b.jpeg

图5 使用三种机器学习算法筛选候选的PCOS和RIF诊断基因


同样地,当使用LASSO算法将λ设置为0.03001025时,作者得到了7个特征基因,用于RIF组(图5E)。图5F显示了重要性排名前10的基因,作者选择了9个基因(重要性>0.9)作为RM结果。接下来,使用SVM-REF算法确定了10个中心基因子集(图5G)。然后,通过三种算法获得的7个共同基因标志物重叠(图5H,I)。


6.&nbsp;诊断中心生物标志物的诊断价值和验证

为了更准确地了解多囊卵巢综合征(PCOS)和反复植入失败(RIF)之间的关系,作者对PCOS和RIF群体的机器学习结果进行了交集分析,并得到了2个共享的诊断基因,GLIPR1和MAMLD1(图6A)。通过分析这两个基因的表达模式,评估了共享诊断基因的预测和鉴别能力。此外,还进行了受试者工作特征曲线(ROC曲线)的分析。


be3c049f3da19199da9c70c6a46dc43b.jpeg

图6 选择和验证两个共享的诊断基因


首先,作者分析了两个发现队列中PCOS和RIF的表达水平。图6B显示GLIRP1在RIF组中较低(P<0.01),在PCOS组中较高(P<0.01)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.0001)中均表达较低(图6F)。


接下来,为了测试这两个目标基因在两种疾病诊断中的特异性和敏感性,作者进行了ROC分析。在多囊卵巢综合征生物标志物方面,这两个基因的结果是有利的:GLIPR1(AUC=0.812)和MAMLD1(AUC=0.774)。RIF组也经过了相同的ROC分析。每个生物标志物的预测性能都很强:GLIPR1(AUC=0.723)和MAMLD1(AUC=0.879)(图6C,G)。


此外,作者通过进行外部验证,确认了GLIPR1和MAMLD1作为多囊卵巢综合征(PCOS)和反复流产(RIF)的核心诊断基因的可靠性。在两个验证组中,这两个关键基因的表达水平与发现组相匹配。GLIPR1在RIF组中降低(P<0.05),在PCOS组中增加(P<0.05)(图6D)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.05)中均减少(图6H)。图6E显示,GLIPR1在PCOS验证队列中具有出色的诊断准确性(AUC=1.000),在RIF验证队列中也具有良好的诊断准确性(AUC=0.920)。同样,MAMLD1也能正确诊断PCOS(AUC=1.000)和RIF(AUC=0.840)(图6I)。因此,结果证实了它们作为PCOS和RIF的关键鉴别分子的能力。


7.&nbsp;诊断基因的单基因GSEA

随后,作者分别在PCOS和RIF数据集中使用单基因GSEA分析了这两个生物标志物,并使用“GSEA”软件包可视化了前5个上调和下调的通路。图7显示,在这两个疾病组中,这两个基因都参与了代谢通路,如甘氨酸、丝氨酸、苏氨酸代谢、α-亚麻酸代谢和丙酸代谢。此外,这两个基因还富集在与炎症相关的通路中,将PCOS和RIF联系在一起。

0f849bf9717aaa2702bff265a8e3db5b.jpeg

图7 单个诊断基因的GSEA(A,B)


8. 免疫浸润分析

考虑到多囊卵巢综合征(PCOS)和反复植入失败(RIF)都具有高免疫反应的特点。作者使用CIBERSORT分析了不同组别中免疫细胞的丰度。在每个组别中,22种免疫细胞的比例以条形图的形式展示。总体而言,条形图清楚地显示了PCOS(图8A)和RIF(图8E)之间T细胞、巨噬细胞和NK细胞群体百分比之间的显著差异。与对照样本相比,PCOS样本中的活化树突状细胞增加了(图8B)。而在RIF样本中,休息的NK细胞、巨噬细胞M0增加,γδT细胞和活化树突状细胞减少(图8F)。

dfa68f74191f7a56ddbdf87c06e335f3.jpeg

图8 PCOS和RIF免疫细胞组成


9.&nbsp;在人体组织中通过RT-PCR验证GLIPRand MAMLD的有效性

对正常女性和多囊卵巢综合征(PCOS)患者的卵泡液颗粒细胞以及健康和反复流产(RIF)女性的子宫内膜组织进行了RT-PCR检测。这证实了两个诊断生物标志物GLIPR1和MAMLD1的基因表达水平。与数据分析一致,作者的结果显示,PCOS患者的颗粒细胞中GLIPR1的表达上调,而MAMLD1的表达下调(图9A),而RIF患者的子宫内膜组织中GLIPR1和MAMLD1的表达均减少(图9B)。

5bfa9998aa7eadffed9bc417771e985a.jpeg

图9 在人体组织中验证RT-PCR


总结

总之,诊断生物标志物GLIPR1和MAMLD1被确定为关键生物标志物,负责调节由TCA循环代谢物失衡引起的免疫细胞激活。作者的分析加强了PCOS患者反复流产的共病发病理论基础。




本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/111569.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

小程序获取头像和昵称的思路

小程序获取头像和昵称的基本方法是调用小程序自带的API wx.getUserProfile()&#xff0c;这也是小程序官方目前最推荐的做法。成功获取用户名头像之后&#xff0c;小程序允许保存调用的结果&#xff0c;以便下一次打开页面的时候自动显示头像和名字。保存用户名和头像并不是保存…

电子电器架构 —— 车载网关初入门(三)

电子电器架构 —— 车载网关初入门(三) 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 PS:小细节,本文字数5000+,详细描述了网关在车载框架中的具体性能设置。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 没有人关注你。也无需有人关…

Flask Shell 操作 SQLite

一、前言 这段时间在玩Flask Web&#xff0c;发现用Flask Shell去操作SQLite还是比较方便的。今天简单地介绍一下。 二、SQLite SQLite是一种嵌入式数据库&#xff0c;它的数据库就是一个文件&#xff0c;处理速度快&#xff0c;经常被集成在各种应用程序中&#xff0c;在IO…

【精】UML及软件管理工具汇总

目录 1 老七工具&#xff08;规划质量&#xff09; 1.1 因果图&#xff08;鱼骨图、石川图&#xff09; 1.2 控制图 1.3 流程图:也称过程图 1.4 核查表:又称计数表 1.5 直方图 1.6 帕累托图 1.7 散点图&#xf…

Java设计模式之状态模式

定义 对有状态的对象&#xff0c;把复杂的“判断逻辑”提取到不同的状态对象中&#xff0c;允许状态对象在其内部状态发生改变时改变其行为。 结构 状态模式包含以下主要角色。 环境角色&#xff1a;也称为上下文&#xff0c;它定义了客户程序需要的接口&#xff0c;维护一个…

java如何获取调用接口的ip?

获取调用者的ip 场景&#xff1a;想知道哪个ip访问的某个接口时&#xff0c;就需要打印出来看看&#xff0c;这时就可以使用这个方法了。 案例&#xff1a; //HttpServletRequest 入参加上,请求对象public ForkResponse queryXXX(RequestBody XXXX xxxx, HttpServletRequest …

Zynq-Linux移植学习笔记之64- 国产ZYNQ在linux下配置国产5396芯片

1、背景介绍 复旦微ZYNQ通过SPI配置国产JEM5396&#xff0c;框图如下&#xff1a; 现在需要在linux下的应用程序内配置JEM5396的寄存器。其中FMQL和进口的XILINX ZYNQ类似&#xff0c;JEM5396和进口的BCM5396兼容。因此可以参考进口ZYNQ在linux下配置BCM5396过程。Zynq-Linux移…

驾驶技巧_新手

人人都是老司机 1> 快速起步(手动挡)2> 窄路会车3> 转弯4> 变道 1> 快速起步(手动挡) 【B站】视频讲解 Step 1> 【快 停 慢放】左脚离合&#xff0c;快速抬到半联动点&#xff1b; Step 2> 离合器慢放同时加油&#xff01; 2> 窄路会车 3> 转弯 4&…

C++学习初探---‘C++面向对象‘-继承函数重载与运算符重载

文章目录 前言继承继承是什么&#xff1f;三种访问权限的继承&#xff1a; 函数重载与运算符重载函数重载运算符重载可重载运算符&不可重载运算符 前言 第三次学习记录&#xff0c;依旧是C面向对象的内容。 继承 继承是什么&#xff1f; C中的继承是一种面向对象编程&am…

Kubuntu安装教程

目录 1.介绍 2.安装 3.配置 更新软件 中文输入法 美化 1.介绍 Kubuntu&#xff0c;是众多Ubuntu分支的一种&#xff0c;它采用KDE Plasma桌面为其默认桌面环境。它和Ubuntu采用同样的底层系统和软件库。基本上&#xff0c;Kubuntu和Ubuntu没有太大的差异&#xff0c;只是…

Spring Boot 3系列之一(初始化项目)

近期&#xff0c;JDK 21正式发布&#xff0c;而Spring Boot 3也推出已有一段时间。作为这两大技术领域的新一代标杆&#xff0c;它们带来了许多令人振奋的新功能和改进。尽管已有不少博客和文章对此进行了介绍&#xff0c;但对于我们这些身处一线的开发人员来说&#xff0c;有些…

【Truffle】二、自定义合约测试

一、准备测试 上期我们自己安装部署了truffle&#xff0c;并且体验了测试用例的整个测试流程&#xff0c;实际开发中&#xff0c;我们可以对自己的合约进行测试。 我们首先先明白自定义合约测试需要几个文件 合约文件&#xff1a;既然要测试合约&#xff0c;肯定要有合约的源码…

[EFI]asus strix b760-i 13900F电脑 Hackintosh 黑苹果efi引导文件

硬件型号驱动情况主板 asus strix b760-i 处理器 I9 13900F 已驱动内存crucial ddr5-5200 64gb(32gb*2)(overclock 5600)已驱动硬盘 WD black sn850 500g*2 已驱动显卡rx570已驱动声卡Realtek ALCS1220A已驱动网卡Intel I225-V 2.5 Gigabit Ethernet已驱动无线网卡蓝牙Fevi T91…

通过内网穿透快速搭建公网可访问的Spring Boot接口调试环境

文章目录 前言1. 本地环境搭建1.1 环境参数1.2 搭建springboot服务项目 2. 内网穿透2.1 安装配置cpolar内网穿透2.1.1 windows系统2.1.2 linux系统 2.2 创建隧道映射本地端口2.3 测试公网地址 3. 固定公网地址3.1 保留一个二级子域名3.2 配置二级子域名3.2 测试使用固定公网地址…

Spring Cloud Alibaba 之 Sentinel

系列文章目录 第一章 Java线程池技术应用 第二章 CountDownLatch和Semaphone的应用 第三章 Spring Cloud 简介 第四章 Spring Cloud Netflix 之 Eureka 第五章 Spring Cloud Netflix 之 Ribbon 第六章 Spring Cloud 之 OpenFeign 第七章 Spring Cloud 之 GateWay 第八章 Sprin…

C++学习笔记之四(标准库、标准模板库、vector类)

C 1、C标准库2、C标准模板库2.1、vector2.1.1、vector与array2.1.2、vector与函数对象2.1.3、vector与迭代器2.1.4、vector与算法 1、C标准库 C C C标准库指的是标准程序库( S t a n d a r d Standard Standard L i b a r a y Libaray Libaray)&#xff0c;它定义了十个大类…

x3daudio1 7.dll丢失怎么修复?多种x3daudio1 7.dll修复方法对比

x3daudio1_7.dll是Windows操作系统中的一个动态链接库文件&#xff0c;它主要负责处理音频相关的功能。当这个文件缺失或损坏时&#xff0c;可能会导致一些音频播放问题&#xff0c;如无声、杂音等。那么&#xff0c;x3daudio1_7.dll缺失的原因是什么呢&#xff1f;又该如何修复…

Unity 粒子特效-第五集-烟雾缭绕合并特效

一、特效预览 二、制作原理 1.素材介绍 我们之前几章做了有光球&#xff0c;星星&#xff0c;烟雾 我们把他们结合起来&#xff0c;做一些调整 2.合并方法 我们还是建一个粒子游戏物体 我们把所有的效果取消 再重置一下transform 现在这个物体就是一个可以控制粒子特效的空…

钢琴培训答题服务预约小程序的效果怎样

很多家长都会从小培养孩子的兴趣&#xff0c;钢琴便是其中热度较高的一种&#xff0c;而各城市也不乏线下教育培训机构&#xff0c;除了青少年也有成年人参加培训&#xff0c;市场教育高需求下&#xff0c;需要商家不断拓展客户和转化。 那么通过【雨科】平台制作钢琴培训服务…

【LeetCode力扣】42. 接雨水

目录 1、题目介绍 2、解题思路 2.1、暴力破解法 2.2、双指针法 1、题目介绍 原题链接&#xff1a; 42. 接雨水 - 力扣&#xff08;LeetCode&#xff09; 示例 1&#xff1a; 输入&#xff1a;height [0,1,0,2,1,0,1,3,2,1,2,1]输出&#xff1a;6解释&#xff1a;上面是由…