多组学+机器学习+膀胱癌+分型+建模

图片

这是一个基于多组学+机器学习的分型建模文章,这里我们大概介绍一下,这篇文章做了啥

一、研究背景

1、尿路上皮癌是高度恶性的肿瘤,预后差,死亡率高

2、没有明显有效的治疗方法,多数患者在免疫治疗中无法受益,其原因可能是患者之间异质性

3、基于此,作者使用多组学数据与机器学习方法进行分析,以识别生物标志物,能够有效的改善患者预后,和免疫治疗的效果

过程:TCGA(mRNA+lncRNA+miRNA+甲基化)多组织整合构建分子亚型,并通过差异分析筛选预后相关的32个基因,通过10种机器学习的算法构建预后模型

二、数据准备

TCGA+IMvigor210+GEO(GSE13507,GSE31684,GSE32548,GSE32894,GSE48075,GSE48276)+ E-MTAB-1803的数据集(本文做的是膀胱癌,所以可以以IMvigor210作为训练集,大家在做的时候,需要注意,训练集样本量多)

三、方法和结果展示

分析流程

图片

1、多组学共识MUC预后相关分子亚型的构建

通过合并几套数据集,去批次,通过PCA查看去批次前后的各个数据集之间的分布

图片

通过MOVICS包对mRNA+lncRNA+miRNA+甲基化进行聚类,使用包中的getElites函数筛选出各组学中变化最大的前1500个基因(或突变频率最高的1500个基因),依次为特征,使用包中getMOIC函数中流程化的10种聚类算法: iClusterBayes, moCluster, CIMLR, IntNMF, ConsensusClustering, COCA, NEMO, PINSPlus, SNF和LRA,根据先前的研究指定将患者分为三型,获得每种算法的分型结果后,使用getConsensusMOIC函数整合10种分型的结果并最终生成一种稳健的分型(以下称为CSs)。图A是整合分型在多组学中的分型效果,图B展示了CSs以及10种分型的结果,图C的相关性热图也展示了各亚型内的相似性以及亚型间的不相关性,图D的KM曲线说明基于多组学和多模型构建的分型能够准确对患者预后进行分层。

图片

2、分子亚型之间功能的注释+免疫特征(分子景观)

通过收集一些关键的特征基因集(比如作者收集的与治疗反应相关以及膀胱癌相关的signature),通过ssGSEA的算法对三个亚型进行注释,结果发现CS2可能更倾向于目前公认的管腔样亚型,而CS3可能更倾向于基底样亚型(这个需要一定的背景去判断)。

接着分析了3个亚型在癌症染色质重塑相关的潜在调节因子和23个转录因子之间差异。进一步说明构建的CSs分型与染色质重塑相关

不同分子亚型关于免游已检查点,免疫浸润等等差异

图片

三个亚型之间进行了差异分析,选择了每一个亚型的 top20 个上调的基因作为特征绘制基因表达热图(图D),通过这20个基因作为一个分类器,对验证集分型,并绘制KM曲线(E),通过这20个基因的分类器使用NTP的算法构建计算分类的准确性。

图片

3、机器学习构建预后模型CMLS

基于10种机器学习组合算法对三个队列筛选特征基因构建风险模型(这里选择前面前面使用的各个亚型的top20的基因进行分析,可以在分析之前加入单因素cox分析),筛选出关键基因后,可以选择多因素计算系数建模,当然也可以通过Logistic回归方建模,单因素cox,多因素cox展示关键的预后情况,KM曲线

图片

4、CMLS与其他已经发表的模型做对比

在不同的数据集中比较作者筛选的特征基因构建的模型的c-index

图片

为了进一步说明模型的实用性,作者基于CMLS构建了诺莫图。校准曲线证明(图E),列线图的精度与实际情况相一致。决策曲线分析(DCA)显示,列线图对患者的临床获益明显高于单独使用CMLS(图F, G),且时间依赖的c指数进一步证明了列线图具有更好的预测性能(图H)

图片

5、CMLS 的免疫

TME相关的分析预测免疫评分,并比较高低组之间的差异

图片

ssGSEA分析,预测特征基因集的评分,并比较高低组之间的差异

图片

TMB+TNB(TCIA下载)的比较,巨噬细胞浸润相关性和比较,KM曲线

图片

6、CMLS 对免疫疗法反应预测能力

对IMvigor-210队列,作者评估了治疗 3 个月后患者的长期生存期差异,发现低分组显示出更好的预后效果(图A,B),图C表明在有反应组的CMLS得分低于无反应组。图D是基于TIP算法评估的抗肿瘤免疫7步骤活性在两组间的差异

图片

使用TIDE算法预测了免疫治疗反应(图E),高低CMLS组间有反应和无反应患者的比例,submap算法评估CMLS分组与抗PD1以及CTLA4疗效反应分组的一致性

图片

CMLS在另外三个免疫治疗队列中预测预后效能的评估,同样发现低CMLS的疗效可能更好。

图片

7、筛选潜在的治疗药物

GSEA富集分析发现高CMLS组患者的血管生成、EMT、缺氧等通路被明显激活,CTRP+PRISM(CCLE)计算药物的敏感性

图片

小结:

1、这篇文章使用一种新的聚类的方法构建分子亚型,并纳入和mRNA,miRNA,lncRNA,甲基化数据特征进行聚类,多组学分析,让整个结果更加准确

2、模型验证中纳入了NTP,我们网站之前使用的NTP的算法,基本上是通过两两进行对比,而在这次分析中,使用三种的亚型的敏感性比较,值得借鉴,但是原文筛选特征的基因的方法是使用差异基因做的。后面我们会对NTP的工具进行更新

3、多种机器学习的方法构建风险模型,做了两次模型的比较,第一次是机器学习算法的比较,第二次是与之前研究筛选到的特征基因进行比较,进一步突出作者筛选的特征基因,更具有研究价值

4、模型对于免疫治疗的具有非常好的预测作用

5、模型潜在治疗的药物的筛选

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/575783.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java混淆的重要性

在软件开发领域,安全性与代码保护一直是备受关注的问题。特别是在Java这样的跨平台语言中,保护源代码的机密性和完整性显得尤为重要。Java混淆作为一种代码保护技术,其在现代软件开发中的地位日益凸显。本文将详细探讨Java混淆的重要性&#…

【网络安全】网络安全协议和防火墙

目录 1、网络层的安全协议:IPsec 协议族 (1)IP 安全数据报格式 (2)互联网密钥交换 IKE (Internet Key Exchange) 协议 2、运输层的安全协议:TLS 协议 3、系统安全:防火墙与入侵检测 1、网络…

addr2line + objdump 定位crash问题

目录 背景 godbolt汇编工具 tombstone ARM平台汇编知识 寄存器介绍 常见汇编指令 函数入参及传递返回值过程 入参顺序 变参函数 虚函数表 典型问题分析过程 Crash BackTrace Addr2line objdump 拓展 为什么SetCameraId函数地址偏移是40(0x28) 参考 背景 最近在…

kerberos:介绍

文章目录 一、介绍二、kerberos框架1、名词解释2、框架 三、优缺点四、其他认证机制1、SSL2、OAuth3、LDAP 一、介绍 Kerberos是一种计算机网络授权协议,主要用于在非安全网络环境中对个人通信进行安全的身份认证。这个协议由麻省理工学院(MIT&#xff…

软考-系统分析师-精要1

1、什么是软件需求 软件需求是指用户对系统在功能、行为、性能、设计约束等方面的期望。 软件需求是指用户解决问题或达到目标所需的条件或能力,是系统或系统部件要满足合同、标准、规范或其他正式规定文档所需具有的条件或能力,以及反映这些条件或能力…

Leetcode 118 杨辉三角

目录 一、问题描述二、示例及约束三、代码方法一:数学 四、总结 一、问题描述 给定一个非负整数 numRows,生成「杨辉三角」的前 numRows 行。   在「杨辉三角」中,每个数是它左上方和右上方的数的和。 二、示例及约束 示例 1&#xff1a…

电子防潮柜出厂前要经过哪些测试?

电子防潮柜在发货前应执行一系列质量控制测试以确保其功能正常、性能稳定且能够满足用户存储物品对湿度控制的需求。以下是沐渥电子防潮柜出厂前的测试流程: 1)除湿性能测试:检查并验证防潮柜能否按照设定的湿度目标值准确运行,可…

燃冬之yum、vim和你

了解了很多指令和权限,搞点真枪实弹来瞅瞅 学Linux不是天天就在那掰扯指令玩,也不是就研究那个权限 准备好迎接Linux相关工具的使用了么码农桑~ yum 软件包 什么是软件包呢? 首先来举个生活中常见点的例子:比如我的手机是华为…

盘点数据资产管理十大活动职能 优化企业数据资产管理和应用

在当今的数字化时代,数据已成为企业最宝贵的资产之一,在上篇文章中我们对数据资产管理进行了初步的介绍。 上篇文章指路👉什么是数据资产管理?详谈数据资产管理的难点与发展现状! 有效的数据资产管理不仅能提升企业的…

【JAVA】阿里技术官耗时三个月整理的Java核心知识点

在裁员风波的席卷之下,IT行业弥漫着浓厚的焦虑和不安。面对如此动荡的环境,一个共识日益凸显:提升个人价值至关重要。 这不仅仅是指薪资上的数字增长,更重要的是在职场中、在专业领域、在技术上不断取得突破,并塑造自…

固态继电器:推进可再生能源系统

随着可再生能源系统的发展,太阳能系统日益成为现代能源解决方案的先锋。在这种背景下,固态继电器(SSR),特别是光耦固态继电器的利用变得日益突出。本文旨在深入探讨SSR在可再生能源系统中的多方位应用,重点…

ClickHouse 数据类型、表引擎与TTL

文章目录 数据类型注意事项 表引擎1.TinyLog 引擎2.MergeTree 引擎3.ReplacingMergeTree 引擎4.AggregatingMergeTree 引擎5.SummingMergeTree 引擎6.CollapsingMergeTree 引擎7.Distributed 引擎 TTL列级 TTL表级TTL 数据类型 ClickHouse 数据类型Java 数据类型数据范围UInt8…

基于FaceNet的人脸识别

⚠申明: 未经许可,禁止以任何形式转载,若要引用,请标注链接地址。 全文共计10077字,阅读大概需要10分钟 🌈更多学习内容, 欢迎👏关注👀【文末】我的个人微信公众号&#…

Python二进制文件转换为文本文件

👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 在日常编程中,我们经常会遇到需要将二进制文件转换为文本文件的情况。这可能是因…

最详细的 Windows 下 PyTorch 入门深度学习环境安装与配置 GPU 版 土堆教程

最详细的 Windows 下 PyTorch 入门深度学习环境安装与配置 CPU GPU 版 | 土堆教程 Windows 下 PyTorch 入门深度学习环境安装与配置 GPU 版 教程大纲如何使用此教程快速开始版本 Windows下判断有无NVIDIA GPU安装Anaconda作用流程下载安装 Anaconda 创建虚拟环境利用conda或者…

谁是存储器市场下一个“宠儿”?

AI浪潮对存储器提出了更高要求,高容量、高性能存储产品重要性正不断凸显,存储产业技术与产能之争也因此愈演愈烈:NAND Flash领域,闪存堆叠层数持续提升;DRAM领域HBM持续扩产,技术不断迭代,同时3…

Github上不去?进来,我教你

目录 一、复制Github的服务器地址 二、打开C盘下的hosts配置文件 三、编辑hosts 四、刷新DNS 五、本教程资源来源 一、复制以下Github的各服务器地址 # GitHub520 Host Start 140.82.112.26 alive.github.com 140.82.113.6 api.github.com…

docker-MySQL 8 主从搭建

一.目录结构: 我是在/home目录下,建立个sql文件夹: 二、配置文件 1.mysql配置 mysql-master下.conf文件配置 ###### [mysqld] server-id1 # 启用二进制日志 log-binmaster-bin # 指定需要复制的数据库 binlog-do-dbtest_db # 指定二进制日…

为什么工业锅炉必须要清洗?-智渍洁

锅炉经过长时间运行,不可避免的出现了水垢、锈蚀问题,锅炉形成水垢的主要原因是给水中带有硬度成分,经过高温、高压的不断蒸发浓缩以后,在炉内发生一系列的物理、化学反应,最终在受热面上形成坚硬、致密的水垢。 水垢是…

【EMQX】使用websocket订阅EMQX数据

需求:某平台希望通过 websocket 来订阅 EMQX平台上的某些 Topic数据进行处理 1、EMQX 服务配置 前提是EMQX服务正常安装运行了,如果EMQX服务未安装的话,详见以下文章关于如何安装部署服务: 搭建自己的MQTT服务器、实现设备上云(W…