直击三大实体瘤!上海交大团队发布深度学习系统,提高癌症生存预测准确性

世界卫生组织 2022 年发布的报告指出,癌症等非传染性疾病 (NCDs)) 已超过传染病,成为「全球头号杀手」。 中国国家癌症中心发布的最新数据显示,2022 年中国约有 482.47 万新发癌症病例和 257.42 万新发癌症死亡病例。

很长一段时间里,人们「闻癌色变」,但其实癌症作为一种慢性病,1/3 是可以预防的,1/3 是可以通过早发现、早诊断、早治疗达到治愈的,1/3 不可治愈,但通过适当治疗可以控制、获得较好的生活质量并延长生存期。其中,预防主要是通过提高自身免疫力、定期体检等途径,关注个人健康。而在确诊癌症后,预后分析十分重要。

癌症预后是指预测癌症患者的可能病程和结局,预后分析有助于提高癌症患者的生存机会。 过去,研究人员基于空间转录组学 (ST) 技术,从空间基因表达的角度对肿瘤微环境 (TME) 进行表征,从而区分癌症患者的不同预后亚组。然而,ST 的高昂成本和长实验周期阻碍了其应用于大规模癌症患者队列进行生存预测。与之相比,组织学图像具有成本效益,在临床环境中易于获取,并且能够提供有关肿瘤形态的丰富信息,是分子水平 TME 分析的更好替代品,可实现更精确的癌症预后。

近日,上海国家应用数学中心(上海交通大学分中心)俞章盛课题组(生命科学技术学院/医学院临床研究中心),王宇光课题组(自然科学研究院/数学科学学院)与合作者在 Cell Reports Medicine 发表了题为「Harnessing TME depicted by histological images to improve cancer prognosis through a deep learning system」的论文。该研究开发了一个深度学习系统,可以通过组织病理学图像,为没有空间转录组数据的癌症患者预测肿瘤微环境信息,从而实现精确的癌症预后。

研究亮点:

  • 通过组织病理学图像为没有 ST 数据的癌症患者预测 TME 信息

  • 以 IGI-DL 为特征的 TME 提高了癌症生存预测的准确性

  • 大幅拓展了基因空间表达信息在大型生物医学病理图像公共数据库的使用

论文地址:
https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(24)00205-2

关注公众号,后台回复「肿瘤微环境」获取完整 PDF

数据集:评估 3 种实体瘤类型组织样本

本研究为了评估模型在结直肠癌 (CRC)、乳腺癌和皮肤鳞状细胞癌 (cSCC) 这三种不同实体瘤类型组织样本上的性能,使用了 3 种不同的数据集。

对于结直肠癌, 研究人员使用了来自上海交通大学医学院附属瑞金医院 10 名 CRC 患者的 10 个 ST 数据集的 41,492 个点,这些数据集由 10× Visium 测序,作为留一患者 (leave-one-patient-out) 验证集,如下表所示。

内部 CRC 数据集的临床特征

对于乳腺癌, 研究人员使用了来自 27 名患者的 92 个组织样本的 34,678 个点,这些样本通过传统的 ST 技术进行了测序,作为留一患者验证集,如下表所示。

乳腺癌空间转录组数据集汇总

对于皮肤鳞状细胞癌, 研究人员使用了来自 4 名患者的 12 个组织样本的 4,353个 点,这些样本通过传统的 ST 技术进行了测序,作为留一患者验证集,如下表所示。

cSCC 空间转录组数据集汇总

模型架构:新型深度学习系统改善癌症预后

在本研究中,研究人员开发了一个深度学习系统,可以利用组织学图像描绘的 TME 改善癌症预后。

该深度学习系统包含两部分

该系统包含两个部分:

第一部分(上图中 Connection 1)是基于 integrated graph 和图深度学习的模型 (integrated graph and image deep learning, IGI-DL),该模型采用卷积神经网络和图神经网络将 H&E 染色组织学图像 (histological images) 投射到基因表达空间 (gene expression space)。

第二部分(上图中 Connection 2),研究人员在癌症基因组图谱 (TCGA) 数据集中的结直肠癌队列和乳腺癌队列中,使用 super-patch graph 和 IGI-DL 预测的空间基因表达 (spatial gene expression) 作为节点特征 (node features),进行了预后预测,然后在外部测试集 MCO-CRC (Molecular and Cellular Oncology colorectal cancer) 中进行了验证。

深度学习系统的工作流程

具体而言,该系统的构建包括 3 个步骤:H&E 染色组织学图像预处理、空间基因表达预测模型和基于预测的空间基因表达 super-patch graph 生存模型。

*H&E 染色组织学图像 (H&E-stained histological image) 预处理:

首先根据每个点的坐标,将每个 H&E 染色的组织学图像分割成多个非重叠的 200×200 像素的 patches,分辨率为 0.5 μm/pixel;

*空间基因表达预测模型:

对于每个patch,研究人员建立了一个 Nuclei-Graph,其中由 Hover-Net24 分割的每个细胞核表示为一个节点 (node),并且每个细胞核对之间的距离决定了是否存在边缘 (edge) 连接。根据上图 C 所示的架构,研究人员使用 IGI-DL 模型来预测组织学图像中每个点的目标基因表达。

*基于预测的空间基因表达的 super-patch graph 生存模型: 为了进一步基于由空间基因表达勾画的 TME 进行预后预测,研究人员从每个患有癌症的患者的 H&E 染色全切片成像 (whole-slide imaging, WSI) 中构建了一个 super-patch graph,然后利用构建的 super-patch graph 和临床特征作为输入,构建了基于图的生存预测模型。

研究结果:IGI-DL 模型综合表现出色

总体来看,本研究构建的 IGI-DL 模型集成了卷积神经网络和图神经网络的优势,充分利用组织病理学图像中的像素强度和结构特征,实现更准确的基因空间表达水平预测。模型在结直肠癌、乳腺癌和皮肤鳞状细胞癌这 3 种类型实体瘤中均表现出色,与 5 种现有方法相比平均相关系数提升了 0.171。

IGI-DL在CRC中空间基因表达的预测性能和可视化

对于结直肠癌,研究人员将 IGI-DL 预测的 179 个基因的 Pearson 相关性与 5 个 SOTA 模型进行比较,IGI-DL 在 10 名保留患者中实现了 0.343 的平均 Pearson 相关性,明显优于其他模型,平均增加了 0.233, 如上图所示。

IGI-DL在乳腺癌中空间基因表达的预测性能和可视化

对于乳腺癌,研究人员将 IGI-DL 预测的 187 个基因的 Pearson 相关性与之前的模型进行比较,IGI-DL 在 27 名保留患者中实现了 0.231 的平均相关性。如上图所示,IGI-DL 模型优于所有 SOTA 模型,平均提高了 0.142。

IGI-DL在cSCC中空间基因表达的预测性能和可视化

对于皮肤鳞状细胞癌,研究人员将 IGI-DL 预测的 487 个基因的 Pearson 相关性与之前的模型进行了比较,IGI-DL 在 4 名保留患者中实现了 0.198 的平均相关性,在所有模型中具有最好的性能,比其他 SOTA 模型的平均性能提高了 0.131, 如上图所示。

在跨平台和跨癌种性能方面,如上述实验,对于不同癌症类型的内部验证和外部测试集,最佳的 SOTA 模型并不固定,但 IGI-DL 模型的性能始终优于其他模型,平均改进幅度为 0.171,展现出良好的跨平台泛化能力。

更进一步,研究人员还调查了 IGI-DL 的跨癌种预测性能,其在结直肠癌上训练的模型在皮肤鳞状细胞癌的内部验证和外部测试集上表现良好,平均相关性分别为 0.204 和 0.143。然而,大多数跨癌种预测性能较训练和测试单一癌症类型时要低。这一结果表明,肿瘤区域的空间基因表达具有一定的癌症特异性,跨癌种预测存在固有的困难。

TCGA 乳腺癌和结肠癌不同生存模型的预测性能

针对预后预测性能,在癌症基因组图谱乳腺癌 (TCGA-BRCA) 队列中,基于以空间基因表达为节点特征的 super-patch graph 生存模型在 5 倍交叉验证中可以达到 0.747 的平均一致性指数 (C-index);在癌症基因组图谱结直肠癌 (TCGA-CRC) 队列中,该生存模型在 5 倍交叉验证 C-index 为 0.725,优于其它预后模型,如上图所示。

该生存预后模型对于早期患者 (I 期和 II 期) 的预后预测同样保持精度优势,预测得到的风险评分可以作为所有阶段患者和早期患者的独立预后指标。在包含一千多名患者数据的外部测试集 MCO-CRC 中,生存预后模型保持稳定的优势,具有泛化能力。

乳腺癌与胰腺癌先行:借力 AI 改善预后

在癌症的诊疗过程中,癌症预后分析可以有效避免过度治疗及医疗资源的浪费,为医务人员及家属进行医疗决策提供科学依据,已成为近年癌症研究的热门方向。

为了改善乳腺癌预后,2020 年,Salesforce 公司研究人员与南加州大学 Lawrence J. Ellison 研究所的临床医生合作,推出了机器学习系统 ReceptorNet, 其算法可以通过低成本且易获取的组织图像来预测激素受体的状态——这是临床医生在为乳腺癌患者决定合适的治疗路径时的一个重要的生物标记。该系统的准确率达到了 92%。

2024 年 2 月,来自美国肯塔基大学、澳门科技大学、澳门大学、广州医科大学第一附属医院的研究人员采用神经网络模型,建立了一个精准的预后评分系统——MIRS (metastasis and immunogenomic risk score), 用于肿瘤转移与免疫基因组风险评分,提供了一项几乎普遍适用于乳腺癌患者的预测工具,为乳腺癌人群的治疗选择提供了新方向。(点击查看详细报道:剑指全球第一大癌症,中国学者建立乳腺癌预后评分系统 MIRS)

此外,胰腺癌作为消化道常见的恶性肿瘤之一,确诊后的五年生存率不超过 10%。提高患者生存率的一个关键环节是准确预测患者的预后风险,以便设计针对性的治疗方案。组织病理是肿瘤科的常规检查,可在微观层面解析肿瘤特性,是评估肿瘤进展风险的重要方法。但由于切片尺寸极大、组织成分复杂,评估结果容易受主观因素影响。

2023 年,来自南京信息工程大学、人工智能学院智慧医疗研究院的研究团队,发布了题为「基于多任务和注意力的胰腺癌全切片图像多组织分割模型」 的研究论文, 研究了胰腺癌病理切片 8 种类别的组织分割,通过引入注意力机制并设计分层共享的多任务结构,利用相关辅助任务显著提升模型性能。

该研究提出的模型在上海长海医院的数据集上进行训练与测试,并在 TCGA 公开数据集上进行外部验证,在内部测试集上 F1 分数均高于 0.97,在外部验证集上 F1 分数均高于 0.92,且泛化性能显著优于基线方法。

值得强调的是,AI 并不能替代病理学专家,而是作为一种辅助诊断技术,为病理诊断带来更多便利,进一步提高病理医师工作效率。从长远趋势来看,AI 在数字化生物标志物检测、医疗图像分析、病程预测等方面,还有较大的发展空间。

参考资料:
1.https://news.un.org/zh/story/2018/09/1017602
2.https://mp.weixin.qq.com/s/VE68FKL6kwpO1IFsbR-LVA
3.https://ins.sjtu.edu.cn/articles/286
4.https://www.cdstm.cn/theme/khsj/khz

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/637229.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ASP.Net MVC在控制台添加视图时没有模型类并且不能添加视图

情况如下: 解决方法: 1.查看vs能否创建asp.net mvc项目,这种情况一般是更换了vs打开老项目 2.点击跳转至修改安装选项界面 3.选择安装项即可 如果以上都有: 看看你的视图文件是否存在在项目中 也不能点击添加,如果…

免费,Python蓝桥杯等级考试真题--第9级(含答案解析和代码)

Python蓝桥杯等级考试真题–第9级 一、 选择题 答案:C 解析:最外层for循环控制行数,range(0,7)可以输出7行,故答案为C。 答案:A 解析:第一层for循环可以产生5行,第二层…

AI办公自动化-kimi批量在多个Excel工作表中绘制柱状图

工作任务和目标:批量在多个Excel工作表中生成一个柱状图 第一步,在kimi中输入如下提示词: 你是一个Python编程专家,完成下面任务的Python脚本: 打开文件夹:F:\aivideo 读取里面所有的xlsx文件&#xff1…

C++ RPC ORM 高速解析

支持所有常用编程语 https://capnproto.org/GitHub - capnproto/capnproto: Capn Proto serialization/RPC system - core tools and C library https://capnproto.org/capnproto-c-win32-1.0.2.zip 常用命令: capnp help capnp compile -oc myschema.capn…

vue3的核心API功能:computed()API使用

常规使用方法: 这样是常规使用方法. 另一种使用方法: 这样分别定义computed的get回调函数和set回调函数, 上面例子定义了plusOne.value的值为1, 那么这时候就走了computed的set回调函数,而没有走get回调函数. 当我们打印plusOne.value的值的时候,走的是get的回调函数而不是…

如何将手机中的音乐转移到 SD 卡上?轻松传输音乐

概括 如何将音乐从手机转移到 SD 卡?我们的智能手机可以充当个人点唱机,因此有效管理我们的音乐库变得至关重要。无论您是存储空间不足还是只是想整理您的音乐收藏,将音乐从手机传输到 SD 卡都是一个实用的解决方案。 在本指南中&#xff0…

vue项目报错:internal/modules/cjs/loader.js:892 throw err;

前言: vue项目中无法正常使用git,并报错情况。 报错信息: internal/modules/cjs/loader.js:892throw err;^ Error: Cannot find module D:\project\sd_wh_yth_front\node_modules\yorkie\src\runner.js 报错处理: npm install y…

男士内裤哪个品牌舒服平价?2024高人气男士内裤推荐

在男士内裤市场中,品牌众多,各具特色。面对眼花缭乱的选择,你是否曾感到无从下手?是否曾对价格差异巨大的内裤感到困惑,好奇它们究竟有何区别?今天,就让我们一起走进男士内裤的各种相关知识&…

力扣算法之626. 换座位

仅作为个人解题记录 力扣传送门 题目概要 这个题目要求比较明确 1.要求调换前后两个id的值 2.如果最后一个id或者同学是第奇数个的时候,他就不需要交互 我的解 /* Write your T-SQL query statement below */ SELECT a.id,(CASE WHEN a.id(select count(1) from…

ABAP Json解析案例

ABAP解析返回的JSON 案例 DATA:LTOKEN TYPE STRING.DATA: LL_LINES(10),"行数LL_TABIX(10),"循环标号LL_PECNT TYPE P LENGTH 6 DECIMALS 2, "百分比LL_PECET(6),"百分数LL_TEXT(40)."消息CLEAR: LL_LINES,LL_TABIX,LL_PECNT,LL_PECET,LL_TEXT.* …

Java语言-面向对象程序设计-自定义Date类

在Java中,不建议直接自定义Date类,因为java.util.Date和java.util.Calendar类已经提供了处理日期和时间的基本功能,可以使用SimpleDateFormat类格式化日期(较常用的方式)等。 这里将自定义封装一个Date类,用…

【Java】/*类和对象(上)*/

目录 一、什么是类、什么是对象 二、为什么要学习类和对象 三、初识面向过程和面向对象编程 四、如何定义类 4.1 语法形式 4.2 定义示例 示例一:定义一个描述学生的类 示例二:定义一个描述冰箱的类 示例二:定义一个描述狗的类 4.3…

【HUST】信道编码|基于LDPC码的物理层安全编码方案概述

本文对方案的总结是靠 Kimi 阅读相关论文后生成的,我只看了标题和摘要感觉确实是这么回事,并没有阅读原文。 行文逻辑:是我自己设定的,但我并不是这个研究领域的,所以如果章节划分时有问题,期待指出&#x…

java版Spring Cloud+Mybatis+Oauth2+分布式+微服务+实现工程管理系统

鸿鹄工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离构建工程项目管理系统 1. 项目背景 一、随着公司的快速发展,企业人员和经营规模不断壮大。为了提高工程管理效率、减轻劳动强度、提高信息处理速度和准确性,公司对内部工程管…

机器学习补充学习

1、Adaboost算法 Adaboost算法是一种集成学习方法,通过结合多个弱学习器来构建一个强大的预测模型。核心思想:如果一个简单的分类器在训练数据上犯错误,那么它在测试数据上也可能犯错误。 Adaboost通过迭代地训练一系列的分类器&#xff0c…

哪款电脑桌面日历记事本软件好用?推荐优秀的电脑日历记事本

对于众多上班族而言,每天在电脑前忙碌已成为生活常态。若想提升工作效率,简化繁琐的工作流程,选择一款出色的电脑桌面日历与记事本软件就显得至关重要。 然而,在Windows操作系统上设定提醒显得相当繁琐,而系统自带的记…

【Linux】fork和exec中的信号继承探索

fork和exec中的信号继承探索 一、结论二、代码验证2.1 代码编写2.2 代码执行 三、linux源码验证四、APUE中的验证五、其他 一、结论 fork时子进程会继承父进程的信号处理方式,包括父进程设置信号为SIG_DFL或SIG_IGN或捕获后设置自定义处理函数。exce时子进程会继承…

计算机系统的层次结构

操作系统的定义 操作系统(Operating System, OS)是指控制和管理整个计算机系统的硬件和软件资源,并合理地组织调度计算机的工作和资源的分配;以提供给用户和其他软件方便的接口和环境;它是计算机系统中最基…

【Oracle篇】rman工具实用指南:常用命令详解与实践(第二篇,总共八篇)

💫《博主介绍》:✨又是一天没白过,我是奈斯,DBA一名✨ 💫《擅长领域》:✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux,也在扩展大数据方向的知识面✌️…

亚马逊SFP有何优势?跨境卖家又该如何申请?

一、亚马逊SFP概述 亚马逊SFP(Seller Fulfilled Prime)是亚马逊为卖家提供的一项物流计划,旨在让满足条件的卖家能够将其产品纳入Prime服务,获得Prime标识,并直接面向Prime会员市场。通过SFP,卖家可以获得亚马逊的流量倾斜&#…