面向计算病理学的通用基础模型| 文献速递-视觉通用模型与疾病诊断

Title

题目

Towards a general-purpose foundation model for computational pathology

面向计算病理学的通用基础模型

01

文献速递介绍

组织图像的定量评估对于计算病理学(CPath)任务至关重要,需要从全幻灯片图像(WSIs)中客观表征组织病理学实体。WSIs的高分辨率和形态特征的变异性带来了重大挑战,使得为高性能应用程序大规模标注数据变得复杂。为了解决这一挑战,当前的努力提出了使用预训练的图像编码器,通过从自然图像数据集进行迁移学习或在公开可用的组织病理学数据集上进行自监督学习,但尚未在规模上广泛开发和评估不同组织类型。我们介绍了UNI,这是一个通用的自监督病理模型,使用来自超过100,000个诊断性H&E染色WSIs(>77 TB的数据)的超过1亿张图像进行预训练,涵盖了20种主要组织类型。该模型在34个具有不同诊断难度的代表性CPath任务上进行了评估。除了胜过以前的最先进模型外,我们还展示了CPath中的新建模能力,如与分辨率无关的组织分类、使用少样本类原型进行幻灯片分类,以及在OncoTree分类系统中对多达108种癌症类型进行疾病亚型泛化分类。UNI在CPath中推动了规模上的无监督表示学习,无论是在预训练数据还是下游评估方面,都可以实现数据高效的人工智能模型,能够推广和转移至各种诊断性挑战任务和临床工作流程中的解剖病理学。

Results

结果

Pretraining scaling laws in CPath

A pivotal characteristic of foundation models lies in their capability to deliver improved downstream performance on various tasks when trained on larger datasets. Although datasets such as CAMELYON16 (Cancer Metastases in Lymph Nodes Challenge 2016 (ref. 78) and theTCGA nonsmall cell lung carcinoma subset (TCGA-NSCLC)79 are commonly used to benchmark pretrained encoders using weakly supervised multiple instance learning (MIL) algorithms15,37,40,80, they source tissue slides only from a single organ and are often used for predicting binary disease states81, which is not reflective of the broader array of disease entities seen in real-world anatomic pathology practice.

CPath中的预训练规模定律

基础模型的一个关键特征在于它们能够在训练在更大数据集上时提供改进的下游性能,用于各种任务。虽然诸如CAMELYON16(2016年淋巴结转移癌症挑战赛(ref. 78)和TCGA非小细胞肺癌子集(TCGA-NSCLC)79等数据集通常用于使用弱监督多实例学习(MIL)算法15,37,40,80对预训练编码器进行基准测试,但它们仅从单一器官中获取组织幻灯片,通常用于预测二元疾病状态81,这并不能反映出真实世界解剖病理学实践中看到的更广泛的疾病实体。

Figure

图片

ig. 1 | Overview of UNI. UNI is a general-purpose, self-supervised vision encoder for anatomic pathology based on the vision transformer architecture, achieving state-of-the-art performance across 34 clinical tasks in anatomic pathology. *a, Slide distribution of Mass-100K, a large-scale and diverse pretraining dataset of 100 million tissue patches sampled from over 100,000 diagnostic WSIs across 20 major organ types. b, UNI is pretrained on Mass-100K using the DINOv2 self-supervised training algorithm22, which consists of a mask image modelingobjective118 and a self-distillation objective25. c, UNI generally outperforms other pretrained encoders across 34 clinical tasks in anatomical pathology (average performance of the 8 SegPath tasks reported). d**, The evaluation tasks consist of ROI-level classification, segmentation, retrieval and prototyping, and slide-level classification tasks. Further details are given in Methods. class., classification; seg., segmentation; det., detection; assess., assessment.

图1 | UNI概览。UNI是一种通用的自监督视觉编码器,基于视觉Transformer架构,实现了在解剖病理学中34项临床任务中的最新性能。

a,Mass-100K的幻灯片分布,这是一个大规模且多样化的预训练数据集,由来自20种主要器官类型的超过100,000个诊断WSIs中抽样的1亿个组织块组成。b,UNI使用DINOv2自监督训练算法22在Mass-100K上进行预训练,该算法包括一个掩码图像建模目标118和一个自蒸馏目标25。

c,UNI在解剖病理学的34项临床任务中通常优于其他预训练编码器(报告了8项SegPath任务的平均性能)。

d,评估任务包括ROI级别的分类、分割、检索和原型制作,以及幻灯片级别的分类任务。方法中提供了更多详细信息。

class.,分类;seg.,分割;det.,检测;assess.,评估

图片

Fig. 2 | Slide-level tasks for OT-43 and OT-108, and slide-level task performance.a, Organ and OncoTree code distribution for the slide-level OT-43 and OT-108 classification tasks. All comparisons with UNI are evaluated on 43-way cancer type classification and 108-way OncoTree code classification tasks with OT-43 and OT-108, respectively. Further details regarding data distribution are provided in Supplementary Table 4. Gen., genitalia; GI, gastrointestinal. b,d, Comparison of macro-averaged AUROC of UNI and other pretrained encoders for OT-43 (b) and OT-108 (d) (n = 1,620 slides each). c,e, Top-1 accuracy of UNI across different pretraining data scales (Mass-1K, Mass-22K, Mass-100K) for OT-43 (c) and OT-108 (e) (n = 1,620 slides each). f, Supervised performance of UNI and its comparisons across 15 weakly supervised slide-level classification tasks. Dashed lines represent the average performance of each model across all tasks. All data are given as balanced accuracy, except for ISUP grading, which is given as quadratic weighted Cohen’s κ. Error bars represent 95% confidence intervals and the centers correspond to computed values of each metric as specified above. Detailed results for all tasks are provided in Supplementary Tables 12–35. Ext., external test set. g–j, Few-shot slide-level performance with K ∈ {1, 2, 4, 8, 16, 32}

slides per class reported for four tasks. g, RCC subtyping (train, TCGA; test, CPTAC-DHMC; n = 872 slides). h, BRCA fine-grained subtyping (BRACS, n = 87 slides). i, Brain tumor coarse-grained subtyping (EBRAINS, n = 573 slides). j, ISUP grading (PANDA, n = 954 slides). Boxes indicate quartile values of model performance (n = 5 runs), and whiskers extend to data points within 1.5-fold the interquartile range. Few-shot results for all tasks are given in Extended Data Fig. 1.

图2 | OT-43和OT-108的幻灯片级任务及其幻灯片级任务性能。

a,幻灯片级OT-43和OT-108分类任务的器官和OncoTree代码分布。与UNI的所有比较均在OT-43和OT-108的43种癌症类型分类和108种OncoTree代码分类任务上进行评估。有关数据分布的更多详细信息,请参见补充表4。Gen.,生殖器;GI,胃肠道。b、d,UNI和其他预训练编码器的OT-43(b)和OT-108(d)的宏平均AUROC比较(每个均为n=1,620张幻灯片)。

c、e,UNI在不同预训练数据规模(Mass-1K、Mass-22K、Mass-100K)下的OT-43(c)和OT-108(e)的Top-1准确度(每个n=1,620张幻灯片)。

f,UNI及其在15个弱监督幻灯片级分类任务中的对比的监督性能。虚线表示每个模型在所有任务中的平均性能。所有数据均以平衡准确度给出,除了ISUP分级,其以二次加权Cohen's κ给出。误差线表示95%置信区间,中心值对应于上述每个指标的计算值。所有任务的详细结果请参见补充表12–35。Ext.,外部测试集。g–j,针对四个任务报告的每个类别为K ∈ {1, 2, 4, 8, 16, 32}的少样本幻灯片级性能。g,RCC亚型(训练,TCGA;测试,CPTAC-DHMC;n=872张幻灯片)。h,BRCA细粒度亚型(BRACS,n=87张幻灯片)。i,脑肿瘤粗粒度亚型(EBRAINS,n=573张幻灯片)。j,ISUP分级(PANDA,n=954张幻灯片)。方框表示模型性能的四分位数值(n=5次运行),须延伸至距离四分位范围的1.5倍内的数据点。所有任务的少样本结果请见扩展数据图1。

图片

Fig. 3 | ROI-level tasks.a, Supervised linear probe performance of UNI and its comparisons across 11 ROI-level classification tasks. All results are givenas balanced accuracy except for PRAD tissue classification, which is given as weighted F1 score. Dashed lines represent the average performance of each model across all tasks. Error bars represent 95% confidence intervals and the centers correspond to computed values of each metric as specified above. Detailed results for all tasks are provided in Supplementary Tables 39–60. b, Examples of UNI on ROI classification for PRAD tissue classification in AGGC. Left: ground-truth ROIlevel labels overlaid on the WSI. Right: predicted patch labels. ROIs are enlarged for better visualization, with further comparisons shown in Extended Data Fig. 2. c, ROI retrieval performance of UNI on PRAD tissue classification (AGGC, n = 345,021 ROIs). We report Recall@K for K∈ {1, 3, 5} and the mean recall, with error bars representing 95% confidence intervals and the centers corresponding to computed values of each metric. d, Supervised KNN probe performance of UNI across various image resolutions (res., in pixels) in BRCA subtyping in BACH (n = 80 ROIs). Retrieval performance for all tasks is provided in Extended Data Fig. 3 and Supplementary Tables 63–68. e, Multi-head self-attention (MHSA) heatmap visualization of UNI across different image resolutions (in pixels) in BACH. Each colored square represents a 16 × 16 pixel patch token encoded by UNI, with heatmap color corresponding to the attention weight of that patch token to the global [CLS] (that is, classification) token of the penultimate layer in UNI. Top and bottom, respectively: visualizations for the invasive- and normal-labeled images, with further visualizations and interpretations provided in Extended Data Figs. 4–6. Scale bars: b, ground truth and prediction, 2 mm; prediction(1) and prediction(2), 200 µm; insets, 30 µm; e, ROI image, 32 µm; 2242 , 64 pixels; 4482 , 128 pixels; 8962 , 256 pixels; 1,3442 , 384 pixels.

图3 | ROI级任务。a,UNI及其在11个ROI级分类任务中的监督线性探测性能对比。所有结果均以平衡准确度给出,除了PRAD组织分类,其以加权F1分数给出。虚线表示每个模型在所有任务中的平均性能。误差线表示95%置信区间,中心值对应于上述每个指标的计算值。所有任务的详细结果请参见补充表39–60。b,UNI在AGGC中PRAD组织分类的ROI分类示例。左:叠加在WSI上的地面真实ROI级别标签。右:预测的块标签。为了更好地可视化,ROI被放大,进一步的比较见扩展数据图2。c,UNI在PRAD组织分类(AGGC,n=345,021 ROIs)中的ROI检索性能。我们报告K∈{1, 3, 5}的Recall@K和平均召回率,误差线表示95%置信区间,中心值对应于上述每个指标的计算值。d,UNI在不同图像分辨率(res.,以像素表示)下的BRCA亚型(在BACH中)的监督KNN探测性能(n=80 ROIs)。所有任务的检索性能请见扩展数据图3和补充表63–68。e,UNI在BACH中不同图像分辨率下的多头自注意力(MHSA)热图可视化(以像素表示)。每个彩色方块表示UNI编码的一个16×16像素块标记,热图颜色对应于该块标记对UNI倒数第二层中的全局[CLS](即分类)标记的注意权重。上部和下部分别是侵袭性和正常标记图像的可视化,更多的可视化和解释请参见扩展数据图4–6。比例尺:b,地面真实和预测,2毫米;预测(1)和预测(2),200微米;插图,30微米;e,ROI图像,32微米;2242,64像素;4482,128像素;8962,256像素;1,3442,384像素。

图片

Fig. 4 | Few-shot ROI- and slide-level prototyping. a, Prototypical few-shot ROI classification via SimpleShot. A class prototype is constructed by averaging the extracted features from ROIs of the same class. For a test ROI, SimpleShot assigns the class of the most similar class prototype (smallest Euclidean distance) as the predicted ROI label. b, Prototypical few-shot slide classification via MISimpleShot. Using a pre-computed set of ROI-level class prototypes (sharing the same class labels as the slide), MI-SimpleShot predicts the slide label using the class prototype with the highest average similarity of top-K patches queried from the WSI. The similarity heatmap visualizes the similarity between the groundtruth class prototype and each patch in the WSI. c–e, Few-shot ROI classification performance via SimpleShot on three tasks, with boxes indicating quartiles of model performance (n = 1,000 runs) and whiskers extending to data points within 1.5-fold the interquartile range. c, Pan-cancer tissue classification (TCGA, n* = 55,360 ROIs). d, CRC polyp classification (UniToPatho, n = 2,399 ROIs). *e, PRAD tissue classification (AGGC, n = 345,021 ROIs). Few-shot ROI performances for all tasks are provided in Extended Data Fig. 8. f,g, Few-shot slide classification performance and similarity heatmaps via MI-SimpleShot for NSCLC subtyping (train, TCGA; test, CPTAC; n = 1,091 slides) (f) and RCC subtyping (train, TCGA; test, CPTAC-DHMC; n = 872 slides) (g). In both tasks, using pre-extracted features from UNI, we compare MI-SimpleShot in the same few-shot settings as ABMIL (boxes indicate quartile values of model performance with n = 5 runs and whiskers extend to data points within 1.5-fold the interquartile range), and visualize similarity heatmaps and the top-5 similar patches (indicated in red bounding boxes) for a LUSC (f) and CCRCC (g**) slide. Scale bars: WSI, 2 mm; top-5 retrieved patches, 56 µm. Further details, comparisons and visualizations are provided in Methods and Extended Data Figs. 8–10.

图4 | 少样本ROI-和幻灯片级原型制作。a,通过SimpleShot的原型式少样本ROI分类。通过对相同类别的ROI提取特征并求平均值来构建类原型。对于测试ROI,SimpleShot将最相似的类原型(欧氏距离最小)的类别作为预测的ROI标签。b,通过MI-SimpleShot的原型式少样本幻灯片分类。使用预先计算的ROI级类原型集(与幻灯片具有相同的类别标签),MI-SimpleShot使用从WSI查询的前K个补丁的平均相似度最高的类原型来预测幻灯片标签。相似度热图可视化了地面真实类原型与WSI中每个补丁之间的相似度。

c–e,通过SimpleShot在三个任务中的少样本ROI分类性能,方框表示模型性能的四分位数值(n=1,000次运行),须延伸至距离四分位范围的1.5倍内的数据点。c,泛癌组织分类(TCGA,n=55,360 ROIs)。d,CRC息肉分类(UniToPatho,n=2,399 ROIs)。e,PRAD组织分类(AGGC,n=345,021 ROIs)。所有任务的少样本ROI性能请见扩展数据图8。f、g,通过MI-SimpleShot的少样本幻灯片分类性能和相似度热图,用于NSCLC亚型(训练,TCGA;测试,CPTAC;n=1,091张幻灯片)(f)和RCC亚型(训练,TCGA;测试,CPTAC-DHMC;n=872张幻灯片)(g)。在这两个任务中,使用UNI的预先提取特征,我们将MI-SimpleShot与ABMIL在相同的少样本设置下进行比较(方框表示模型性能的四分位数值,n=5次运行,须延伸至距离四分位范围的1.5倍内的数据点),并可视化相似度热图和前5个相似补丁(用红色边框表示)的LUSC (f) 和CCRCC (g) 幻灯片。比例尺:WSI,2毫米;前5个检索的补丁,56微米。方法和扩展数据图8–10提供了更多详细信息、比较和可视化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/702732.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ITIL4背景下,ITSM产品应具备哪些特点?

点击进入IT管理知识库 随着信息技术的不断发展和普及,IT服务管理(ITSM)在企业中的地位日益凸显。而在ITIL4框架的指导下,ITSM产品的特点也随之发生了变化,更加注重灵活性、数字化和服务导向。本文将就ITIL4背景下&…

MemFire Cloud:为中国宝宝打造的一站式应用开发平台

在当今移动互联网时代,应用开发已经成为了许多企业和个人的迫切需求。然而,对于许多开发者来说,搭建服务往往是一个十分繁琐的过程,需要耗费大量的时间和精力。本文将带您探索应用开发前的繁琐之处以及如何通过MemFire Cloud轻松摆…

巴伦在接收链路中的应用

一、巴伦的定义 "巴伦"(Balun),是一种平衡-不平衡转换器,通常用于将平衡信号(如差分信号)转换为不平衡信号(如单端信号),或者反之。巴伦在无线通信、广播、天…

最新下载:CorelDraw 2023【软件附加安装教程】

简介: CorelDRAW Graphics Suite 订阅版拥有配备齐全的专业设计工具包,可以通过非常高的效率提供令人惊艳的矢量插图、布局、照片编辑和排版项目。价格实惠的订阅就能获得令人难以置信的持续价值,即时、有保障地获得独家的新功能和内容、一流…

【Uniapp】uniapp微信小程序定义图片地址全局变量

错误写法: main.js Vue.prototype.$imgUrl 图片地址这么写之后 就发现压根不起作用;获取到的是undefined 正确写法: 返回函数,后面可以拼上OSS图片完整路径 Vue.prototype.$imgUrl (url) > {return ("https://地址…

MySql 报错之 Truncated incorrect DOUBLE value: ‘111-7357916-9889033‘

1. 背景 查询sql时,出现报错:Truncated incorrect DOUBLE value: ‘111-7357916-9889033’ 2. 问题可能原因 2.1 数据类型不匹配 可能错误地将一个本应作为字符串处理的列或值用于了需要数值类型的计算或比较。检查SQL语句,确保数值类型…

【多线程】进程与线程

🥰🥰🥰来都来了,不妨点个关注叭! 👉博客主页:欢迎各位大佬!👈 文章目录 1. 操作系统2. 进程2.1 进程是什么2.2 进程管理2.3 进程调度2.3 内存管理2.4 进程间通信 3. 线程3.1 线程是什…

计算机组成原理-流水CPU-指令流水

一、指令流水的定义 指令流水线是计算机处理器中的一种设计,用于提高指令执行的效率。考虑到执行指令的每个阶段用到的硬件不同,它将处理指令的各个步骤分解为若干个阶段,并允许多个指令在同一时刻在不同的阶段执行,从而实现指令…

目标检测6:采用yolov8, RK3568推理的性能

最近有个小伙伴,问我rk3568上推理图片,1秒能达到多少? 本次采用模型为yolov8s.rknn,作了一次验证。 解析一段视频文件,1280*720, fps 24。读取视频文件,然后进行推理。 通过性能优化,发现推理…

网络安全快速入门(十七)计划任务

17.1 前言 在上一章节我们简单了解了Linux软件管理的一些相关操作,而在这张内容,我们来讲一下计划任务!计划任务,本质上来说就是特定的时间执行一些命令,因此被称为计划任务,我们接下来就具体来了解一下吧&…

01-Java和Android环境配置

appium是做app自动化测试最火的一个框架,它的主要优势是支持android和ios,同时也支持Java和Python脚本语言。而学习appium最大的难处在于环境的安装配置,本文主要介绍Java和Android环境配置,在后续文章中将会介绍appium的安装和具…

TextCtrl输入文本类

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 wx.StaticText类只能够用于显示纯粹的静态文本,但是有时需要输入文本与用户进行交互,此时,就需要使用wx.TextCtrl…

DataX(DataX简介、部署、同步数据)

DataX(DataX简介、部署、同步数据) ☀快乐无限 法力无边 目录 DataX(DataX简介、部署、同步数据) 1.DataX简介 1)数据采集模块: 2)数据写入模块: 2.DataX部署 1)Da…

人工智能超万卡集群的设计架构解读

超万卡集群的核心设计原则和总体架构 超万卡集群建设正起步,现主要依赖英伟达GPU及其配套设备。英伟达GPU在大模型训练中优势显著。国产AI芯片虽在政策与应用驱动下取得进步,但整体性能与生态建设仍有不足。构建一个基于国产生态、技术领先的超万卡集群&…

怎么找抖音高清视频素材下载网站

对于抖音视频创作者来说,找到合适的高清视频素材是提升视频质量和吸引观众关注的关键。高清视频素材可以使内容更具视觉冲击力,从而增加视频的观看次数和互动率。本文将介绍几个提供高清视频素材的下载网站,帮助你制作出更吸引人的抖音视频。…

电子画册制作与传统画册相比,有哪些优势?

在当今数字化时代,电子画册作为一种新兴的媒体形式,其制作与传统画册相比具有显著的优势。以下是对这些优势的详细探讨。 首先,电子画册的制作过程通常更加便捷和经济。相较于传统画册需要经历的繁琐的印刷过程,电子画册的制作大多…

浅谈内联钩取原理与实现

前言 导入地址表钩取的方法容易实现但是存在缺陷,若需要钩取的函数不存在导入地址表中,那么我们就无法进行钩取,出现以下几种情况时,导入函数是不会存储在导入地址表中的。 延迟加载:当导入函数还没调用时&#xff0…

操作系统入门系列-MIT6.828(操作系统工程)学习笔记(七)---- 系统调用函数与GDB(Lab: system calls)

系列文章目录 操作系统入门系列-MIT6.828(操作系统工程)学习笔记(一)---- 操作系统介绍与接口示例 操作系统入门系列-MIT6.828(操作系统工程)学习笔记(二)---- 课程实验环境搭建&am…

深入理解rtmp(一)之开发环境搭建

深入理解rtmp(一)之开发环境搭建 手机直播在15年的时候突然火起来,随着花椒,映客等出现,直播一下就出现在了风口,各个公司针对直播的战斗迅速打响,战斗过程比较短暂,随着许多公司的退出和死去,手机直播行业趋于稳定,直播服务时长也被传统的CDN厂商牢牢占据,后面大家又把精力投…

3.Mongodb 复制集RS

MongoDB复制集是Mongodb提供的一种高可用和数据冗余的解决方案,复制集由多个MongoDB服务器组成,其中一个服务器作为主节点(Primary),处理所有写操作,而其他服务器作为从节点(Secondary&#xff…