小罗碎碎念
小罗推荐
选这篇文献进行精析的原因比较直接——前两天组会提到了,这是我组会准备的PPT,正好让大家快速的了解一下这篇文章。
文献简介
这篇文章是关于一种新型的基于组织病理学图像的深度学习分类器——Pathologic Risk Classifier for High-Grade Serous Ovarian Cancer (PathoRiCH)的研究。该分类器旨在预测高级别浆液性卵巢癌(HGSOC)患者对铂基化疗的反应。目前,尚无生物标志物能够迅速预测患者对铂基治疗的反应,因此开发这一分类器具有重要意义。
研究团队通过训练一个内部队列(n=394)并在两个独立的外部队列(n=284和n=136)上进行验证,展示了PathoRiCH的有效性。研究结果表明,PathoRiCH预测的对治疗有利和不利的组在所有三个队列中显示出显著不同的无铂间期(platinum-free intervals, PFI)。将PathoRiCH与分子生物标志物结合使用,可以为患者的风险分层提供更强大的工具。此外,通过可视化和转录组分析解释了PathoRiCH的决策过程,增强了模型决策的可靠性。PathoRiCH在预测性能上优于当前的分子生物标志物,为开发创新工具以转变HGSOC的当前诊断流程提供了坚实的基础。
文章还讨论了HGSOC的组织病理学特征,以及如何通过深度学习和数字病理图像的结合来自动化常规诊断任务,并发现以前未被认识的预测形态特征。研究使用了多种多实例学习(MIL)模型,这些模型仅使用组织病理学图像来预测女性HGSOC患者对铂基治疗的反应。研究还进行了可视化分析和转录组分析,以展示模型输出的可靠性和分子特征。
最后,文章指出PathoRiCH作为一个独立的预后因素,在外部(TCGA)验证队列中显示出与PFI的最强关联,并且在多变量Cox回归分析中被识别为最强的独立预后因素。
研究的局限性包括需要更多的多中心验证和深入解释模型,以及需要在训练数据集中纳入更多对治疗反应不佳的病例,以平衡两组并更好地训练与治疗反应相关的特征。尽管存在局限性,但这项研究为HGSOC的诊断和治疗提供了新的视角和工具。
知识点补充:铂基化疗
铂基化疗是一种常用的癌症治疗方式,它以含有铂元素的药物为基础。这类化疗药物通过与DNA结合,导致DNA损伤和细胞死亡,从而抑制肿瘤的生长和扩散。铂基化疗药物中最著名的是顺铂(cisplatin)和卡铂(carboplatin),它们广泛应用于多种类型的癌症治疗,包括但不限于卵巢癌、睾丸癌、肺癌和膀胱癌。
在高级别浆液性卵巢癌(HGSOC)的治疗中,铂基化疗是标准治疗方案之一。这种癌症通常在初次诊断时已经处于晚期,并且具有快速进展和广泛扩散的特点。铂基化疗通常在肿瘤减量手术(debulking surgery)之后进行,目的是消除残留的癌细胞,延长患者的生存期,并提高生活质量。
然而,患者对铂基化疗的反应存在个体差异,有些患者可能表现出良好的治疗反应和长期生存,而其他患者可能在治疗后的两年内复发,且治疗选择有限。因此,能够预测患者对铂基化疗反应的生物标志物或工具的开发,对于个性化治疗和改善患者预后具有重要意义。
在这篇文章中,研究者开发的PathoRiCH分类器正是为了预测HGSOC患者对铂基化疗的反应,以期为临床治疗提供指导。
1、Introduction
作者
上皮性卵巢癌是最常见的妇科恶性肿瘤,也是全球女性癌症相关死亡的第八大原因[1]。
大多数上皮性卵巢癌为高级别浆液性卵巢癌(HGSOC),其特点是一开始诊断时就处于晚期(III和IV期),病情进展迅速,广泛扩散,预后较差。
对于晚期HGSOC患者,5年生存率大约为25%。铂类药物化疗在去块手术后是HGSOC的标准治疗。然而,对铂类药物治疗的临床反应各不相同:仅有20%的晚期患者表现出良好的治疗反应和长期生存,而其余80%的患者在两年内复发,治疗选择有限[2]。
聚腺苷二磷酸核糖聚合酶(PARP)抑制剂利用DNA修复的脆弱性,迅速成为卵巢癌治疗的变革者[6-8]。
对PARP抑制剂最敏感的预测因素是铂类治疗反应,BRCA1/2(BRCA)突变状态和同源重组缺陷(HRD)状态。然而,这些预测因素都有局限性。
为了确定一个患者是否对铂类药物敏感或耐药,患者必须经过几个周期的化疗并经历相关的不良事件。尽管已经提出了各种基因组学、转录组学和蛋白质组学生物标志物来预测铂类药物化疗的结果,但还没有一个被引入到标准临床实践中[6,8-10]。
此外,BRCA突变和HRD状态的基因组分析既昂贵又费时,需要肿瘤DNA/RNA样本进行分析,使得在每位HGSOC患者中实施变得具有挑战性,特别是在资源匮乏的情况下[11,12]。
为了启动HGSOC的辅助化疗,基于苏木精-伊红(H&E)染色的全切片图像(WSIs)的病理诊断是必不可少的。
HGSOC表现出各种组织病理学特征,但迄今为止,没有人识别出预测临床结果的病理因素。
最近,深度学习和数字病理成像的结合使得自动化常规诊断任务成为可能,如癌症检测、分级和亚型分类。此外,它为发现以前未识别的预后形态学特征提供了一种方法,这些特征可以用来预测治疗反应和结果,或者推断肿瘤的分子特征[15-21]。
尽管有几项研究试图从组织病理学肿瘤图像预测HGSOC的临床结果或分子特征,但大多数样本量较小,缺乏外部验证,或者没有证明其模型的可靠性[22-26]。因此,组织学在HGSOC中的预测能力需要进一步研究。
在这项工作中,使用了各种多实例学习(MIL)模型,仅使用组织病理学图像来预测女性HGSOC对铂类药物治疗的反应。通过这样做,作者开发出一个鲁棒性强的MIL模型——称之为HGSOC的病理风险分类器(PathoRiCH)。
PathoRiCH用HGSOC队列进行训练,并显示出显著的预测性能。此外,将PathoRiCH与当前的分子生物标志物结合使用,为HGSOC患者提供了一种更强大的风险分层方法。
为了证明模型的可靠性,作者可视化了模型输出并分析了预测组的分子特征。
2、Results
2-1:Cohort characteristics
研究共分析了814名HGSOC患者,包括:
- 394名在延世大学附属医院接受治疗的患者(SEV队列,754份WSI)
- 284名来自癌症基因组图谱卵巢癌数据库的患者(TCGA队列,516份WSI)
- 136名在三星医疗中心接受治疗的患者(SMC队列,136份WSI)
表1提供了三个不同队列(SEV、TCGA和SMC)中高级别浆液性卵巢癌(HGSOC)患者的临床病理特征的汇总。
-
患者人数和WSI数量:
- 所有队列共有814名患者,其中SEV队列有394名患者,TCGA队列有284名患者,SMC队列有136名患者。
- 对应的全切片图像(Whole Slide Images, WSIs)数量分别为754、516和136。
-
年龄分布:
- 患者的平均年龄在三个队列中有所不同,分别为SEV队列53.9岁,TCGA队列59.8岁,SMC队列56.9岁。
-
癌症分期:
- 所有患者均为III期或IV期,其中SEV队列中100%为III期或IV期,而TCGA队列中有小部分患者为I期或II期。
-
BRCA突变状态:
- 各队列中BRCA突变状态的分布不同,SEV队列中16.5%的患者为突变型,37.6%为野生型,45.9%未知;TCGA队列中6.7%为突变型,93.3%为野生型,0.0%未知。
-
HRD状态:
- HRD(同源重组缺陷)状态根据不同的评估方法(Telli、Takaya、Perez-Villatoro)在TCGA队列中有不同比例的阳性和阴性结果。SEV和SMC队列没有HRD状态的数据。
-
铂类药物反应分组:
- 根据无铂间期(Platinum-Free Interval, PFI)将患者分为四个反应组:铂类耐药(PFI ≤ 6个月)、部分铂类敏感(PFI 6–12个月)、铂类敏感(PFI 12–24个月)和非常铂类敏感(PFI > 24个月)。
- 在SEV队列中,铂类耐药和部分铂类敏感的患者占33.5%,铂类敏感的患者占21.6%,非常铂类敏感的患者占44.9%。
- 在TCGA队列中,铂类耐药的患者占4.2%,部分铂类敏感的患者占16.5%,铂类敏感的患者占45.1%,非常铂类敏感的患者占34.2%。
- 在SMC队列中,铂类耐药的患者占4.4%,部分铂类敏感的患者占23.5%,铂类敏感的患者占1.5%,非常铂类敏感的患者占70.6%。
这些数据为研究者提供了不同队列中HGSOC患者的详细特征,有助于分析PathoRiCH分类器在不同患者群体中的预测性能。同时,这些特征也可以用来评估患者的治疗反应和预后。
2-2:MIL models
研究团队调查了六种不同的多实例学习(MIL)模型,这些模型使用了两种图像区域(全部组织区域和癌症分割区域)以及三种放大倍数(5×、20×以及5×和20×的组合)。
图1提供了研究中使用的多实例学习(Multiple Instance Learning, MIL)模型的高级概述。
-
图像块提取:
- 从全切片图像(Whole-Slide Images, WSIs)中提取不同放大倍数(5× 和 20×)的图像块(patches)。
- 对于全部组织区域和癌症分割区域模型,分别训练了17,742,605和3,822,597个图像块。
- 图像放大倍数的设置基于病理诊断的常规方法:低倍放大(5×)用于结构水平评估,高倍放大(20×)用于细胞学水平评估,多尺度水平用于整合5×和20×图像的信息。
-
自动化癌症分割:
- 使用自动化癌症分割模型处理这些图像块,以排除不包含癌细胞的图像块。这一步骤是为了确保后续分析集中于癌症相关的组织特征。
-
对比自监督学习算法:
- 经过癌症分割的图像块被输入到对比自监督学习算法中(图中蓝色箭头路径)。这种算法通过最大化同一数据实例的不同增强视图之间的一致性,使卷积神经网络(CNN)学习图像的表示。
-
全组织分析:
- 作为替代方法,所有图像块,包括那些不包含癌细胞的图像块,也可以直接输入到自监督学习算法中,以包含WSIs中的所有组织(图中红色箭头路径)。
-
多实例学习方法:
- 对于单一放大倍数和多尺度放大倍数设置(5×、20×以及两者结合),分别使用不同的MIL方法。这样,生成了六种不同的MIL模型。
-
多尺度MIL模型:
- 对于多尺度MIL,通过连接不同尺度WSIs的嵌入(embeddings),形成特征金字塔(feature pyramids),以训练MIL聚合器。
-
模型训练:
- 这些模型通过结合不同尺度的图像特征,旨在提高对癌症组织特征的识别能力,从而提高预测模型的性能。
-
特征融合:
- 在多尺度MIL模型中,特征融合是通过连接来自不同尺度的图像特征来实现的,这有助于捕获从宏观到微观不同层次的组织信息。
图1所描述的MIL模型设计允许研究者从组织病理学图像中提取丰富的特征,并利用这些特征来预测HGSOC患者对铂基化疗的反应。通过自监督学习,模型能够在没有明确标签的情况下学习图像块的特征表示,这对于提高模型在实际临床应用中的泛化能力至关重要。
对于癌症分割区域,一个在浸润性乳腺癌模型上预训练的癌症分割模型自动标注了癌症区域(补充图1)。
- 自动化癌症分割模型:
- 提到了一个基于UNetPlusPlus的自动化癌症分割模型,这个模型在病理学家标记的乳腺浸润性导管癌(breast invasive ductal carcinoma)上进行了预训练,目的是用于癌症分割。
- 模型应用:
- 该模型被用来从卵巢癌切除手术的全切片图像(whole slide images, WSIs)中标记癌症区域。
- 代表性图像展示:
- 提供了代表性的自动化癌症分割图像,包括低倍放大(low-magnification)和高倍放大(high-magnification)的图像示例。
- 模型验证:
- 通过与病理学家标注的癌症区域进行比较,验证了模型的准确性。这通常涉及到计算Dice系数,这是一种衡量两个样本集合相似度的统计度量。
- 临床意义:
- 自动化癌症分割模型在病理诊断中具有重要意义,它可以减少病理学家的工作量,提高诊断效率,并可能提高癌症检测的准确性。
- 技术细节:
- UNetPlusPlus是一种深度学习架构,特别适合于医学图像分割任务。它通过使用密集连接的跳跃路径来提高特征融合和信息流,从而提高分割精度。
通过Supplementary Figure 1,我们可以了解到研究团队如何利用深度学习技术来提高癌症诊断的自动化程度,并通过实际的图像示例展示了模型的应用效果。
癌症分割区域在内部(SEV)和外部(TCGA)队列中与病理学家标注的癌症区域显示出良好的整体一致性,分别达到了0.781和0.836的Dice系数(补充表1和补充图2)。
Supplementary Table 1 提供了癌症分割一致性的数据,这些数据比较了病理学家的癌症区域注释与癌症分割模型的输出结果。
-
Dice系数:
- 表格列出了Dice系数,这是一种衡量两个不同分割结果之间一致性的统计度量。Dice系数的值范围从0(没有重叠)到1(完全一致)。
-
SEV队列:
- SEV队列(内部验证队列)的Dice系数为0.781,表明模型在该队列中的癌症分割与病理学家的注释有较高的一致性。
-
TCGA队列:
- TCGA队列(外部验证队列)的Dice系数为0.836,表明模型在该队列中的癌症分割与病理学家的注释同样有很高的一致性。
-
总体一致性:
- 将两个队列的结果合并,总体Dice系数为0.804,这显示了模型在癌症分割任务上的稳健性和准确性。
-
临床意义:
- 高一致性表明自动化癌症分割模型能够可靠地识别和分割癌症区域,这对于提高病理诊断的效率和准确性具有重要意义。
-
模型验证:
- 这些数据为模型提供了验证,说明它在不同的患者群体中都能保持较高的性能。
-
潜在应用:
- 表格中的数据支持了该模型作为辅助工具在临床病理诊断中的潜在应用,尤其是在需要快速和准确癌症分割的场景中。
-
进一步改进:
- 尽管一致性较高,但仍有改进空间,可以通过进一步训练和优化模型来提高Dice系数,从而提高分割精度。
Supplementary Table 1 通过提供Dice系数,为癌症分割模型的准确性和可靠性提供了量化的证据,这对于模型的进一步开发和临床应用至关重要。
Supplementary Figure 2 展示了自动化癌症分割模型的验证过程,其中包括了与病理学家注释区域的一致性(concordance)分析。
- 验证目的:
- 验证自动化癌症分割模型的准确性,通过比较模型识别的癌症区域与病理学家手动注释的区域。
- 样本选择:
- 从内部(SEV)和外部(TCGA)队列中随机选择了10%的病例进行分析。
- 区域注释:
- 从全切片图像中选取了250 x 250微米(µm)的区域,并由经验丰富的妇科病理学家手动进行注释。
- 比较方法:
- 将病理学家的注释与自动化分割模型的结果进行了并排比较。
- Dice系数:
- 使用Dice系数来量化两种分割结果之间的一致性。Dice系数是一种统计度量,用于评估两个样本集合的重叠程度,其值范围从0(没有重叠)到1(完全重叠)。
- 模型性能评估:
- 通过Dice系数评估自动化癌症分割模型的性能。较高的Dice系数表明模型的分割结果与病理学家的注释更为接近,从而表明模型具有较好的性能。
- 临床意义:
- 自动化癌症分割模型的验证对于确保其在临床实践中的可靠性和有效性至关重要。
Supplementary Figure 2 通过展示自动化癌症分割模型与病理学家注释之间的一致性,为模型的临床应用提供了重要的验证数据。这对于发展和优化病理诊断中的人工智能工具具有重要意义。
使用SEV队列的五折交叉验证进行训练和内部验证。
表2展示了在内部(SEV)和外部(TCGA和SMC)验证队列中,多种多实例学习(MIL)模型在预测基于铂的治疗效果组方面的性能。
内部验证(SEV队列):
-
5× Magnification (All-tissue area):
- AUC-ROC: 0.627 ± 0.047,表明模型在区分不同反应组方面表现良好。
- 精度(Precision): 0.495,召回率(Recall): 0.663,F1分数(F1 score): 0.559,这些指标显示了模型在预测正例(即铂敏感组)方面的准确性和全面性。
- Kaplan-Meier (K-M) p值: 0.000,表示模型预测结果与实际观察到的无铂间期(PFI)有显著差异。
-
20× Magnification (All-tissue area):
- AUC-ROC稍低,为0.610 ± 0.040,精度和召回率分别为0.605和0.411,F1分数为0.462。
-
Multiscale (All-tissue area):
- AUC-ROC为0.623 ± 0.016,表现介于5×和20×模型之间。
-
5× Magnification (Cancer-segmented area):
- AUC-ROC为0.604 ± 0.050,精度和召回率分别为0.521和0.468,F1分数为0.470。
-
20× Magnification (Cancer-segmented area):
- AUC-ROC稍低,为0.596 ± 0.072。
-
Multiscale (Cancer-segmented area):
- AUC-ROC为0.614 ± 0.046,与5×模型相似。
外部验证(TCGA队列):
-
5× Magnification (All-tissue area):
- AUC-ROC下降至0.492,精度为0.187,召回率为0.879,F1分数为0.309。
-
20× Magnification (All-tissue area):
- AUC-ROC提高至0.594,精度为0.253,召回率为0.484,F1分数为0.332。
-
Cancer-segmented area 20× model 在TCGA队列中表现最佳,AUC-ROC为0.602。
外部验证(SMC队列):
- Cancer-segmented area 20× model:
- AUC-ROC为0.593,精度为0.351,召回率为0.711,F1分数为0.470。
综合分析:
- 5× vs. 20× Magnification: 在内部验证中,5×放大倍数的模型表现更好,而在外部验证中,20×放大倍数的模型表现更佳。这可能表明在不同的患者群体中,细胞级别的特征(20×)比组织架构级别的特征(5×)更为重要。
- All-tissue vs. Cancer-segmented area: 癌症分割区域的模型在某些情况下表现更好,这表明专注于癌症区域的特征可能有助于提高模型的预测准确性。
- Multiscale models: 多尺度模型在所有情况下都显示出介于5×和20×模型之间的性能,这表明结合不同尺度的信息可以提供一致的性能,但可能不会总是带来性能上的显著提升。
- K-M p value: 在所有情况下,Kaplan-Meier分析的p值都表明模型预测与实际PFI有显著的相关性。
总体而言,表2提供了不同MIL模型在不同验证队列中的详细性能评估,为选择最佳模型提供了重要信息。
为了证实这一结果,使用癌症分割区域的5×和20×图像进行了集成技术处理(补充表2)。与软投票和硬投票集成模型相比,癌症分割区域20×放大倍数的模型显示出更优越的性能。
Supplementary Table 2 展示了针对癌症分割区域的多实例学习(Multiple Instance Learning, MIL)模型在内部(SEV)和外部(TCGA)验证队列中的性能表现,以及集成分析的结果。
- 模型性能指标:
- 表格列出了几个关键的性能指标,包括区域下接收者操作特征曲线(Area Under the Receiver Operating Characteristic Curve, AUC-ROC)、精确度(Precision)、召回率(Recall)、F1分数(F1 Score)和Kaplan-Meier(K-M)p值。
- 不同放大倍数:
- 表格中展示了5倍(5×)和20倍(20×)放大倍数的MIL模型性能,以及多尺度(Multiscale)模型的性能。
- 内部验证(SEV队列):
- 在内部验证队列中,5×放大倍数的MIL模型在AUC-ROC上表现略优于20×放大倍数的模型。多尺度模型的性能最佳。
- 外部验证(TCGA队列):
- 在外部验证队列中,20×放大倍数的MIL模型同样展现出较好的性能,特别是在AUC-ROC和F1分数上。
- K-M p值:
- K-M p值基于无铂间期(Platinum-Free Interval, PFI)的Kaplan-Meier生存分析,用于评估模型预测的患者分层是否具有统计学意义。
Supplementary Table 2 提供了对MIL模型在不同验证队列中的详细性能评估,为选择最佳模型和分析方法提供了重要信息。
2-3:PathoRiCH + BRCA + HRD shows the best PFI prediction ability
为了在内部和外部验证中实现平衡的良好性能,研究团队选择了癌症分割区域20×放大倍数的MIL,并将其命名为PathoRiCH。
图2展示了使用Kaplan-Meier生存分析方法对PathoRiCH模型(基于20倍放大的癌症区域分割的多实例学习模型)预测结果的分析——PathoRiCH在内部(SEV)和外部(TCGA)验证队列中确定的有利组和不良组显示出显著差异的无铂间期(PFI)(分别为p < 0.001和p = 0.032)
a. 内部验证(SEV队列):
- PathoRiCH预测的有利组和不利组在无铂间期(PFI)和总生存期(OS)上表现出显著差异。
- PFI的p值为4.17E-05,OS的p值为8.73E-05,这意味着预测结果与实际观察到的PFI和OS有非常显著的相关性。
- 低p值表明PathoRiCH模型能够以高统计学意义区分不同反应组的生存曲线。
b. TCGA外部验证队列:
- 在TCGA队列中,PathoRiCH模型同样显示出在PFI和OS方面的显著患者分层。
- PFI的p值为0.032,OS的p值为1.06E-09,这进一步验证了PathoRiCH模型在独立队列中的预测能力。
- 特别是OS的p值极低,表明模型在预测总生存期方面具有很高的准确性。
c. SMC外部验证队列:
- SMC队列中,PathoRiCH模型在PFI方面也显示出显著的患者分层(p = 0.030)。
- 然而,对于OS,模型没有达到统计学显著性(p = 0.54),这可能表明在该队列中模型对总生存期的预测能力有限。
综合分析:
- 一致性: PathoRiCH模型在内部和外部验证队列中均显示出对PFI的良好预测能力,这表明模型具有较好的泛化能力。
- 生存期预测: 在SEV和TCGA队列中,模型对OS的预测也具有统计学意义,但在SMC队列中对OS的预测能力不足,这可能与队列的特定特征或样本量有关。
- 统计学意义: 低p值通常意味着结果不太可能是由于随机变化引起的,因此在SEV和TCGA队列中,PathoRiCH模型的预测结果被认为是可信的。
- 临床相关性: PFI和OS是评估癌症治疗效果的重要指标,PathoRiCH模型能够显著区分这些指标,表明它可能对临床决策有重要影响。
图2的结果强调了PathoRiCH模型在预测HGSOC患者对铂基化疗反应方面的潜力,特别是在PFI和OS的预测上。然而,模型在不同队列中对OS预测的不一致性表明可能需要进一步的优化和验证。
PathoRiCH在这两个队列中也显示出四种PFI组(PFI ≤ 6个月,6–12个月,12–24个月和>24个月)的分布显著不同:分别为p = 0.036和p < 0.001(补充图3)。
Supplementary Figure 3 描述了 PathoRiCH 预测结果在三个不同队列(内部 SEV 队列和外部 TCGA 与 SMC 队列)中的分布情况。
-
PathoRiCH 预测结果:
- 展示了 PathoRiCH 模型对三个患者队列的预测结果,这些结果基于不同的无铂间期(PFI)分组。
-
PFI 分组:
- PFI 分为四个组:铂类耐药(PFI ≤ 6个月)、部分铂类耐药(6–12个月)、铂类敏感(12–24个月)、非常铂类敏感(>24个月)。
-
颜色编码:
- 彩色条形图表示每个结果组别的预测百分比,其中蓝色代表有利结果,红色代表不利结果。
-
数值显示:
- 每个条形图中的数值显示了每个类别中的案例数量。
-
统计显著性:
- 对于所有三个队列,预测结果在四个 PFI 组中的分布有显著差异,对应的 p 值为 0.036(SEV 队列)、p < 0.001(TCGA 队列)和 p < 0.001(SMC 队列),这表明 PathoRiCH 模型能够区分不同 PFI 组的患者。
Supplementary Figure 3 通过展示不同队列中 PathoRiCH 预测结果的分布,为评估模型的预测性能和临床应用潜力提供了重要信息。
当在TCGA队列中将PathoRiCH结果与BRCA和HRD状态(PathoRiCH+BRCA + HRD)结合时,患者可以进一步细分为四个亚组,这使得风险分层比仅使用分子生物标志物更加精确。
- 有利–BRCA/HRD阳性(47.8%)
- 有利–BRCA/HRD阴性(31.7%)
- 不良–BRCA/HRD阳性(10.4%)
- 不良–BRCA/HRD阴性(10.1%)
图3提供了在TCGA外部验证队列中,结合PathoRiCH、BRCA和HRD状态对患者进行分层的Kaplan-Meier生存分析和真实无铂间期(PFI)组的分布情况的详细视图。
a. Kaplan-Meier生存曲线图:
- 患者分层:患者根据PathoRiCH、BRCA和HRD的综合结果被分为不同的组。
- 生存分析:图中显示了PFI和总生存期(OS)的Kaplan-Meier生存曲线,这些曲线根据患者分层显著不同。
- 统计显著性:p值为1.07E-05(PFI)和3.30E-16(OS),这些非常低的p值表明分层在统计学上非常显著,说明这种组合预测方法能够有效地区分患者的生存结果。
- BRCA/HRD阳性有利组:BRCA和HRD阳性的患者组显示出最有利的PFI,即他们对铂基治疗有更好的反应。
- BRCA/HRD阳性不利组和BRCA/HRD阴性不利组:这两组显示出最差的PFI,表明他们对铂基治疗的反应较差。
b. PFI组的分布:
- PFI分组:患者根据PFI被分为四个组:铂类耐药(PFI ≤ 6个月)、部分铂类耐药(6–12个月)、铂类敏感(12–24个月)和非常铂类敏感(>24个月)。
- 预测分布:图中的条形图表示每个结果组的预测百分比(蓝色代表有利,红色代表不利),条形图中的数值显示每个类别的案例数量。
- 统计显著性:综合PathoRiCH、BRCA和HRD的分布对于四个PFI组有显著差异,p值为0.001,这表明这种组合预测方法在PFI的不同阶段都能区分患者。
综合分析:
- 分层效果:结合PathoRiCH、BRCA和HRD的预测方法在生存分析中显示出强大的分层能力,能够显著区分不同生存结果的患者群体。
- 预后价值:BRCA和HRD的状态为预测HGSOC患者对铂基治疗的反应提供了额外的预后信息,特别是当与PathoRiCH结合使用时。
- 临床应用:这种综合预测方法可能有助于临床医生更好地理解患者的治疗反应,并可能指导个性化治疗决策。
- 统计学意义:低p值增强了研究结果的可信度,表明观察到的分层不是偶然发生的,而是有实际生物学意义。
图3的结果强调了结合组织病理学特征、遗传标记和分子标志物的多参数预测方法在提高HGSOC患者治疗反应预测准确性方面的潜力。
作为比较,补充图4显示了内部(SEV)和外部(TCGA)验证队列中真实有利和不良反应组的Kaplan-Meier分析。
2-4:PathoRiCH was identified as an independent prognostic factor
在TCGA外部验证队列中,PathoRiCH预测的组别与年龄、BRCA突变状态和HRD状态无显著关联,但FIGO分期显著相关(p < 0.001)(补充表3)。
Supplementary Table 3 提供了在 TCGA 和 SMC 两个外部验证队列中,根据 PathoRiCH 预测对铂基治疗有反应的患者的临床和分子特征的比较。
-
患者分组:
- 患者根据 PathoRiCH 的预测结果被分为“有利”(Favorable)和“不利”(Poor)两个反应组。
-
年龄比较:
- 表格中比较了两组患者(有利与不利)的平均年龄,并通过 p 值来评估年龄差异的统计学意义。
-
FIGO 分期:
- FIGO 分期是评估妇科癌症(如卵巢癌)的一个国际公认的分期系统。表格中列出了不同分期的患者数量,并计算了 p 值来评估预测组之间分期分布的差异。
-
BRCA 突变状态:
- 列出了 BRCA 突变型和野生型患者的数量,并评估了它们在预测组中的分布差异。
-
HRD 状态:
- HRD(同源重组缺陷)状态是基于三种不同算法(Telli et al., Takaya et al., Perez-Villatoro et al.)的评估结果。表格中列出了 HRD 阳性和阴性患者的数量,并计算了 p 值来评估它们在预测组中的分布差异。
-
统计分析:
- 表格中使用双尾未配对 t 检验来分析临床和分子特征在两组之间的差异。
-
p 值:
- p 值用于评估观察到的差异是否具有统计学意义。一般来说,p < 0.05 被认为是具有统计学意义的。
-
临床意义:
- 表格中的数据有助于了解预测对铂基治疗反应良好的患者群体的特征,这可能有助于指导未来的治疗策略和个性化医疗。
-
分子特征:
- 分子特征如 BRCA 突变和 HRD 状态对于评估患者对特定治疗的反应非常重要,这些数据可以提供关于患者群体的生物学见解。
-
结果解释:
- 表格中的数据应结合临床情况和其他研究结果来解释,以确保对患者治疗反应的全面理解。
Supplementary Table 3 通过展示不同临床和分子特征在预测反应组中的分布,为研究者提供了关于 HGSOC 患者对铂基治疗反应可能的预测因素的详细信息。
在单变量Cox回归分析中,PathoRiCH与PFI(无铂间期)的关联最强(p < 0.0001),其次是FIGO分期(p = 0.001)、BRCA状态(p = 0.026)、HRD状态(p = 0.010)和BRCA + HRD状态(p = 0.011)(补充表4)。然而,年龄与PFI无显著关联。
Supplementary Table 4 提供了对高级别浆液性卵巢癌(HGSOC)患者无铂间期(platinum-free interval, PFI)的单变量和多变量生存分析的结果,分别针对 TCGA 和 SMC 两个队列。
- 分析类型:
- 单变量分析(Univariate)评估了每个变量与 PFI 的关联,而不考虑其他变量的影响。
- 多变量分析(Multivariate)考虑了多个变量的同时影响,以评估它们对 PFI 的独立贡献。
- 变量:
- 表格中包括了年龄、FIGO 分期、BRCA 突变状态、HRD(同源重组缺陷)状态、BRCA 和 HRD 的组合状态以及 PathoRiCH 预测结果等变量。
- 风险比(HR):
- 风险比(Hazard Ratio, HR)表示在单变量分析中,某个变量每变化一个单位,PFI 的风险变化倍数。
- 95% 置信区间(CI):
- 95% 置信区间提供了 HR 的估计范围,反映了统计估计的不确定性。
- z 统计量和 p 值:
- z 统计量用于评估 HR 与 1(无影响)的差异是否具有统计学意义。
- p 值用于测试假设,即变量在多变量模型中是否为 PFI 的独立预后因素。
- 显著性标记:
- 星号(*)通常用于标记具有统计学意义的 p 值,例如 p < 0.05 或 p < 0.0001。
- TCGA 和 SMC 队列:
- 表格分别列出了 TCGA 和 SMC 队列的分析结果,允许比较两个不同患者群体中变量的影响。
- PathoRiCH 预测:
- PathoRiCH 预测结果显示了有利(Favorable)与不利(Poor)预测组之间的显著性差异,这可能指示模型在预测 PFI 方面的效能。
- 临床和分子特征:
- 表格中的数据有助于理解临床和分子特征如何影响 HGSOC 患者的预后,特别是在对铂基治疗的反应上。
Supplementary Table 4 通过单变量和多变量分析,提供了对影响 HGSOC 患者 PFI 的各种因素的深入理解,这对于改善患者管理和治疗结果至关重要。
图4展示了在TCGA和SMC两个外部验证队列中进行的多变量Cox回归分析的结果。
分析考虑了六个变量:
- 年龄
- FIGO分期
- BRCA突变状态
- HRD状态
- BRCA和HRD状态的组合
- PathoRiCH预测
数据以带有误差线的形式呈现,误差线代表了95%置信区间。以下是对图中数据的分析:
a. TCGA队列分析:
- PathoRiCH预测:在TCGA队列中,PathoRiCH预测是最强的独立预后因素,p值为6.57E-05,表明它与预后有非常显著的相关性。
- FIGO分期:FIGO分期作为第二个最强的预后因素,p值为0.005,也是一个显著的预后指标。
- BRCA状态:BRCA突变状态的p值为0.32,虽然在统计上不显著,但这可能表明BRCA状态与预后有一定程度的相关性。
b. SMC队列分析:
- FIGO分期:在SMC队列中,FIGO分期的p值为0.004,是显著的独立预后因素。
- PathoRiCH预测:PathoRiCH预测的p值为0.39,虽然在SMC队列中没有达到传统统计显著性水平(p < 0.05),但接近显著性阈值,可能表明在该队列中PathoRiCH预测与预后有一定的相关性。
- 其他变量:与TCGA队列相比,SMC队列中PathoRiCH预测的显著性降低,这可能与队列的特定特征或样本量有关。
综合分析:
- PathoRiCH预测的一致性:在TCGA队列中,PathoRiCH预测是一个强烈的独立预后因素,而在SMC队列中,其显著性降低。这表明PathoRiCH预测可能在不同的患者群体中具有不同程度的重要性。
- FIGO分期的重要性:在两个队列中,FIGO分期都是一个显著的预后因素,这强调了癌症分期在卵巢癌预后中的普遍重要性。
- BRCA状态的差异性:在TCGA队列中,BRCA状态没有达到统计显著性,而在SMC队列中没有提供BRCA状态的p值。这可能表明BRCA状态对预后的影响在不同的患者群体中可能有所不同。
- 置信区间:图中的误差线代表了95%置信区间,为估计的不确定性提供了视觉表示。在TCGA队列中,PathoRiCH预测的置信区间非常窄,表明估计非常精确;而在SMC队列中,PathoRiCH预测的置信区间较宽,表明估计的不确定性较高。
图4的结果强调了在多变量Cox回归模型中,PathoRiCH预测、FIGO分期和BRCA状态作为预后因素的重要性,尽管它们在不同队列中的显著性可能有所不同。这些发现有助于理解不同预后因素在卵巢癌患者生存预测中的作用。
根据BRCA突变和HRD状态的四种PFI组的Kaplan-Meier plots和分布显示在补充图5a中。根据BRCA突变的四种PFI组的Kaplan-Meier plots和分布显示在补充图5b中。
Supplementary Figure 5 提供了基于 BRCA 突变状态、HRD(同源重组缺陷)状态以及 BRCA 和 HRD 状态组合的高级别浆液性卵巢癌(HGSOC)患者无铂间期(PFI)的 Kaplan-Meier 生存曲线图和分布情况,分析了外部 TCGA 和 SMC 队列的数据。
Supplementary Figure 5 通过生存分析和分布图提供了对 HGSOC 患者预后的深入理解,强调了 BRCA 和 HRD 状态作为潜在的预后和预测生物标志物的重要性。
2-5:Visualization analysis
图5展示了PathoRiCH预测的有利和不利组别的注意力图分析。
-
Kaplan-Meier生存分析:
- 图的左侧展示了基于PathoRiCH预测的两组患者(有利和不利组)的双尾Kaplan-Meier生存曲线分析。
- 这种分析通常用于评估两组之间的生存差异,此处用于展示PathoRiCH预测的生存相关性。
-
注意力图的创建:
- 为有利和不利预测分别创建了单独的注意力图,然后将这些图结合起来,为每位患者生成一个综合预测注意力图。
- 注意力图是一种可视化手段,用于展示模型在做出预测时关注的图像区域。
-
注意力图的尺度:
- 提供了两个尺度的条形(scale bar):2毫米用于注意力图的整体尺度,50微米用于显示高得分区域的细节。
-
代表性病例展示:
- 图中展示了两个代表性病例,分别来自有利和不利组。
- 对应的注意力图和高得分图像(patches)并排展示,这有助于直观地比较两组之间的差异。
-
高得分图像(High-score patches):
- 高得分图像是模型在做出预测时给予最高关注度的图像区域。
- 这些图像区域可能包含了对预测结果有重要影响的组织学特征。
-
可视化的比较:
- 通过并排展示有利和不利组的注意力图和高得分图像,可以直观地识别和比较两组之间可能的组织学差异。
-
模型决策的可靠性:
- 通过可视化分析,研究者可以更好地理解模型的决策过程,评估模型是否关注了与病理学家评估一致的组织学特征。
-
临床意义:
- 这种分析有助于揭示与治疗反应相关的潜在组织学特征,可能为临床决策提供额外的信息。
图5通过结合生存分析和注意力图,提供了一个多维度的视角来评估PathoRiCH模型的预测能力,并且为理解模型如何基于组织学图像进行预测提供了直观的证据。
基于假设,极端治疗反应的患者可能比中度反应的患者含有更多预测性的组织学特征,研究团队从SEV队列中选择40例(WSI n = 76)具有高度有利和不良反应的病例,并分别提取了3500个高评分补丁。
通过应用高斯混合模型(GMM)聚类算法和病理学家的评估,将有利和不良组的高评分补丁分别分类为四个组织学上不同的集群。
图6展示了PathoRiCH预测的有利和不利组别中的高得分图像块(patches)的聚类分析。
-
聚类分析目的:
- 聚类分析用于识别和区分与有利和不利预后相关的不同的组织学特征。
-
高得分图像块:
- 高得分图像块是那些在PathoRiCH模型预测中具有最高关注度的图像区域,可能包含对预测结果有显著影响的组织学特征。
-
聚类方法:
- 使用高斯混合模型(Gaussian Mixture Models, GMMs)进行聚类分析,这是一种软聚类方法,允许图像块以不同的概率属于多个聚类。
-
病理学家评估:
- 聚类结果由病理学家进行评估,以进一步合并具有相似组织学特征的聚类。
-
聚类结果:
- 最终分组包括四个有利组和四个不利组的组织学不同的聚类。
- 在有利组中,发现了两个独特的集群,分别显示“肿瘤内淋巴细胞浸润”和“小、单调核、高细胞性”(图6a)。
- 相反,不良组中的独特组织学特征是“核着色过深、粘连性差和纺锤状特征”以及“细胞质空泡和微囊性变化”(图6b)。
- 其余集群在两个组别中显示出重叠的组织学特征。
-
图像尺度:
- 所有图像块的尺度条(scale bar)为50微米,用于提供图像块大小的参考。
-
有利组和不利组的聚类:
- 图6a和6b展示了最初使用GMMs创建的聚类,高得分图像块作为每个组的输入。
- 病理学家评估后,将具有相似组织学特征的聚类进行了合并。
-
混合聚类:
- 图6c展示了将有利和不利预测组的高得分图像块混合在一起,并基于它们的组织学相似性使用GMM进行聚类的结果。
- 创建了七个聚类,其中识别出两个有利组主导的聚类和两个不利组主导的聚类。
-
组织学特征的识别:
- 通过聚类分析,能够识别出与有利和不利预后相关的特定组织学特征,这有助于理解模型预测的生物学基础。
-
临床意义:
- 识别出的组织学特征可能对临床治疗决策具有指导意义,尤其是在选择靶向治疗或评估预后时。
图6的聚类分析结果提供了对PathoRiCH模型预测背后的组织学特征的深入理解,并可能揭示了与HGSOC患者对铂基化疗反应相关的新的生物标志物。
当将两个组别的高评分补丁混合并聚类在一起时,发现了六个组织学上不同的集群,这些集群在有利和不良组中的比例不同(补充表5)。
PathoRiCH预测的有利和不良组的100个最高评分补丁在补充图6a中展示。
有利组中包含了“肿瘤内淋巴细胞浸润”的集群,而经常在不良组中识别出的“核着色过深、粘连性差和纺锤状特征”的集群则包含在不良组中。
另一方面,在全部组织区域20x模型中,预测的有利和不良组的100个最高评分补丁主要由非肿瘤补丁组成,例如脂肪组织和组织的边缘区域,这可能干扰了模型的决策(补充图6b)。
2-6:Transcriptome analysis
为了对TCGA队列中的208例病例进行转录组分析,研究团队首先比较了“真正有利预测”(n = 134)和“错误有利预测”(n = 25)组的RNA表达模式。
在差异表达基因(DEG)分析中,发现了13个上调基因和25个下调基因,与“错误有利预测”组相比,这些基因在“真正有利预测”组中显著表达(补充图7a和补充数据1)。
图7展示了PathoRiCH预测的有利和不利结果组中真实分类与错误分类的基因本体(Gene Ontology, GO)分析比较。
a. 有利结果预测的基因本体分析:
-
真实有利预测组(true favorable-predicted, n = 134):
- 此组主要富集了与免疫反应相关的基因。这表明在预测为有利结果的患者中,免疫反应相关的基因表达水平较高,这可能与较好的治疗反应和预后相关。
-
错误有利预测组(false favorable-predicted, n = 25):
- 此组富集了与核糖体和线粒体相关的基因。这可能意味着这些基因的高表达水平在预测中被错误地关联了有利的结果。
b. 不利结果预测的基因本体分析:
-
真实不利预测组(true poor-predicted, n = 19):
- 此组特征为与细胞外基质相关的基因富集。细胞外基质的基因与肿瘤的侵袭性和耐药性有关,这可能与不利的治疗反应相关。
-
错误不利预测组(false poor-predicted, n = 30):
- 此组同样富集了与线粒体和核糖体相关的基因。这可能表明这些基因的表达水平在预测中被错误地关联了不利的结果。
综合分析:
-
基因表达与预测结果的一致性:
- 在真实预测组中,有利和不利预测组分别与免疫反应和细胞外基质相关的基因表达水平相关,这与已知的生物学过程和肿瘤行为相一致。
-
基因表达与预测结果的不一致性:
- 在错误预测组中,核糖体和线粒体相关基因的富集表明,这些基因可能不是预测治疗反应的理想标志物,或者它们在预测中的权重需要调整。
-
生物学意义:
- 免疫反应基因的富集可能与对铂基化疗的敏感性有关,因为免疫细胞可以影响肿瘤微环境和对治疗的反应。
- 细胞外基质相关基因的富集可能与肿瘤的侵袭性和耐药性有关,这可能导致对治疗的不利反应。
-
方法学考量:
- 使用ClusterProfiler进行GO分析和Benjamini–Hochberg程序进行多重测试校正,这些是生物信息学中常用的工具和方法,用于识别和解释基因表达数据中的生物学模式。
图7的分析结果提供了对PathoRiCH预测背后分子机制的深入理解,并可能有助于改进预测模型,特别是在区分真实和错误预测方面。通过识别和解释这些基因表达模式,可以更好地理解HGSOC患者对治疗的反应差异。
接下来,研究团队比较了“真正不良预测”(n = 19)和“错误不良预测”(n = 30)组的RNA表达模式。
在“真正不良预测”组中,发现了17个上调基因和26个下调基因(补充图7b和补充数据2)。这些基因与基质组织相关,如MYO16、ANKRD2、LRRCl4B和MYO7B,在“真正不良预测”组中上调。
最后,对“真正有利”(n = 165)和“真正不良”(n = 44)组的DEG和GO进行了分析(补充图7c、8和补充数据3)。
有趣的是,免疫反应相关基因,包括PRSS16,在“真正有利”组中富集,而细胞外基质相关基因在“真正不良”组中富集,这表明PathoRiCH有效地捕获了与这两个组相关的关键特征。
2-7:BRCA mutation and HRD status prediction
为了预测BRCA突变状态,研究团队使用了SEV和SMC队列(n = 348,WSI n = 670)来训练MIL模型,并在TCGA队列(n = 284,WSI n = 516)上进行了验证。
癌症分割区域20×放大倍数的模型显示出最高的AUC-ROC值,为0.526(补充表7)。
HRD状态的预测基于三种当前已发表的HRD算法,并仅使用TCGA队列(n = 284,WSI n = 516)的数据。
使用Telli等人提出的HRD状态算法,癌症分割区域5×放大倍数的模型显示出最佳性能,AUC-ROC值为0.524(补充表8)。使用Takaya等人提出的HRD状态算法,癌症分割区域20×放大倍数的模型显示出最佳性能,AUC-ROC值为0.556。然而,无法成功使用Perez-Villatoro等人提出的算法训练模型以确定HRD状态,这可能是因为评估的病例数量较少(83/284,29.2%)。
3、Discussion
本研究提出的PathoRiCH分类器,仅使用组织病理学图像来预测HGSOC的无铂间期(PFI)。
与之前利用组织学特征开发预测模型的研究相比,只有Yu等人和Laury等人的研究旨在预测PFI。尽管他们使用卷积神经网络(CNN)架构取得了良好的性能,但他们存在一些局限性,如研究人群异质性(包括Yu等人的低级别浆液性癌)、样本量小(Laury等人的训练队列n = 30)和缺乏外部验证(两者均无)。
相比之下,PathoRiCH采用了双流(DS)MIL,比CNN更适合于从弱标记的WSI中发现预测性形态学,并且比传统的MIL在解决分类错误和过拟合方面更为有效。此外,我们的模型在精心整理的队列上进行训练,并在两个外部数据集(TCGA和SMC)上进行验证。
为了识别最佳模型而不在内部队列上过拟合,在外部(TCGA)队列中比较了六个训练模型的性能。
尽管在内部验证队列中,5×模型在全部组织和癌症分割区域中都表现出最高的性能,但在外部验证队列中,20×模型的表现最佳。这表明,与5×图像中看到的结构特征相比,20×图像中可见的细胞学特征对于预测HGSOC的化疗反应性更为关键。
值得注意的是,5×模型在内部队列中的优越性能可以归因于对低分辨率图像的过拟合。研究还发现,多尺度模型在全部组织和癌症分割区域MIL中表现出介于5×和20×模型之间的性能。尽管多尺度学习通常预期通过利用单尺度模型的优势来提高性能,但它可能导致性能下降,原因包括模型交互、数据特征或预测目标等。在预测HGSOC的化疗反应性的背景下,20×单尺度模型被证明是最佳的。
【切入点:确定自己研究的课题,采用哪种模型对应哪种放大倍率,效果最好】
四个亚组
PathoRiCH-based分类与BRCA突变或HRD状态无关,因为其他因素可能影响铂类治疗的反应,而不仅仅是同源重组机制。
由于PathoRiCH与分子特征不相关,因此它们在结合时可以协同作用。因此,使用PathoRiCH+BRCA + HRD组合将HGSOC患者分为四个亚组,这种分类比仅使用分子生物标志物提供了更高的预测能力。
尽管铂类方案一直是所有HGSOC患者标准的首选全身治疗,但有利-BRCA/HRD阳性组对铂类药物高度敏感,这表明对于这一组患者,早期使用PARP抑制剂和延长监测频率可能是有益的。相反,PathoRiCH预测的不良反应组对铂类药物高度耐药,因此将这些患者及时纳入挽救治疗的临床试验可能是有益的。
此外,PathoRiCH在生存和Cox回归分析中的预测能力优于当前的分子生物标志物。与分子生物标志物相比,PathoRiCH也是一个成本效益较高的解决方案,因为它只需要WSI图像,而不需要额外的组织测试。因此,它可以轻松地整合到初始病理诊断实践中,为患者提供风险分层。
可视化分析
可视化分析显示,“肿瘤内淋巴细胞浸润”是有利组的一个独特组织学特征,而“核着色过深、粘连性差和纺锤状特征”和“细胞质空泡和微囊性变化”是不良反应组独特的特征。高度浸润的肿瘤浸润淋巴细胞(TILs)是一种与各种癌症类型中铂类治疗的积极预后和反应相关的已知特征。
另一方面,减少细胞间粘附和纺锤状形态是上皮间质转化(EMT)的特征,这种转化被认为是对铂类为基础的化疗产生抵抗性的因素。
空间转录组学
有趣的是,为每个组识别的组织学特征也与转录组分析相关:正确预测的有利组富集了免疫反应相关途径,而正确预测的不良组富集了细胞外基质相关途径,这些途径与EMT相关。TIL和EMT特征此前已被报道与铂类治疗反应相关,但尚未建立标准化的标准,并且其形态学评估的主观性阻碍了它们整合到病理诊断中。在这种情况下,PathoRiCH创新性地采用了它们来进行形态学分类。
此外,PathoRiCH在整个端到端学习过程中识别已知预后特征的能力增强了其决策的可靠性。另一方面,“细胞质空泡和微囊性变化”是不良反应组特有的组织学特征,这一特征在恶性中很少被报道。由于其临床意义尚不明确,这一组织学特征的生物学起源需要进一步研究,这需要在未来研究中应用先进的空间转录组学。
本研究存在一些局限性
首先,PathoRiCH在外部验证队列中显示出接近0.6的AUC-ROC值,表明模型几乎无法区分两个组别。这表明仅基于组织病理学图像对HGSOC进行分类存在挑战,这在一定程度上是因为HGSOC已经根据其组织学特征被分类为高级别。
为了确定我们模型的稳健性并将其引入临床实践,进行额外的多中心验证和深入解读模型是至关重要的。其次,关于外部(TCGA)队列中地面实况和预测响应组的混淆矩阵,大量错误预测的病例被识别出来,这很可能是因为内部训练数据集偏向于有利地面实况组。
为了解决这种不平衡,应将更多对不良治疗反应的病例纳入训练数据集,以平衡两个组别,更好地训练与不良治疗反应相关的特征。
第三,TCGA队列中没有包含PARP抑制剂的使用信息。然而,TCGA队列的临床数据仅收集到2010年,而PARP抑制剂直到2014年才被FDA批准并引入卵巢癌治疗。因此,TCGA队列预计对PARP抑制剂是陌生的。
第四,转录组分析使用了批量RNA测序数据,这限制了该分析。为了关联PathoRiCH预测组的组织学和分子特征,作者正在进行空间转录组学,以用于未来的研究。
最后,模型在预测BRCA突变和HRD状态方面表现不佳——训练队列中只有少数患者有BRCA突变和HRD状态数据——大型的BRCA和HRD聚焦队列可能有助于改进模型。
4、Methods
4-1:Cohorts
SEV队列
从2005年11月至2022年6月期间在延世大学医院(韩国首尔)接受治疗的394名HGSOC患者(WSI,n = 754)的数据被检索。患者在诊断时为III-IV期,接受过主要减瘤手术,随后进行了至少六周期的辅助铂类化疗,且在诊断后的前两年内未接受PARP抑制剂治疗。
TCGA-OV数据集
585名卵巢浆液性囊腺癌患者中,选择具有TP53突变、临床结果数据(包括PFI)和H&E WSI的患者作为TCGA队列的一部分(https://portal.gdc.cancer.gov/)。在排除无法评估的幻灯片图像的案例后,284名(WSI n = 516)I-III期HGSOC患者被纳入分析,这些患者接受了主要减瘤手术和铂类辅助化疗。
SMC队列
从2018年1月至2021年11月在三星医疗中心(韩国首尔)接受治疗的136名HGSOC患者(WSI,n = 136)的数据被检索。患者在诊断时为I-IV期,接受过主要减瘤手术,随后进行了至少六周期的辅助铂类化疗,且在诊断后的前两年内未接受PARP抑制剂治疗。SEV和SMC队列的临床病理数据从医疗记录和病理报告中获得。
4-2:PFI, BRCA mutation, and HRD status prediction
为了预测PFI(无铂间期),患者被分为二元响应组:
- 不良反应组:“铂耐药”(PFI ≤ 6个月)和“部分铂敏感”(PFI 6–12个月)的患者
- 有利反应组【27,28】:“铂敏感”(PFI 12–24个月)和“非常铂敏感”(PFI > 24个月)的患者
为了训练和内部验证,在SEV队列(n = 394)中进行了五折交叉验证,并在独立的TCGA(n = 284)和SMC(n = 136)队列中进行了外部验证。
对于BRCA突变预测,在SEV和SMC队列中混合了有可用BRCA突变状态数据的患者(n = 348),并在TCGA队列(n = 284)中进行了验证。
SEV和SMC数据集不包含HRD结果,只有TCGA队列(n = 284)用于训练和验证HRD状态,其中训练和验证的比例为8:2。
HRD状态预测使用了三种不同的HRD算法【33-35】。
4-3:Slide preparation and preprocessing
所有病例都进行了WT-1和p53免疫组织化学染色,以进行初始病理诊断。
所有WSI(全切片图像)都由妇科病理学家(E. Park, N.H. Cho, 和 H.-S. Kim)进行回顾性审查,并选择了最具代表性的高肿瘤细胞性的切片,SEV队列中每名患者的中位数切片数量为1.7(范围1-5),SMC队列中每名患者为1张。
所有切片均使用Aperio AT2扫描仪(Leica Biosystems, Wetzlar, Germany)在20×放大倍数(0.50 µm/pixel)下进行扫描。对于TCGA队列,所有H&E切片图像来自FFPE或新鲜冷冻的手术切除标本,在系统性治疗前进行。移除了没有可识别肿瘤组织、低分辨率图像或大笔迹、组织折叠或模糊等伪影的切片。
WSI通常太大,无法作为深度学习模型的输入,因此必须将图像分割成tile。过滤掉了小于30%组织面积的tile,以从WSI中提取仅包含组织的tile。
创建了两种类型的tile:
- 一种是分割成224 × 224像素以生成20× tile
- 另一种是分割成896 × 896像素并调整大小为224 × 224像素以生成5× tile
对于多尺度MIL模型,5×和20× tile是按照层次结构构建的。
知识点补充:免疫组化
在病理学中,免疫组织化学(Immunohistochemistry, IHC)是一种用于检测组织样本中特定蛋白质的实验室技术。通过使用特定的抗体与样本中的蛋白质发生反应,然后使用染色剂使结合的抗体可见,从而在细胞或组织中特定蛋白质的位置和表达水平得以可视化。
WT-1和p53是两种在肿瘤病理诊断中常用的蛋白质标志物:
-
WT-1:WT-1(Wilms’ tumor 1)是一种转录因子,其基因突变与Wilms瘤(一种肾脏肿瘤)有关。WT-1蛋白的表达在某些类型的癌症中升高,尤其是在卵巢癌中,它可以作为一个有用的标志物来帮助诊断和分类肿瘤。
-
p53:p53是一种肿瘤抑制蛋白,其基因突变在超过50%的人类癌症中被发现。p53蛋白的异常表达通常与肿瘤的发生、发展和预后相关。在病理诊断中,p53的免疫组织化学染色可以帮助识别肿瘤细胞中p53蛋白的过表达或缺失,这可能指示肿瘤的侵袭性和治疗响应。
在本研究中,所有病例都进行了WT-1和p53免疫组织化学染色,目的是为了:
- 进行初始病理诊断:帮助病理学家通过观察这些蛋白质的表达模式来识别和分类肿瘤。
- 确定肿瘤的特定亚型或特征:某些肿瘤亚型的诊断可能依赖于特定蛋白质的表达情况。
- 评估预后和治疗响应:WT-1和p53的表达水平可能与肿瘤的侵袭性、转移潜力和对特定治疗的敏感性相关。
通过这些免疫组织化学染色,研究人员和病理学家可以更好地了解肿瘤的生物学特性,为患者提供更准确的诊断和治疗建议。
【切入点:免疫组化也有推文介绍过,可以引入AI,所以我们在模仿这篇文章时,完全可以考虑是否在免疫组化阶段引入AI,毕竟要为两个队列的所有切片进行免疫组化】
4-4:Model development
模型开发过程中,依次应用了三个流程:
- 自动癌症分割
- 对比自监督学习
- 多实例学习(MIL)建模
所有模型都在单个NVIDIA RTX A6000 48GB GPU上进行训练。
UNetPlusPlus自动分割
首先,为了自动从HGSOC WSI中提取癌症分割区域,开发了一个基于UNetPlusPlus的癌症分割模型,使用ResNet34作为编码器。
UNetPlusPlus通过嵌套密集skip路径连接编码器和解码器,使其成为医学图像分割的强大架构。模型使用5×放大倍数的补丁图像(448 × 448 μm,224 × 224像素)进行训练,这些图像来自多个机构提供的810例乳腺癌浸润性导管癌活检切片(tile n = 8130)。
所有训练的补丁图像都由经验丰富的病理学家进行了细胞水平标注。
排除癌症面积小于10%的补丁图像后,共创建了8130个补丁图像。模型训练了100个epochs,使用带有权重衰减的SGD优化器和Dice损失函数。
在HGSOC WSI中,模型能够自动区分癌症区域和非癌症区域。为了定量评估HGSOC WSI中癌症分割的性能,从SEV和TCGA队列中随机选择了10%的案例(n = 39和n = 28),并由经验丰富的病理学家手动注释了250 × 250 μm的区域。
【切入点:随机选取10%的案例,非常不利于项目的复现以及模型的推广,所以我们完全可以在此处引入算法,确定筛选数据的方法,例如主成分分析、特征筛选等等】
可视化
其次,我们使用了SimCLR自监督ResNet18 CNN模型来可视化5×和20×的组织学图像。SimCLR算法允许CNN通过最大化同一数据示例的不同增强视图之间的协议来学习图像表示。模型使用CAMELYON 16和CAMELYON 17数据集进行训练。
CAMELYON 16和CAMELYON 17是两个公开的医学图像数据集,它们主要用于支持乳腺癌淋巴结转移的自动检测研究。这些数据集来源于Camelyon grand challenge比赛,这是一个旨在促进使用深度学习和计算机视觉技术来改善癌症诊断的竞赛和研究项目。
CAMELYON 16数据集:
- 包含来自乳腺癌患者的全切片图像(Whole Slide Images, WSIs),这些图像包括淋巴结转移和非转移的组织样本。
- 该数据集被用于训练和验证深度学习模型,以自动识别图像中的淋巴结转移区域。
CAMELYON 17数据集:
- 与CAMELYON 16类似,CAMELYON 17也是一个包含乳腺癌患者WSIs的数据集,但它包含更多的样本或提供更详细的注释。
- 该数据集同样用于开发和评估用于淋巴结转移检测的算法。
CAMELYON数据集的公开可用性,为全球的研究社区提供了一个宝贵的资源,以推动癌症诊断技术的发展。
应用DS-MIL进行预测任务
DS-MIL通过使用金字塔融合机制提高了多尺度WSI特征的分类和定位精度。
在MIL中,使用对比自监督CNN模型作为组织学特征提取器,以产生强大的表示。MIL模型训练了200个epochs,使用带有权重衰减的AdamW优化器、余弦退火学习率和交叉熵损失函数。
与之前类似的研究不同,采用的MIL模型预测了有利组和不良组的可能性,以便更精确和清晰地分析有利组和不良组之间的组织学差异。
Youden指数
为了根据MIL模型的有利和不良组预测概率定义最终组别,作者使用Youden指数设置了最优阈值,以找到最大化真阳性率和假阳性率差异的点:
- 有利组的阈值设置为0.623
- 不良组的阈值设置为0.377
因此,任何预测概率超过0.623的有利预测都被归类为有利组,任何预测概率超过0.377的不良预测都被归类为不良组。如果预测概率都低于或高于这些阈值,患者将被归类为具有最大预测概率的组别。
知识点补充:Youden指数
在医学诊断和分类任务中,确定一个合适的阈值来将患者或样本分为不同的组别是一个关键步骤。在多实例学习(Multiple Instance Learning, MIL)模型中,这个阈值用于基于模型预测的概率将样本分为有利(例如,对治疗有良好反应)和不利(例如,对治疗反应不佳)组。
Youden指数是一种常用的方法,用于选择最佳阈值。它基于以下两个原因:
- 最大化敏感性(真阳性率):即模型正确预测为有利组的样本比例。
- 特异性(真阴性率):即模型正确预测为不利组的样本比例。
Youden指数计算为:
Youden指数
=
敏感性
+
特异性
−
1
\text{Youden指数} = \text{敏感性} + \text{特异性} - 1
Youden指数=敏感性+特异性−1
- 敏感性:真阳性数除以真阳性和假阴性的总数。
- 特异性:真阴性数除以真阴性和假阳性的总数。
Youden指数的值范围在-1到1之间,值为1表示完美分类,值为0表示没有区分能力。选择Youden指数最大的阈值意味着在敏感性和特异性之间找到了最佳平衡点,这样可以最大化正确分类的样本数,同时最小化误分类的风险。
在本研究中,作者使用Youden指数来设置MIL模型的预测阈值,这样做的目的是:
- 确保模型的预测结果既具有较高的真阳性率(能够准确识别出有利组的样本),又具有较高的真阴性率(能够准确排除不利组的样本)。
- 通过这种方式,模型能够更精确地对患者的治疗反应进行分类,从而为临床决策提供更可靠的信息。
通过使用Youden指数确定的阈值,研究者能够定义最终的组别,这有助于在临床实践中实现更个性化的治疗策略,以及为患者提供更准确的预后信息。
开源代码
- 程序使用Python编程语言(版本3.8)开发。
- 模型使用PyTorch v1.10和Scikit-learn v1.0.2实现。
- 多实例学习过程基于DSMIL。
- 特征提取过程中的对比学习基于SimCLR(可在https://github.com/sthalles/SimCLR找到),具有ResNet18后端架构。
- 癌症分割模型基于使用segmentation-models-pytorch v0.3.3实现的UNetPlusPlus,具有ResNet34后端架构。
- 数学运算使用Numpy v1.23.4实现。
- WSI的处理使用Openslide-Python v1.3.0。
- 补丁图像处理基于OpenCV-Python v4.7.0.68。
- 降维和聚类过程使用Scikit-Learn实现。
4-5:Patient level classification
在切片级评估中,由于患者可能具有多个切片,每个评估的切片可能预测患者属于不同的组别。
在这种情况下,程序涉及计算每个患者的有利预测概率和不良预测概率的平均值。
后续步骤遵循与切片级预测中使用的最终组定义相同的方法论。
4-6:Ensemble analysis
为了进行集成分析,作者采用了集成技术,通过软投票或硬投票的方式,将5×和20× MIL模型的结果聚合在一起【54】。软投票集成模型的阈值使用Youden指数设置,有利组的阈值为0.533,不良组的阈值为0.467。
集成分析(Ensemble analysis)是一种将多个模型的预测结果结合起来,以提高整体预测性能或鲁棒性的方法。在本研究中,作者使用了两种不同的投票策略——软投票(Soft voting)和硬投票(Hard voting)——来集成5×和20×放大倍数的多实例学习(MIL)模型的结果。
软投票(Soft voting):
- 软投票是一种集成技术,它通过计算所有模型预测概率的平均值来确定最终的预测类别。
- 在软投票中,每个模型的预测概率被赋予相同的权重,并被加权平均,然后应用一个阈值来确定最终的分类。
- 这种方法考虑了所有模型的意见,并通过平均来减少个别模型可能存在的随机误差或偏差。
硬投票(Hard voting):
- 硬投票是另一种集成技术,它基于多数模型的预测结果来确定最终的类别。
- 硬投票可以采用不同的逻辑,例如“AND”条件或“OR”条件:
- AND条件:只有当所有模型一致预测为不利组时,最终预测才被标记为不利组。
- OR条件:如果任何一个模型预测为不利组,最终预测就被标记为不利组。
- 硬投票强调模型之间的一致性,但可能对个别模型的预测过于敏感。
集成分析的目的:
- 提高准确性:通过结合多个模型的预测,集成分析可能提高整体的预测准确性。
- 增加鲁棒性:集成分析可以减少单个模型可能的过拟合或欠拟合问题,使模型在新数据上的泛化能力更强。
- 平衡偏差和方差:软投票和硬投票可以平衡不同模型的偏差和方差,以达到更好的预测性能。
在本研究中,作者通过集成分析,旨在利用不同放大倍数的MIL模型的优势,以获得更可靠的预测结果。这种方法可以帮助医生更好地理解患者的治疗反应,并可能指导更精确的临床决策。
4-7:High-score patch extraction and clustering analysis
在提取高评分补丁和聚类分析中,每个补丁图像被表示为一个一维特征向量,使用对比自监督CNN的最终卷积层的全局平均池化输出。
从所有补丁注意分数中获取最大值和最小值,并通过对注意分数应用最小-最大规范化来获得归一化的注意分数。
使用t-SNE算法对一维特征向量进行降维处理后,使用高斯混合模型(GMM)算法进行聚类。初始的GMM集群数量根据GMM和t-SNE的启发式和默认参数分别设置。
知识点补充:提取高评分补丁和聚类分析
在进行高评分补丁提取和聚类分析的过程中,研究者采取了以下步骤来将图像数据转换为可以用于机器学习模型的格式:
-
特征向量表示:
- 每个补丁图像被转换成一个一维特征向量。这是通过提取图像的特征表示来实现的,这些特征捕获了图像的重要信息。
-
使用对比自监督CNN:
- 对比自监督卷积神经网络(CNN)是一种训练方法,它不依赖于标记的数据,而是通过学习图像的不同视图之间的一致性来提取特征。在这种情况下,CNN模型经过训练,能够识别和区分不同的组织病理学特征。
-
全局平均池化:
- 在CNN中,全局平均池化(Global Average Pooling, GAP)是一种技术,它将卷积层的输出在空间维度上进行平均,从而为每个图像生成一个固定大小的一维特征向量。这种池化方法减少了特征的空间维度,同时保留了重要的信息。
-
特征向量的生成:
- 最终卷积层的输出通过全局平均池化处理后,生成了每个补丁图像的一维特征向量。这些特征向量包含了图像块的高级特征表示,这些特征可以用于后续的分析和模型训练。
-
聚类分析:
- 这些一维特征向量随后可以用于聚类分析,例如使用高斯混合模型(Gaussian Mixture Models, GMMs)来识别图像块中的模式或分组。聚类可以帮助研究者发现数据中的结构,例如不同的组织学特征或与疾病相关的模式。
-
特征向量归一化:
- 在聚类或其他机器学习任务之前,通常需要对特征向量进行归一化处理,以确保所有特征都在相同的尺度上,避免某些特征由于数值范围较大而对模型结果产生不成比例的影响。
通过这种方法,研究者能够将复杂的图像数据转换为可以用于进一步分析的数值表示,这有助于自动化病理图像的分析过程,并可能揭示与疾病相关的新的生物标志物。
知识点补充:对获取和规范化注意分数的步骤的解释
在图像处理和分析中,特别是在使用深度学习模型时,“注意分数”(attention scores)通常指的是模型在做出预测时对图像中不同区域的关注度或重要性的度量。
-
获取最大值和最小值:
- 首先,从所有补丁的注意分数中找出最大值和最小值。这些极值可以为后续的规范化步骤提供参考范围。
-
最小-最大规范化(Min-Max Normalization):
- 这是一种归一化技术,将所有注意分数调整到一个统一的范围,通常是0到1之间。规范化公式为:
- Normalized Score = Score − Min Max − Min \text{Normalized Score} = \frac{\text{Score} - \text{Min}}{\text{Max} - \text{Min}} Normalized Score=Max−MinScore−Min
- 这个公式将每个注意分数(Score)减去最小值(Min),然后除以最大值(Max)与最小值之间的差值,从而确保所有分数都落在0到1的范围内。
-
归一化的目的:
- 归一化确保了不同补丁的注意分数可以在相同的尺度上进行比较,这有助于后续的分析,如聚类或可视化。
- 它消除了由于不同补丁的注意分数范围差异带来的偏差,使得模型对所有补丁的评估更加公平。
-
应用场景:
- 在聚类分析中,归一化的注意分数可以帮助更准确地识别和分组具有相似特征的补丁。
- 在可视化中,归一化的分数可以更容易地展示哪些区域是模型在做出预测时特别关注的。
-
对模型性能的影响:
- 通过关注归一化后的高注意分数,研究者可以识别模型预测中最关键的特征区域,从而更好地理解模型的决策过程。
-
数据预处理:
- 归一化是数据预处理的重要步骤之一,有助于提高机器学习模型的性能和泛化能力。
在本文中,通过获取所有补丁注意分数的最大值和最小值,并应用最小-最大规范化,研究者能够确保在进一步分析中使用的数据是标准化的,这有助于更准确地解释和利用模型的注意力图。
知识点补充:使用t-SNE和GMM进行聚类分析的步骤的解释
在使用高斯混合模型(Gaussian Mixture Model, GMM)进行聚类分析之前,通常需要对数据进行降维处理,因为高维数据在很多情况下难以直观理解和处理。
-
一维特征向量:
- 首先,每个补丁图像被表示为一个一维特征向量,通常是通过深度学习模型(对比自监督CNN)提取的。
-
t-SNE算法:
- t-SNE(t-分布随机邻域嵌入)是一种非线性降维技术,用于将高维数据集嵌入到低维空间(通常是二维或三维),同时尽可能地保留数据的局部结构。
- 这种降维有助于在低维空间中可视化高维数据的特征,并为后续的聚类分析准备。
-
降维处理:
- 应用t-SNE算法对一维特征向量进行降维处理,生成低维表示,这些表示能够捕捉原始高维数据的重要特征。
-
GMM算法:
- GMM是一种概率模型,它假设数据由多个高斯分布混合而成,每个高斯分布对应一个聚类。
- GMM通过估计数据点属于每个聚类的概率来对数据进行聚类。
-
初始GMM集群数量:
- 在应用GMM之前,需要确定初始的聚类数量,即假设数据由多少个高斯分布混合而成。
- 这个数量可以根据GMM的启发式方法确定,例如肘部法则(Elbow Method),或者使用t-SNE降维后的数据分布来辅助决定。
-
启发式和默认参数:
- 启发式方法是基于经验或数据驱动的方法,用于在没有明确指导的情况下做出决策。
- 默认参数是算法在没有用户指定参数时使用的参数值,通常是基于算法设计者的经验或算法的通用应用场景。
-
聚类分析:
- 使用GMM算法对t-SNE降维后的数据进行聚类分析,从而将数据点分配到不同的聚类中。
-
结果解释:
- 聚类结果可以揭示数据中的结构和模式,例如在病理学图像中,可能揭示与疾病相关的不同组织学特征。
通过结合t-SNE的降维能力和GMM的聚类能力,研究者可以在低维空间中探索和解释高维数据的特征,进而识别和分析数据中的潜在模式和结构。在本文中,这种方法被用于分析图像补丁的特征,以支持病理学诊断和研究。
【切入点:聚类分析和特征降维的过程,可以用最新的模型进行替换,所以后续我也会更新这一方面的文章,争取让每一个模块,都能用上性能最好且最新的模型】
4-8:TCGA transcriptome analysis
- 在TCGA转录组分析中,所有对TCGA数据的分析都是使用R语言(版本4.2.1)进行的。
- 从TCGA-OV项目中的421例原发肿瘤标本的RNAseq STAR计数数据被下载并使用TCGAbioLinks(版本2.31.1)进行处理【55】。
- 在PathoRiCH中使用的284名TCGA患者中,有208名患者具有可用的RNAseq结果。
- 通过使用edgeR(版本3.38.4)中的默认filterByExpr函数过滤掉表达不足的基因。
- 并使用calcNormFactors函数对表达计数进行TMM(Trimmed Mean of M-values)标准化【56】。
- TMM数据通过limma(版本3.52.4)中的voom函数转换为log2-counts per million【57】。
- 使用limma中的lmFit、eBayes和topTable函数进行模型拟合和提取差异表达基因(DEGs)。
- 使用EnhancedVolcano包(版本1.14.0)创建火山图,以绝对log2 fold change >1和p < 0.01为阈值【58】。
- 通过clusterProfiler(版本4.4.4)中的gseGO函数进行基因集富集分析,比较两个响应组。
- 使用Benjamini–Hochberg方法进行多重测试校正【58】。
知识点补充:TMM标准化
在转录组测序(RNA-Seq)数据分析中,原始的表达计数数据通常需要进行标准化处理,以确保不同样本间的可比性。TMM(Trimmed Mean of M-values)标准化是一种常用的方法,用于调整测序深度和基因长度的影响,从而使得不同样本的表达水平可以公平地进行比较。
以下是对使用calcNormFactors
函数进行TMM标准化的步骤的解释:
-
表达计数数据:
- RNA-Seq实验生成的数据通常包括每个基因的表达计数,即在测序过程中该基因被测到的次数。
-
测序深度和基因长度的影响:
- 不同样本的测序深度(即测序的总读段数)可能不同,导致表达计数的直接比较存在偏差。
- 基因的长度也会影响表达计数,较长的基因天然会产生更多的读段。
-
TMM标准化:
- TMM方法通过计算每个样本的归一化因子(normalization factor),调整表达计数,以消除测序深度和基因长度的影响。
-
calcNormFactors
函数:- 该函数是
edgeR
包中的一个函数,用于根据TMM方法计算所需的归一化因子。 - 函数会评估每个样本的表达水平,然后计算出一个因子,用于将表达计数调整到统一的标准。
- 该函数是
-
计算归一化因子:
- 函数内部会计算每个基因在所有样本中的M值(对数比值),然后对这些M值进行截断(去除极端值),计算剩余M值的均值,最终得到每个样本的归一化因子。
-
应用归一化因子:
- 将计算得到的归一化因子应用于原始的表达计数数据,从而得到每个样本的标准化表达水平。
-
结果:
- 标准化后的数据可以用于后续的数据分析,如差异表达分析,以确定不同样本或条件之间的基因表达差异。
-
目的:
- TMM标准化的目的是确保不同样本间的基因表达水平可以公平、准确地进行比较,从而提高数据分析的可靠性。
在转录组学研究中,TMM标准化是一个关键步骤,它帮助研究者更准确地识别和解释生物学上有意义的基因表达变化。
4-9:BRCA genetic tests
在SEV和SMC队列中,BRCA突变状态是通过外周血和肿瘤样本进行评估的。
知识点补充:BRCA突变状态
BRCA突变状态指的是个体BRCA1或BRCA2基因的遗传变异情况。
BRCA1和BRCA2是两种重要的肿瘤抑制基因,它们在维持细胞的遗传稳定性和防止癌症发展方面起着关键作用。当这些基因发生突变时,它们的正常功能可能会受到影响,从而增加携带者发展某些类型癌症的风险,特别是乳腺癌和卵巢癌。
以下是关于BRCA突变状态的几个关键点:
- 遗传性突变:
- BRCA突变可以是遗传的,即从父母遗传给子女,也可以是个体在一生中获得的体细胞突变。
- 突变类型:
- 突变可以是点突变、插入、缺失或其他结构变异,这些变异可能影响基因编码的蛋白质的功能。
- 风险增加:
- 携带BRCA1或BRCA2基因突变的个体患乳腺癌和卵巢癌的风险显著增加。
- 检测方法:
- BRCA突变状态可以通过基因检测来确定,常用的方法包括Sanger测序和下一代测序(NGS)。
在临床和研究环境中,了解BRCA突变状态对于个性化医疗和精准医疗策略的制定至关重要。
知识点补充:评估BRCA(乳腺癌易感基因)突变状态的过程涉及的步骤
-
样本收集:
- 从参与研究的患者那里收集两种类型的生物样本:外周血和肿瘤组织样本。
-
外周血样本:
- 外周血样本主要用于检测个体是否携带遗传性的BRCA突变,这些突变可能增加患乳腺癌和卵巢癌的风险。
-
肿瘤样本:
- 肿瘤样本的BRCA突变分析有助于了解肿瘤细胞中的基因变化,这可能与癌症的发展和治疗响应有关。
-
基因检测方法:
- 使用Sanger测序或下一代测序(Next-Generation Sequencing, NGS)来检测BRCA1和BRCA2基因的突变。
- Sanger测序是一种传统的DNA测序方法,适用于检测已知的或特定的基因突变。
- NGS是一种高通量测序技术,可以同时检测大量基因的多个突变。
-
数据分析:
- 对测序结果进行生物信息学分析,使用如Burrows-Wheeler Aligner、Genome Analysis Toolkit、Ensembl Variant Effect Predictor等工具来识别和解释突变。
-
突变的确定:
- 通过分析,确定样本中是否存在BRCA基因的突变,包括编码区、启动子区或剪接位点的变异。
-
遗传咨询和解读:
- 由经验丰富的遗传学家对检测结果进行最终解读,并提供遗传咨询。
-
临床意义:
- 确定BRCA突变状态对于患者的治疗选择和预后评估非常重要。例如,BRCA突变阳性的患者可能对特定的治疗(如PARP抑制剂)有更好的响应。
-
研究目的:
- 在SEV和SMC队列中评估BRCA突变状态,可以帮助研究者了解这些突变与高级别浆液性卵巢癌(HGSOC)的临床特征和治疗响应之间的关系。
通过这种综合的基因检测和分析方法,研究人员能够更全面地了解参与研究患者的遗传背景和肿瘤特征,为个性化医疗提供支持。
通过Sanger测序或下一代测序(NGS)进行胚系BRCA测试。Sanger测序使用3730 DNA分析仪和BigDye Terminator v3.1循环测序试剂盒(Applied Biosystems, Foster City, CA, USA)进行,然后使用Sequencher 5.3软件进行分析。
在部分患者中,使用NextSeq 550仪器(Illumina)进行定制面板的NGS,包括BRCA1和BRCA2基因,读长为2 × 151 bp。
生物信息学分析使用Burrows-Wheeler Aligner、Genome Analysis Toolkit、Ensembl Variant Effect Predictor和自定义管道进行。经验丰富的遗传学家进行了最终解读。
对于肿瘤BRCA,根据制造商的说明,使用Maxwell CSC DNA FFPE Kit(Promega, Madison, WI, USA)从肿瘤样本中提取基因组DNA,并使用Nestxeq550系统(Illumina)和TruSight Oncology 500面板(Illumina)进行NGS。
对于突变分析,将FASTQ文件上传到Illumina BaseSpace软件(Illumina)进行变异解释。仅对编码区域、启动子区域或具有最小3%读取量和250个读取深度的剪接变体进行变异分析。
4-10:Statistics and reproducibility
在统计学和可重复性方面,本研究未采用统计方法预先确定样本量,所有可用样本均被纳入模型开发和验证。
- 分析中未排除任何数据,且分析未进行随机化。
- 在最终模型评估前,研究人员对测试集中样本的标签进行了盲化处理。
- 使用χ2检验来评估分类变量之间的相关性。
- 在生存分析中估计了Kaplan–Meier生存曲线。
- 比较差异时使用了双侧未配对t检验、Mann–Whitney U检验和Wilcoxon秩和检验。
- 所有分析中,p < 0.05被认为具有统计学意义,所有分析均为双尾检验。
- 所有数据均使用R软件(版本4.2.1)进行分析。
知识点补充:p值&双尾检验
在统计学中,p值(或概率值)是用于测试假设检验结果发生的概率。它帮助研究者确定观察到的数据是否不太可能仅仅是由随机变化引起的,而更可能是由实际的效应或差异驱动的。
- 统计学意义:
- 当p值小于0.05时,研究结果被认为是具有统计学意义的。这意味着观察到的效应或差异不太可能(小于5%的概率)是纯粹由偶然因素造成的。
- 双尾检验(Two-tailed test):
- 双尾检验是指在假设检验中,研究者同时考虑了观测值在假设均值的两侧的分布情况。换句话说,这种检验不关心效应的方向(正向或负向),只关心效应是否显著。
- 例如,在比较两组数据时,双尾检验会考虑实验组的均值是否显著高于或低于对照组的均值。
- 单尾检验(One-tailed test):
- 与之相对的是单尾检验,它只考虑效应在假设均值的一侧,即研究者事先设定了效应的方向。
- p值的解释:
- p值越小,拒绝零假设(null hypothesis)的证据越强。零假设通常表示没有效应或差异(例如,两组之间没有差异)。
总之,p值和双尾检验是评估研究结果统计学意义的重要工具,但它们需要结合其他统计和科学证据来全面解释研究结果。
5、Data & Code
数据可用性
- TCGA数据集通过TCGA门户网站(https://portal.gdc.cancer.gov)公开可访问。
- CAMELYON 16和CAMELYON 17数据集通过Camelyon大挑战网站(https://camelyon16.grandchallenge.org 和 https://camelyon17.grand-challenge.org 分别)公开可访问。
SEV和SMC队列的NGS数据集用于胚系BRCA测试已存档,访问编号为PRJNA1108881。SEV和SMC队列的WSI数据由于医院规定而不公开可访问。数据可向通讯作者(E.P.)请求提供,通常在4周内收到回复。数据使用仅限于非商业学术研究目的。
代码可用性
- 源代码公开可下载,链接为https://github.com/dmmoon/PathoRICH。
- 关于代码的任何额外请求或查询可通过dmmoon@jlkgroup.com发送。