头颈肿瘤在PET/CT中的分割:HECKTOR挑战赛| 文献速递-深度学习肿瘤自动分割

Title

题目

Head and neck tumor segmentation in PET/CT: The HECKTOR challenge

头颈肿瘤在PET/CT中的分割:HECKTOR挑战赛

01

文献速递介绍

高通量医学影像分析,常被称为放射组学,已显示出其在揭示定量影像生物标志物与癌症预后之间关系的潜力,包括在头颈(H&N)癌症的背景下(Vallieres等,2017;Bogowicz等,2017)。头颈癌是发病率第五高的癌症(Parkin等,2005),其治疗通常基于放射治疗与系统治疗(例如赛妥昔单抗)的组合(Bonner等,2010)。然而,治疗这种癌症仍具挑战性,因为大约40%的患者在治疗后的前两年内会发生局部失败(Chajon等,2013)。开发非侵入性和个性化的方法(例如放射组学)对于改善疾病特征化至关重要,并有望导致基于表型肿瘤特征的更有针对性的治疗。2-[18F]氟代脱氧葡萄糖正电子发射断层扫描(FDG-PET)和计算机断层扫描(CT)在疾病特征化中占有特殊地位,因为它们包含有关癌症的代谢和解剖的互补信息。此外,它们用于头颈癌的初步分期和随访。因此,这些模式易于用于基于临床获得的图像创建和评估放射组学模型。典型的放射组学分析依赖于在已勾画的病变或兴趣体积(VOI)内的局部特征提取(Lambin等,2017;Gillies等,2016)。

阻碍强大模型开发的原因之一是耗时且容易出错的手动勾画这些VOI。为此,自动分割头颈原发肿瘤(GTVt)和淋巴结(GTVn)的总肿瘤体积构成了一种非常有前景的方法,用于标注和分析非常大的队列,这对于实现放射组学模型的强大和可重复性验证至关重要。此外,自动分割还有潜力让放射肿瘤科医生通过减少肿瘤勾画所需时间以及改善观察者间的再现性,来提高治疗计划的效率。

头颈肿瘤(HECKTOR)挑战赛的目标是建立并评估最佳性能方法,用于头颈病变分割,同时利用联合PET/CT的丰富的双模态信息。在这一挑战赛的首届中,参与者被要求开发用于分割患有口咽癌患者FDG-PET/CT图像上的GTVt2的自动方法。值得注意的是,要成为正式排名的一部分,参与者必须提供一篇描述其方法的论文。

Abstract

摘要

This paper relates the post-analysis of the first edition of the HEad and neCK TumOR (HECKTOR) challenge. This challenge was held as a satellite event of the 23rd International Conference on Medical ImageComputing and Computer-Assisted Intervention (MICCAI) 2020, and was the first of its kind focusing onlesion segmentation in combined FDG-PET and CT image modalities. The challenge’s task is the automatic segmentation of the Gross Tumor Volume (GTV) of Head and Neck (H&N) oropharyngeal primarytumors in FDG-PET/CT images. To this end, the participants were given a training set of 201 cases fromfour different centers and their methods were tested on a held-out set of 53 cases from a fifth center.The methods were ranked according to the Dice Score Coefficient (DSC) averaged across all test cases. Anadditional inter-observer agreement study was organized to assess the difficulty of the task from a human perspective. 64 teams registered to the challenge, among which 10 provided a paper detailing theirapproach. The best method obtained an average DSC of 0.7591, showing a large improvement over ourproposed baseline method and the inter-observer agreement, associated with DSCs of 0.6610 and 0.61, respectively. The automatic methods proved to successfully leverage the wealth of metabolic and structuralproperties of combined PET and CT modalities, significantly outperforming human inter-observer agree

这篇论文讲述了第一届头颈肿瘤(HECKTOR)挑战赛的后期分析。该挑战赛作为第23届国际医学影像计算和计算机辅助干预会议(MICCAI 2020)的一个卫星活动举行,是首次专注于联合FDG-PET和CT影像模式的病变分割。挑战的任务是自动分割头颈(H&N)口咽部原发肿瘤的总肿瘤体积(GTV)在FDG-PET/CT图像中。为此,参与者获得了来自四个不同中心的201例训练集,他们的方法在第五个中心保留的53例病例上进行了测试。

方法根据所有测试病例的Dice得分系数(DSC)平均值进行排名。此外,还组织了一项观察者间一致性研究,以评估任务的难度从人类的角度来看。共有64支队伍注册参加挑战赛,其中10支提供了详细描述他们方法的论文。最佳方法获得了平均DSC为0.7591,较我们提出的基线方法和观察者间一致性的DSC分别为0.6610和0.61,显示出显著的改进。自动化方法成功地利用了联合PET和CT模式的丰富代谢和结构特性,显著超过了人类观察者间的一致性。

Conclusion

结论

This paper presents the HECKTOR 2020 challenge on the segmentation of the primary tumor of oropharyngeal H&N cancer inFDG PET/CT. Detailed information was reported on the dataset, participation, and segmentation performance. Good participation with18 teams and 10 participants’ publications allowed us to comparestate-of-the-art segmentation methods on this challenging task.The results are very satisfactory with the winning team achievingan average DSC of 0.7591, which is superior to the inter-observeragreement (average DSC 0.6110). These results were obtained witha strict testing scheme as the test cases were all from an unseencenter. It is reasonable to expect better results if the proposedmethods are fine-tuned on few examples from this center. All participants used U-Net based deep learning models, most of themwith a 3D architecture and standard pre-processing techniques.

本文介绍了HECKTOR 2020挑战赛,这是关于FDG PET/CT中口咽部头颈癌原发肿瘤的分割。文章详细报告了数据集、参与情况和分割性能。良好的参与度,有18支团队和10位参与者的出版物,使我们能够在这一具有挑战性的任务上比较最先进的分割方法。

结果非常令人满意,获胜团队的平均DSC为0.7591,优于观察者间一致性(平均DSC为0.6110)。这些结果是在严格的测试方案下获得的,因为测试案例全部来自一个未见过的中心。如果在这个中心的少数样本上对所提方法进行微调,可以合理预期会有更好的结果。所有参与者都使用了基于U-Net的深度学习模型,其中大多数采用了3D架构和标准的预处理技术。

Results

结果

This section regroups results in terms of challenge participation, algorithms used, segmentation performance, inter-observer agree ment, ensembling “super-algorithm”, simple PET thresholding, the relation between tumor size and segmentation performance, false positive analysis, and alternative ranking of the methods.

这部分汇总了挑战赛的参与情况、使用的算法、分割性能、观察者间一致性、集成“超级算法”、简单的PET阈值设定、肿瘤大小与分割性能之间的关系、假阳性分析以及方法的替代排名。

Figure

图片

Fig. 1. Case examples of 2D sagittal slices of fused PET/CT images from each of the five centers. These images are obtained after resampling the PET image and the CT image to 1x1x1 mm3 with a tricubic interpolation. The CT window in Hounsfield unit is [−140, 260] and the PET window in SUV is .

图 1. 来自五个中心的融合PET/CT图像的2D矢状切片案例示例。这些图像在将PET图像和CT图像重新采样到1x1x1 mm³,并使用三次立方插值后获得。CT窗口的赫氏单位为[−140, 260],PET窗口的SUV为。

图片

Fig. 2. Examples of results of the winning algorithm (andrei.iantsen (Iantsen et al., 2021b)). The automatic segmentation results (green) and ground truth annotations(red) are displayed on 2D slices of PET (right) and CT (left) images. The reported DSC is computed on the entire image (see Eq. 1). (a), (b) Excellent segmentation results,detecting the GTVt of the primary oropharyngeal tumor localized at the bse of the tongue and discarding the laterocervical lymph nodes despite high FDG uptake onPET. (c) Incorrect segmentation of the top volume at the level of the soft palate; (d) Incorrect segmentation of the smaller volume below the level of the hyoid bone.

图 2. 获胜算法的结果示例(andrei.iantsen (Iantsen等,2021b))。自动分割结果(绿色)和地面真实标注(红色)显示在PET(右侧)和CT(左侧)图像的2D切片上。报告的DSC是在整个图像上计算的(见公式1)。(a) 和 (b) 优秀的分割结果,检测到位于舌根的口咽部原发肿瘤的GTVt,并且尽管PET上FDG摄取量高,也排除了侧颈淋巴结。(c) 在软腭层面的顶部体积分割不正确;(d) 在舌骨下层面的较小体积分割不正确。

图片

Fig. 3. Box plots of the distribution of the 53 test DSCs for each participant, ordered by decreasing rank.

图 3. 按降序排列的每位参与者的53个测试DSC分布的箱形图。

图片

Fig. 4. Box plots of the distribution of DSCs across the 10 participants for each of the 53 patients in the test set.

图 4. 测试集中每位患者的10名参与者DSC分布的箱形图。

图片

Fig. 5. Segmentation performance of PET thresholding-based method at different percentages of maximum SUV. Three results are reported: the automatic PET threshold, thesemi-automatic PET threshold (indicating the location of the ground truth GTVt), and the semi-automatic PET and CT (for removing the air) threshold.

图 5. 基于不同最大SUV百分比的PET阈值法的分割性能。报告了三个结果:自动PET阈值、半自动PET阈值(指示地面真实GTVt的位置),以及半自动PET和CT(用于去除空气)阈值。

图片

Fig. 6. Scatter plot of DSC vs. tumor volume (voxel count in the VOI) for 10 participants. The corresponding Spearman correlation is 0.43.

图 6。10名参与者中DSC与肿瘤体积(感兴趣区域内的体素计数)的散点图。相应的Spearman相关系数为0.43。

图片

Fig. 7. Average DSC of each team’s algorithm in function of the volume of the tumors. This figure was generated by distributing the 53 test volumes in 4 bins of n =13, 13,13, and 14 each and then computing the average DSC for each bin.

图 7. 每个团队算法的平均DSC与肿瘤体积的关系。此图通过将53个测试体积分布在每个包含13, 13, 13和14个体积的4个区间中,然后计算每个区间的平均DSC生成。

图片

Fig. 8. Histogram of the Euclidean distance of the FP voxels to the closest ground truth GTVt voxel and GTVn voxel. We evaluate here the prediction of the first rankedparticipant (andrei.iantsen) (a) and our baseline 3D PET/CT (b). For comparison, the False Discovery Rate (FDR), i.e. FP/(FP+TP) is 0.15, with 544,343 TPs in (a) and FDR= 0.37 with 621,413 TPs in (b).

图 8. 假阳性体素到最近的地面真实GTVt体素和GTVn体素的欧几里得距离的直方图。这里我们评估第一名参与者(andrei.iantsen)的预测结果(a)和我们的基线3D PET/CT(b)。作为比较,假发现率(FDR),即 FP/(FP+TP) 在 (a) 中为0.15,有544,343个TPs,在 (b) 中为0.37,有621,413个TPs。

图片

Fig. 9. Ranking robustness against changes in test data. The robustness is assessed by ranking 1000 bootstraps of the test set. The size of the circles is proportional tothe number of times a team obtained the corresponding rank for each bootstrap. The dashed lines represent the confidence intervals at 95% computed from the bootstrapanalysis. The current ranking, i.e. the one used in this challenge, is obtained by averaging the DSCs across all test cases. The alternative ranking is computed by averagingthe rankings of each team across the test cases.

图 9. 排名对测试数据变化的稳健性。通过对测试集的1000个自助样本进行排名来评估稳健性。圆圈的大小与每个自助样本中团队获得相应排名的次数成正比。虚线代表由自助分析计算出的95%置信区间。当前排名,即本挑战赛中使用的排名,是通过平均所有测试案例的DSCs获得的。替代排名是通过平均每个团队在测试案例中的排名计算得出的。

Table

图片

Table 1List of scanners used in the different centers.

表 1 不同中心使用的扫描仪列表。

图片

Table 2Summary of the algorithms in terms of main components used: 2D or 3D U-Net, resampling, preprocessing, training or testing data augmentation, loss used for optimization,an ensemble of multiple models for test prediction and postprocessing of the results. We use the following abbreviations for the preprocessing: Clipping (C), Standardization(S), and if it is applied only to one modality, it is specified in parentheses. For the image resampling, we specify whether the algorithms use Isotropic (I) or Anisotropic (A)resampling and Nearest Neighbor (NN), Linear (L), or Cubic (Cu) interpolation. We use the following abbreviation for the losses: Cross-Entropy (CE), Mumford-Shah (MS),and Mean Absolute Error (MAE). More details can be found in the respective participants’ publications.

表 2 关于主要组件使用的算法总结:2D或3D U-Net、重采样、预处理、训练或测试数据增强、用于优化的损失函数、测试预测的多模型集成以及结果的后处理。我们使用以下缩写表示预处理:剪切(C)、标准化(S),如果仅应用于一种模式,则在括号中指定。对于图像重采样,我们指定算法使用的是等距(I)还是非等距(A)重采样以及最近邻(NN)、线性(L)或立方(Cu)插值。我们使用以下缩写表示损失函数:交叉熵(CE)、Mumford-Shah(MS)和平均绝对误差(MAE)。更多详情可以在各参与者的出版物中找到。

图片

Table 3Summary of the challenge results as of April 2021. The average DSC, precision, recall, SDSC and median HD95 are reported for the baseline algorithms and every team (thebest result of each team). The unit of the HD95 is [mm]. The participant names are reported when no team name was provided. The ranking is only provided for teamsthat presented their method in a paper submission. The post-challenge results are denoted by an asterisk ∗. Bold values represent the best scores for each metric, excludingpost-challenge results since we do not have any information about their method.

表 3截至2021年4月的挑战赛结果总结。报告了基线算法和每个团队(每个团队的最佳结果)的平均DSC、精度、召回率、SDSC和中位HD95。HD95的单位是[毫米]。如果没有提供团队名称,则报告参与者名称。只为提交了方法论文的团队提供排名。挑战赛后的结果由星号∗表示。粗体值代表除挑战赛后结果外每个指标的最佳分数,因为我们没有关于它们方法的任何信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/675240.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Unity 自定义编辑器根据枚举值显示变量

public class Test : MonoBehaviour {[HideInInspector][Header("数量")][SerializeField]public int num;[Header("分布类型")][SerializeField]public DistributionType distType;[HideInInspector][Header("位置")][SerializeField]public Li…

LLaMA-Factory实战推理

LLaMA-Factory官网:https://github.com/hiyouga/LLaMA-Factory 安装环境 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory/ conda create -n py310 python3.10 conda activate py310按照llama-factory要求的标准格式组织数据集&#xff…

汽车分销商文件流转优化:实现稳定高效的文件分发处理

在汽车圈里,分销商可是个不可或缺的角色。他们既要跟汽车厂家紧紧绑在一起,还得跟下游的销售渠道或者直接跟消费者打成一片,文件来回传递那是家常便饭。 这文件发放的速度快不快,安不安全,直接影响到分销商做事的效率…

收到“由于找不到emp.dll无法继续执行代码”错误提示时有什么解决办法?分享emp.dll丢失的修复方法

当你收到“由于找不到emp.dll无法继续执行代码”的错误时,意味着你想要运行的程序依赖于名为“emp.dll”的动态链接库(DLL文件),但系统无法在指定的位置或默认搜索路径中找到这个文件。 emp.dll文件的详细介绍 emp.dll是一个重要…

vue3【实战】可撤销重做的 input 输入框

效果预览 实现思路 用 list 数组保存每次输入后输入框的值(响应 input 事件)用 indexRef 作为指针,指向当前 list 数组中对应当前输入框的值撤销时,指针左移重做时,指针右移输入时,对 list 数组按指针1做截…

(函数)分类统计字符串中不同类型的数量(C语言)

一、运行结果&#xff1b; 二、源代码&#xff1b; # define _CRT_SECURE_NO_WARNINGS # include <stdio.h>//声明分类统计函数&#xff1b; void statistics(char a[100]);int main() {//初始化变量值&#xff1b;char a[100] { 0 };//获取用户输入数据&#xff1b;pr…

电脑记事本怎么恢复之前的内容记录

每个人都曾有过这样的时刻——在记事本上精心记录下的重要内容&#xff0c;一不小心就被删除了。那种心情&#xff0c;仿佛一瞬间从山顶跌落到谷底&#xff0c;无尽的懊悔涌上心头。我也曾遭遇过这样的困境&#xff0c;那些消失的文字对我来说意义非凡&#xff0c;它们的丢失仿…

太速科技-基于XC7V690T的12路光纤PCIe接口卡

基于XC7V690T的12路光纤PCIe接口卡 一、板卡概述 基于XC7V690T的12路光纤PCI-E接口卡&#xff0c;用于实现多通道高速光纤数据接收和发送&#xff0c;板卡兼容PCIe 2.0和PCIe 3.0规范&#xff0c;利用PCI-E Switch PEX 8748实现FPGA芯片与计算机的通信&#xff0c;计算机与板…

数据分析常用模型合集(三)同期群、逻辑树、假设检验等

前面两篇文章&#xff0c;我们将比较大、较为系统的分析方法作了一个介绍&#xff0c;本文是最后一篇&#xff0c;将剩余的一些讲一讲。 剩下的一些模型&#xff0c;其实不应叫做模型&#xff0c;主要是一些分析的方法和思路&#xff0c;这些方法并不涵盖整个互联网行业的业务…

【LeetCode】二叉树oj专题

如有不懂的地方&#xff0c;可查阅往期相关文章&#xff01; 个人主页&#xff1a;小八哥向前冲~ 所属专栏&#xff1a;数据结构【c语言】 目录 单值二叉树 对称二叉树 计算二叉树的深度 二叉树的前序遍历 相同二叉树 另一棵树的子树 二叉树的构建和遍历 翻转二叉树 判…

ACWC:Worst-Case to Average-Case Decryption Error

参考文献&#xff1a; [LS19] Lyubashevsky V, Seiler G. NTTRU: Truly Fast NTRU Using NTT[J]. IACR Transactions on Cryptographic Hardware and Embedded Systems, 2019: 180-201.[DHK23] Duman J, Hvelmanns K, Kiltz E, et al. A thorough treatment of highly-efficie…

【功能超全】基于OpenCV车牌识别停车场管理系统软件开发【含python源码+PyqtUI界面+功能详解】-车牌识别python 深度学习实战项目

车牌识别基础功能演示 摘要&#xff1a;车牌识别系统(Vehicle License Plate Recognition&#xff0c;VLPR) 是指能够检测到受监控路面的车辆并自动提取车辆牌照信息&#xff08;含汉字字符、英文字母、阿拉伯数字及号牌颜色&#xff09;进行处理的技术。车牌识别是现代智能交通…

npm彻底清理缓存

在使用npm过程中&#xff0c;肯定会遇到清缓存的情况&#xff0c;网上的命令一般为 npm cache clear --force有时笔者在清理缓存之后npm install依然失败&#xff0c;仔细发现&#xff0c;执行该命令之后npm报了一个警告 npm WARN using --force Recommended protections dis…

低代码能做复杂业务场景嘛?低代码平台该如何选择?

在当前数字化改革的浪潮中&#xff0c;低代码平台作为新兴的开发工具受到了广泛关注。然而&#xff0c;就像所有新兴技术一样&#xff0c;关于其价值和适用性的争议也一直存在。一方面&#xff0c;一些人认为低代码平台简化了应用程序的构建过程&#xff0c;使得非专业开发者也…

融合通信系统 | 让传统通信沟通无边界

随着通信技术以及互联网的发展&#xff0c;融合通信在各行各业中的应用日益增多&#xff0c;融合通信多样的通信方式为行业用户带来了极佳的通信体验&#xff0c;助力各行各业蓬勃发展&#xff0c;同时也为人们的生活和工作带来了极大的便利和效率。 融合通信系统是一种集成多种…

《数据资产》专题:《数据资产》如何确权、估值? 《数据产权》如何明确、保护?

2020 年 04 月 10 日&#xff0c;《中共中央国务院 关于“构建更加完善的要素市场化配置体制机制”的意见》正式公布&#xff0c;将数据确立为五大生产要素&#xff08;土地、资本、劳动力以及技术&#xff09;之一&#xff0c;数据要素市场化已成为建设数字中国不可或缺的一部…

PTA 统计空格、大小写字母、数字和其它字符的数量

从键盘上输入一个字符串, 计算字符串里分别有多少个空格、小写字母、大写字母、数字和其他字符。 输入格式: 键盘中随机输入英文字符串&#xff0c;统计出字符串中空格、小写字母、大写字母、数字和其他字符分别有多少个。例如&#xff1a; -al1E 3xce6lRS TP9PS P?!gfyh# …

【Linux】进程(4):优先级

大家好&#xff0c;我是苏貝&#xff0c;本篇博客带大家了解Linux的进程&#xff08;4&#xff09;&#xff1a;优先级&#xff0c;如果你觉得我写的还不错的话&#xff0c;可以给我一个赞&#x1f44d;吗&#xff0c;感谢❤️ 目录 &#xff08;A&#xff09;什么是优先级&am…

代码随想录第23天|回溯part3 组合与分割

39.组合总和 class Solution { public:vector<vector<int>> res;vector<int> path;void backTracking(vector<int>& candidates,int target,int sum,int n,int step){if(n > 150) return;if(sum > target) return;if(sum target){res.push_…

亿发:制造型企业信息化规划——从破冰到全面落地

在制造型企业中&#xff0c;信息化规划的落地是一个复杂而关键的过程。尽管规划和蓝图可能已经制定完毕&#xff0c;但如何成功地实施信息化才是关键所在。本文将详细介绍制造型企业信息化规划的落地过程&#xff0c;通过三个周期逐步推进&#xff0c;最终实现信息化与自动化的…