Robust Multicentre Detection and Classification of Colorectal Liver Metastases on CT: Application of Foundation Models
作者: Shruti Atul Mali, Zohaib Salahuddin, Yumeng Zhang, Andre Aichert, Xian Zhong, Henry C. Woodruff, Maciej Bobowicz, Katrine Riklund, Juozas Kupčinskas, Lorenzo Faggioni, Roberto Francischello, Razvan L Miclea, Philippe Lambin
分类: cs.CV
发布日期: 2026-01-12
💡 一句话要点
利用Foundation Model实现结直肠癌肝转移病灶在多中心CT图像上的稳健检测与分类
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 结直肠癌肝转移 CT图像分析 Foundation Model 多中心数据 目标检测
📋 核心要点
- 结直肠癌肝转移(CRLM)的早期准确检测对患者生存至关重要,但多中心CT图像的异质性给检测带来了挑战。
- 论文提出一种基于Foundation Model的AI流程,通过微调预训练模型UMedPT,实现CRLM的患者级分类和病灶级检测。
- 实验结果表明,该方法在多中心CT数据上表现出良好的性能,AUC达到0.90,灵敏度达到0.82,并具有良好的可解释性。
📝 摘要(中文)
结直肠癌肝转移(CRLM)是癌症相关死亡的主要原因,在多中心环境下,CT图像上的可靠检测仍然具有挑战性。本文开发了一种基于Foundation Model的AI流程,用于在对比增强CT图像上进行患者层面的分类和病灶层面的CRLM检测,并集成了不确定性量化和可解释性。使用了来自EuCanImage联盟(n=2437)和外部TCIA队列(n=197)的CT数据。在多个预训练模型中,UMedPT表现最佳,并使用MLP头进行分类,使用基于FCOS的头进行病灶检测。分类模型在组合测试集上实现了0.90的AUC和0.82的灵敏度,在外部队列上实现了0.85的灵敏度。排除最不确定的20%的病例后,AUC提高到0.91,平衡准确率提高到0.86。决策曲线分析显示,阈值概率在0.30和0.40之间具有临床效益。检测模型总体上识别出69.1%的病灶,病灶大小四分位数从30%增加到98%。Grad-CAM突出了高置信度病例中与病灶相对应的区域。这些结果表明,基于Foundation Model的流程可以支持跨异构CT数据的稳健且可解释的CRLM检测和分类。
🔬 方法详解
问题定义:结直肠癌肝转移(CRLM)的检测在多中心临床环境中面临挑战,因为不同中心使用的CT扫描仪、扫描协议和图像重建方法各不相同,导致图像质量和特征存在显著差异。现有的检测方法难以适应这种异质性,导致检测精度和泛化能力下降。
核心思路:论文的核心思路是利用Foundation Model强大的表征学习能力,通过在大量医学图像数据上预训练的模型,学习到通用的医学图像特征。然后,针对CRLM检测任务,对预训练模型进行微调,使其能够适应特定任务的需求,从而提高检测精度和泛化能力。
技术框架:该AI流程主要包含两个阶段:患者层面分类和病灶层面检测。首先,使用预训练的UMedPT模型,并添加一个MLP头进行患者层面的二分类,判断是否存在CRLM。然后,使用相同的UMedPT模型,并添加一个基于FCOS的头进行病灶层面的检测,定位CRLM病灶的位置。同时,集成了不确定性量化模块,用于评估预测结果的置信度,并使用Grad-CAM进行可解释性分析。
关键创新:该论文的关键创新在于将Foundation Model应用于CRLM的检测和分类任务,并验证了其在多中心CT数据上的有效性。与传统的从头训练的模型相比,Foundation Model能够利用预训练的知识,更快地收敛并获得更好的性能。此外,该研究还集成了不确定性量化和可解释性分析,提高了模型的可靠性和可信度。
关键设计:论文选择了UMedPT作为Foundation Model,因为它在医学图像领域表现出色。分类任务使用了MLP头,检测任务使用了基于FCOS的头,FCOS是一种anchor-free的目标检测算法,避免了anchor box的设计。损失函数方面,分类任务使用交叉熵损失,检测任务使用FCOS中定义的损失函数。实验中,对UMedPT模型进行了微调,并调整了学习率等超参数,以获得最佳性能。
📊 实验亮点
实验结果表明,该方法在EuCanImage联盟和TCIA队列的CT数据上均取得了良好的性能。分类模型在组合测试集上实现了0.90的AUC和0.82的灵敏度,在外部队列上实现了0.85的灵敏度。检测模型总体上识别出69.1%的病灶,病灶大小四分位数从30%增加到98%。排除最不确定的20%的病例后,AUC提高到0.91,平衡准确率提高到0.86。
🎯 应用场景
该研究成果可应用于临床辅助诊断,帮助医生更准确、更快速地检测和诊断结直肠癌肝转移,提高诊断效率和准确性,从而改善患者的治疗效果。此外,该方法具有良好的泛化能力,可以推广到其他医学图像分析任务中,例如其他类型肿瘤的检测和诊断。
📄 摘要(原文)
Colorectal liver metastases (CRLM) are a major cause of cancer-related mortality, and reliable detection on CT remains challenging in multi-centre settings. We developed a foundation model-based AI pipeline for patient-level classification and lesion-level detection of CRLM on contrast-enhanced CT, integrating uncertainty quantification and explainability. CT data from the EuCanImage consortium (n=2437) and an external TCIA cohort (n=197) were used. Among several pretrained models, UMedPT achieved the best performance and was fine-tuned with an MLP head for classification and an FCOS-based head for lesion detection. The classification model achieved an AUC of 0.90 and a sensitivity of 0.82 on the combined test set, with a sensitivity of 0.85 on the external cohort. Excluding the most uncertain 20 percent of cases improved AUC to 0.91 and balanced accuracy to 0.86. Decision curve analysis showed clinical benefit for threshold probabilities between 0.30 and 0.40. The detection model identified 69.1 percent of lesions overall, increasing from 30 percent to 98 percent across lesion size quartiles. Grad-CAM highlighted lesion-corresponding regions in high-confidence cases. These results demonstrate that foundation model-based pipelines can support robust and interpretable CRLM detection and classification across heterogeneous CT data.