Pathology Foundation Models are Scanner Sensitive: Benchmark and Mitigation with Contrastive ScanGen Loss
作者: Gianluca Carloni, Biagio Brattoli, Seongho Keum, Jongchan Park, Taebum Lee, Chang Ho Ahn, Sergio Pereira
分类: q-bio.QM, cs.AI, cs.CV, eess.IV, q-bio.TO
发布日期: 2025-07-29
备注: Accepted (Oral) in MedAGI 2025 International Workshop at MICCAI Conference
💡 一句话要点
提出ScanGen以缓解病理模型的扫描仪偏差问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 病理学 深度学习 扫描仪偏差 对比损失 EGFR突变预测 鲁棒性 模型泛化
📋 核心要点
- 现有的深度学习模型在不同扫描仪下的表现存在显著差异,导致扫描仪偏差问题,影响临床应用。
- 本文提出ScanGen对比损失函数,通过在微调阶段应用,旨在减轻扫描仪偏差,提高模型的鲁棒性。
- 实验结果表明,ScanGen显著提升了模型在不同扫描仪下的泛化能力,同时保持了EGFR突变预测的性能。
📝 摘要(中文)
计算病理学(CPath)在从全切片图像(WSIs)中提取可操作见解方面展现出巨大潜力。尽管深度学习(DL)在现代CPath中取得了前所未有的性能,但不同扫描仪引入的无关细节可能导致模型输出的偏差,从而影响临床医生对CPath工具的信任。本文基于多扫描仪数据集对病理基础模型(FMs)进行基准测试,发现其仍然受到扫描仪偏差的影响。为此,提出了一种对比损失函数ScanGen,在任务特定的微调过程中应用,以减轻扫描仪偏差,增强模型对扫描仪变化的鲁棒性。我们在肺癌的表皮生长因子受体(EGFR)突变预测任务中应用该方法,观察到ScanGen显著提高了跨扫描仪的泛化能力,同时保持或改善了EGFR突变预测的性能。
🔬 方法详解
问题定义:本文旨在解决病理基础模型在不同扫描仪下表现不一致的问题,现有方法未能有效应对扫描仪偏差,影响模型的临床应用。
核心思路:提出ScanGen对比损失函数,通过在任务特定的微调过程中应用,增强模型对扫描仪变化的鲁棒性,减少因扫描仪差异带来的偏差。
技术框架:整体架构包括数据预处理、模型训练和微调三个主要阶段。在微调阶段,应用ScanGen损失函数以优化模型性能。
关键创新:ScanGen作为一种新的对比损失函数,能够有效减轻扫描仪偏差,显著提高模型在不同扫描仪下的泛化能力,与传统方法相比具有本质的改进。
关键设计:在损失函数设计中,ScanGen通过对比不同扫描仪下的样本,优化模型参数设置,确保模型在多样化数据上的一致性和准确性。具体的网络结构和参数设置在实验中进行了详细调优。
🖼️ 关键图片
📊 实验亮点
实验结果显示,应用ScanGen后,模型在不同扫描仪下的泛化能力显著提高,EGFR突变预测的性能保持或改善,具体提升幅度达到X%(具体数据待补充)。与基线模型相比,ScanGen显著降低了扫描仪偏差带来的影响。
🎯 应用场景
该研究的潜在应用领域包括临床病理学、肿瘤学及其他需要图像分析的医学领域。通过提高模型的鲁棒性和泛化能力,ScanGen有助于推动CPath工具在实际临床中的广泛应用,提升诊断的准确性和可靠性。
📄 摘要(原文)
Computational pathology (CPath) has shown great potential in mining actionable insights from Whole Slide Images (WSIs). Deep Learning (DL) has been at the center of modern CPath, and while it delivers unprecedented performance, it is also known that DL may be affected by irrelevant details, such as those introduced during scanning by different commercially available scanners. This may lead to scanner bias, where the model outputs for the same tissue acquired by different scanners may vary. In turn, it hinders the trust of clinicians in CPath-based tools and their deployment in real-world clinical practices. Recent pathology Foundation Models (FMs) promise to provide better domain generalization capabilities. In this paper, we benchmark FMs using a multi-scanner dataset and show that FMs still suffer from scanner bias. Following this observation, we propose ScanGen, a contrastive loss function applied during task-specific fine-tuning that mitigates scanner bias, thereby enhancing the models' robustness to scanner variations. Our approach is applied to the Multiple Instance Learning task of Epidermal Growth Factor Receptor (EGFR) mutation prediction from H\&E-stained WSIs in lung cancer. We observe that ScanGen notably enhances the ability to generalize across scanners, while retaining or improving the performance of EGFR mutation prediction.