Enabling clinical use of foundation models in histopathology

📄 arXiv: 2602.22347 📥 PDF

作者: Audun L. Henriksen, Ole-Johan Skrede, Lisa van der Schee, Enric Domingo, Sepp De Raedt, Ilyá Kostolomov, Jennifer Hay, Karolina Cyll, Wanja Kildal, Joakim Kalsnes, Robert W. Williams, Manohar Pradhan, John Arne Nesheim, Hanne A. Askautrud, Maria X. Isaksen, Karmele Saez de Gordoa, Miriam Cuatrecasas, Joanne Edwards, TransSCOT group, Arild Nesbakken, Neil A. Shepherd, Ian Tomlinson, Daniel-Christoph Wagner, Rachel S. Kerr, Tarjei Sveinsgjerd Hveem, Knut Liestøl, Yoshiaki Nakamura, Marco Novelli, Masaaki Miyo, Sebastian Foersch, David N. Church, Miangela M. Lacle, David J. Kerr, Andreas Kleppe

分类: cs.CV, cs.AI

发布日期: 2026-02-28


💡 一句话要点

提出基于鲁棒性损失的下游训练方法,提升病理学Foundation Model在临床应用中的泛化性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 组织病理学 Foundation Model 鲁棒性 深度学习 临床应用

📋 核心要点

  1. 现有病理学Foundation Model易受预处理和扫描仪差异影响,导致下游任务泛化性不足。
  2. 通过在下游任务训练中引入鲁棒性损失,使模型关注生物学相关特征,降低对技术差异的敏感性。
  3. 实验表明,该方法显著提升了模型的鲁棒性和预测精度,无需重新训练Foundation Model。

📝 摘要(中文)

组织病理学中的Foundation Model有望促进高性能和通用深度学习系统的发展。然而,目前的模型不仅捕获了生物学相关的特征,还捕获了预分析和扫描仪相关的差异,这些差异会偏差从Foundation Model特征训练的任务特定模型的预测。本文提出在下游任务特定模型的训练中引入新的鲁棒性损失,以降低对技术变异的敏感性。利用包含来自6155名患者的27042张WSI的全面实验装置,从八个流行的计算病理学Foundation Model的特征中训练了数千个模型。除了显著提高鲁棒性外,我们还观察到,通过关注生物学相关的特征,预测精度也得到了提高。我们的方法成功地缓解了计算病理学Foundation Model的鲁棒性问题,而无需重新训练Foundation Model本身,从而能够开发适用于常规临床实践中真实世界数据的鲁棒计算病理学模型。

🔬 方法详解

问题定义:现有基于组织病理学图像的Foundation Model在应用于实际临床数据时,容易受到预处理流程和扫描仪差异的影响,导致模型在不同数据集上的泛化能力下降。这些技术因素引入的偏差会掩盖生物学相关的特征,降低模型预测的准确性。因此,如何提升Foundation Model在实际临床应用中的鲁棒性是一个关键问题。

核心思路:本文的核心思路是在下游任务的训练过程中,引入新的鲁棒性损失函数,从而使模型更加关注生物学相关的特征,并减少对技术因素引入的偏差的敏感性。通过这种方式,模型可以在不重新训练Foundation Model本身的情况下,提升其在不同数据集上的泛化能力和预测准确性。

技术框架:该方法的技术框架主要包括以下几个阶段:1) 使用预训练的Foundation Model提取组织病理学图像的特征;2) 基于提取的特征,训练下游任务特定的模型;3) 在训练过程中,引入鲁棒性损失函数,以减少模型对技术因素引入的偏差的敏感性。整体流程是在现有Foundation Model的基础上,通过改进下游任务的训练方式来提升模型的鲁棒性。

关键创新:该方法最重要的技术创新点在于引入了新的鲁棒性损失函数。与传统的训练方法不同,该方法不仅关注预测的准确性,还关注模型对技术因素引入的偏差的鲁棒性。通过这种方式,模型可以学习到更加具有泛化能力的特征表示,从而在不同的数据集上表现更好。

关键设计:关于关键设计,论文中提到使用了多种鲁棒性损失函数,具体形式未知。此外,论文使用了包含来自6155名患者的27042张WSI的综合实验装置,并从八个流行的计算病理学Foundation Model的特征中训练了数千个模型,这保证了实验结果的可靠性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,引入鲁棒性损失函数后,模型的鲁棒性和预测精度均得到了显著提升。具体性能数据未知,但论文强调该方法在不重新训练Foundation Model的情况下,成功缓解了其鲁棒性问题,使得计算病理学模型能够更好地应用于实际临床数据。

🎯 应用场景

该研究成果可广泛应用于临床病理诊断领域,提升AI模型在真实世界数据中的可靠性和泛化性。通过降低对技术差异的敏感性,该方法能够促进病理学Foundation Model在不同医院和实验室之间的应用,加速疾病诊断和治疗方案的制定,并为个性化医疗提供更准确的支持。

📄 摘要(原文)

Foundation models in histopathology are expected to facilitate the development of high-performing and generalisable deep learning systems. However, current models capture not only biologically relevant features, but also pre-analytic and scanner-specific variation that bias the predictions of task-specific models trained from the foundation model features. Here we show that introducing novel robustness losses during training of downstream task-specific models reduces sensitivity to technical variability. A purpose-designed comprehensive experimentation setup with 27,042 WSIs from 6155 patients is used to train thousands of models from the features of eight popular foundation models for computational pathology. In addition to a substantial improvement in robustness, we observe that prediction accuracy improves by focusing on biologically relevant features. Our approach successfully mitigates robustness issues of foundation models for computational pathology without retraining the foundation models themselves, enabling development of robust computational pathology models applicable to real-world data in routine clinical practice.