Subspecialty-Specific Foundation Model for Intelligent Gastrointestinal Pathology

📄 arXiv: 2505.21928v2 📥 PDF

作者: Lianghui Zhu, Xitong Ling, Minxi Ouyang, Xiaoping Liu, Tian Guan, Mingxi Fu, Zhiqiang Cheng, Fanglei Fu, Maomao Zeng, Liming Liu, Song Duan, Qiang Huang, Ying Xiao, Jianming Li, Shanming Lu, Zhenghua Piao, Mingxi Zhu, Yibo Jin, Shan Xu, Qiming He, Yizhi Wang, Junru Cheng, Xuanyu Wang, Luxi Xie, Houqiang Li, Sufang Tian, Yonghong He

分类: eess.IV, cs.AI, cs.CV, cs.LG

发布日期: 2025-05-28 (更新: 2025-06-06)


💡 一句话要点

Digepath:面向胃肠病理的专科基础模型,提升诊断精度与效率

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 胃肠病理 基础模型 深度学习 病理诊断 人工智能 精准医疗 全切片图像

📋 核心要点

  1. 传统胃肠病理诊断面临重现性差、诊断差异大的挑战,影响患者治疗效果。
  2. Digepath通过双阶段迭代优化策略,结合预训练和精细筛选,提升病灶检测能力。
  3. Digepath在多项胃肠病理任务上取得SOTA性能,早期胃肠癌筛查敏感性高达99.70%。

📝 摘要(中文)

胃肠道(GI)疾病具有重要的临床意义,需要精确的诊断方法来优化患者的治疗效果。传统的组织病理学诊断存在重现性有限和诊断变异性问题。为了克服这些局限性,我们开发了Digepath,一种专门用于胃肠病理学的基础模型。我们的框架引入了一种双阶段迭代优化策略,结合了预训练和精细筛选,专门用于解决全切片图像中稀疏分布病灶区域的检测问题。Digepath在来自210,043张胃肠道疾病H&E染色切片的超过3.53亿张多尺度图像上进行预训练。在与胃肠病理学相关的34项任务中的33项上,它达到了最先进的性能,包括病理诊断、蛋白质表达状态预测、基因突变预测和预后评估。我们进一步转化了智能筛选模块用于早期胃肠道癌症,并在九家独立的医疗机构中实现了接近完美的99.70%的敏感性。这项工作不仅推进了人工智能驱动的胃肠道疾病精准病理学,而且弥合了组织病理学实践中的关键差距。

🔬 方法详解

问题定义:论文旨在解决传统胃肠病理诊断中存在的重现性差和诊断变异性问题。现有方法难以准确检测全切片图像中稀疏分布的病灶区域,导致诊断效率和准确性受限。

核心思路:论文的核心思路是构建一个专用于胃肠病理的基础模型Digepath,并通过双阶段迭代优化策略,即预训练和精细筛选,来提升模型对病灶区域的检测能力。这种方法旨在利用大规模的病理图像数据,学习到更具判别性的特征表示,从而提高诊断的准确性和效率。

技术框架:Digepath的技术框架主要包含以下几个阶段:1) 数据收集与预处理:收集大量胃肠道疾病的H&E染色切片图像,并进行多尺度切片处理。2) 预训练:使用大规模图像数据对模型进行预训练,学习通用的病理特征表示。3) 精细筛选:设计特定的筛选模块,用于检测稀疏分布的病灶区域,并对模型进行微调。4) 模型评估与应用:在多个胃肠病理任务上评估模型的性能,并将其应用于临床实践中。

关键创新:论文的关键创新在于提出了双阶段迭代优化策略,将预训练和精细筛选相结合。这种方法能够有效地利用大规模数据,学习到更具判别性的特征表示,并提高模型对稀疏分布病灶区域的检测能力。此外,Digepath作为一个专科基础模型,能够更好地适应胃肠病理的特点,从而取得更好的性能。

关键设计:在预训练阶段,论文可能采用了自监督学习或对比学习等方法,以学习图像的通用特征表示。在精细筛选阶段,可能设计了特定的损失函数,例如 focal loss 或 dice loss,以解决病灶区域的类别不平衡问题。具体的网络结构和参数设置未知,但可以推测使用了常见的卷积神经网络或 Transformer 结构。

📊 实验亮点

Digepath在34项胃肠病理任务中的33项上取得了SOTA性能,包括病理诊断、蛋白质表达状态预测、基因突变预测和预后评估。在早期胃肠癌筛查中,Digepath在九家独立医疗机构中实现了接近完美的99.70%的敏感性,显著优于传统方法。

🎯 应用场景

该研究成果可广泛应用于胃肠道疾病的病理诊断、早期癌症筛查、预后评估等领域。Digepath有望提高诊断的准确性和效率,减少诊断变异性,为患者提供更精准的治疗方案。未来,该模型可以进一步扩展到其他病理亚专科,推动AI在精准医疗领域的应用。

📄 摘要(原文)

Gastrointestinal (GI) diseases represent a clinically significant burden, necessitating precise diagnostic approaches to optimize patient outcomes. Conventional histopathological diagnosis suffers from limited reproducibility and diagnostic variability. To overcome these limitations, we develop Digepath, a specialized foundation model for GI pathology. Our framework introduces a dual-phase iterative optimization strategy combining pretraining with fine-screening, specifically designed to address the detection of sparsely distributed lesion areas in whole-slide images. Digepath is pretrained on over 353 million multi-scale images from 210,043 H&E-stained slides of GI diseases. It attains state-of-the-art performance on 33 out of 34 tasks related to GI pathology, including pathological diagnosis, protein expression status prediction, gene mutation prediction, and prognosis evaluation. We further translate the intelligent screening module for early GI cancer and achieve near-perfect 99.70% sensitivity across nine independent medical institutions. This work not only advances AI-driven precision pathology for GI diseases but also bridge critical gaps in histopathological practice.