From Generic to Specialized: A Subspecialty Diagnostic System Powered by Self-Supervised Learning for Cervical Histopathology
作者: Yizhi Wang, Li Chen, Qiang Huang, Tian Guan, Xi Deng, Zhiyuan Shen, Jiawen Li, Xinrui Chen, Bin Hu, Xitong Ling, Taojie Zhu, Zirui Huang, Deshui Yu, Yan Liu, Jiurun Chen, Lianghui Zhu, Qiming He, Yiqing Liu, Diwei Shi, Hanzhong Liu, Junbo Hu, Hongyi Gao, Zhen Song, Xilong Zhao, Chao He, Ming Zhao, Yonghong He
分类: cs.CV
发布日期: 2025-10-11
备注: 32 pages, 6 figures
💡 一句话要点
CerS-Path:基于自监督学习的宫颈组织病理亚专科诊断系统
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 宫颈癌 组织病理学 自监督学习 多模态学习 深度学习 亚专科诊断 医学影像 病理诊断
📋 核心要点
- 现有深度学习模型在宫颈组织病理诊断中准确性和泛化性不足,通用基础模型难以捕捉亚专科特异性特征。
- CerS-Path通过自监督学习构建宫颈特异性特征提取器,并利用多模态增强提升模型性能,实现更精准的诊断。
- 在3173个病例的前瞻性测试中,CerS-Path保持99.38%的筛查敏感性,展现出卓越的泛化能力和临床应用潜力。
📝 摘要(中文)
宫颈癌仍然是一种主要的恶性肿瘤,需要广泛而复杂的组织病理学评估和全面的辅助工具。尽管深度学习显示出前景,但这些模型仍然缺乏准确性和泛化性。通用基础模型提供了更广泛的应用,但在捕获亚专科特定特征和任务适应性方面仍然有限。我们介绍了宫颈亚专科病理(CerS-Path)诊断系统,该系统通过两个协同的预训练阶段开发:对来自14万张切片的约1.9亿个组织块进行自监督学习,以构建宫颈特异性特征提取器;以及使用250万个图像-文本对进行多模态增强,然后与多个下游诊断功能集成。CerS-Path支持包括罕见癌症分类和多模态问答在内的八种诊断功能,在范围和临床适用性方面超越了先前的基础模型。全面的评估表明,CerS-Path在宫颈病理学方面取得了显著进展,在五个中心的3173个病例中进行的前瞻性测试保持了99.38%的筛查敏感性和出色的泛化性,突出了其在亚专科诊断转化和宫颈癌筛查方面的潜力。
🔬 方法详解
问题定义:宫颈癌的诊断依赖于复杂的组织病理学评估,现有深度学习模型在准确性和泛化性方面存在不足,难以满足临床需求。通用基础模型虽然具有一定的泛化能力,但无法有效提取宫颈组织病理的亚专科特异性特征。因此,需要开发一种能够准确、高效地进行宫颈组织病理诊断的系统。
核心思路:CerS-Path的核心思路是利用自监督学习和多模态学习,构建一个宫颈特异性的诊断系统。通过自监督学习,模型可以从大量的无标注组织切片中学习到有用的特征表示,从而提高模型的泛化能力。通过多模态学习,模型可以融合图像和文本信息,从而提高模型的诊断准确性。这种设计旨在克服现有方法在特征提取和泛化能力方面的局限性。
技术框架:CerS-Path系统包含两个主要的预训练阶段和一个下游诊断阶段。第一阶段是自监督学习,使用大量的宫颈组织切片进行预训练,学习宫颈特异性的特征提取器。第二阶段是多模态增强,使用图像-文本对进行预训练,提高模型对多模态信息的理解能力。最后,将预训练好的模型应用于多个下游诊断任务,例如罕见癌症分类和多模态问答。
关键创新:CerS-Path的关键创新在于其两阶段预训练策略。首先,通过自监督学习构建宫颈特异性的特征提取器,这与传统的通用特征提取器不同,能够更好地捕捉宫颈组织病理的细微特征。其次,通过多模态增强,模型能够融合图像和文本信息,从而提高诊断准确性。这种两阶段预训练策略使得CerS-Path在宫颈组织病理诊断方面取得了显著的性能提升。
关键设计:在自监督学习阶段,采用了对比学习的方法,通过最大化相似样本之间的相似度,最小化不相似样本之间的相似度,从而学习到有用的特征表示。在多模态增强阶段,采用了Transformer模型,将图像和文本信息进行融合,从而提高模型对多模态信息的理解能力。此外,还设计了多个下游诊断任务,例如罕见癌症分类和多模态问答,以评估模型的性能。
📊 实验亮点
CerS-Path在3173个病例的前瞻性测试中保持了99.38%的筛查敏感性,表明其在宫颈癌筛查方面具有很高的准确性。此外,该系统在多个下游诊断任务中都取得了显著的性能提升,超越了先前的基础模型,证明了其在宫颈病理学方面的显著进展和临床应用潜力。
🎯 应用场景
CerS-Path系统可应用于宫颈癌筛查、辅助诊断、病理学研究等领域。该系统能够提高宫颈癌筛查的效率和准确性,辅助病理医生进行诊断,并为宫颈癌的病理学研究提供有力的工具。未来,该系统有望推广到其他亚专科病理诊断领域,为临床医学提供更精准、高效的诊断服务。
📄 摘要(原文)
Cervical cancer remains a major malignancy, necessitating extensive and complex histopathological assessments and comprehensive support tools. Although deep learning shows promise, these models still lack accuracy and generalizability. General foundation models offer a broader reach but remain limited in capturing subspecialty-specific features and task adaptability. We introduce the Cervical Subspecialty Pathology (CerS-Path) diagnostic system, developed through two synergistic pretraining stages: self-supervised learning on approximately 190 million tissue patches from 140,000 slides to build a cervical-specific feature extractor, and multimodal enhancement with 2.5 million image-text pairs, followed by integration with multiple downstream diagnostic functions. Supporting eight diagnostic functions, including rare cancer classification and multimodal Q&A, CerS-Path surpasses prior foundation models in scope and clinical applicability. Comprehensive evaluations demonstrate a significant advance in cervical pathology, with prospective testing on 3,173 cases across five centers maintaining 99.38% screening sensitivity and excellent generalizability, highlighting its potential for subspecialty diagnostic translation and cervical cancer screening.