A generalizable large-scale foundation model for musculoskeletal radiographs

📄 arXiv: 2602.03076v1 📥 PDF

作者: Shinn Kim, Soobin Lee, Kyoungseob Shin, Han-Soo Kim, Yongsung Kim, Minsu Kim, Juhong Nam, Somang Ko, Daeheon Kwon, Wook Huh, Ilkyu Han, Sunghoon Kwon

分类: cs.CV

发布日期: 2026-02-03


💡 一句话要点

SKELEX:用于肌肉骨骼X光片的通用大规模基础模型

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 肌肉骨骼影像 X光片 基础模型 自监督学习 骨骼疾病诊断 零样本学习 迁移学习 医学影像分析

📋 核心要点

  1. 现有肌肉骨骼X光片分析模型泛化性差,依赖大量标注数据,难以适应多样化的临床需求。
  2. SKELEX通过自监督学习在海量X光片上训练,构建通用基础模型,提升模型泛化能力和效率。
  3. 实验表明,SKELEX在骨折检测、骨关节炎分级和骨肿瘤分类等任务上超越现有方法,并具备零样本异常定位能力。

📝 摘要(中文)

人工智能在检测和表征X光片中的肌肉骨骼疾病方面展现出潜力。然而,现有模型大多是任务特定的、依赖于标注的,并且在疾病和解剖区域之间的泛化能力有限。尽管临床上需要一个在大型肌肉骨骼X光片上训练的通用基础模型,但公开可用的数据集在规模上仍然有限,并且缺乏足够的多样性,无法支持对各种肌肉骨骼疾病和解剖部位的训练。本文提出了SKELEX,一个用于肌肉骨骼X光片的大规模基础模型,使用自监督学习在120万张多样化的、富含病症的图像上进行训练。该模型在12个下游诊断任务上进行了评估,通常优于骨折检测、骨关节炎分级和骨肿瘤分类中的基线模型。此外,SKELEX展示了零样本异常定位能力,生成了无需任务特定训练即可识别病理区域的误差图。在此基础上,我们开发了一个可解释的、区域引导的模型来预测骨肿瘤,该模型在独立的外部数据集上保持了强大的性能,并被部署为一个公开访问的Web应用程序。总的来说,SKELEX为肌肉骨骼影像提供了一个可扩展的、标签高效的、通用的AI框架,为肌肉骨骼放射学的临床转化和数据高效研究奠定了基础。

🔬 方法详解

问题定义:现有肌肉骨骼X光片分析模型通常是针对特定任务设计的,例如骨折检测或骨关节炎分级。这些模型需要大量的标注数据进行训练,并且在面对新的疾病或解剖区域时,泛化能力较差。缺乏一个通用的、可扩展的基础模型来处理各种肌肉骨骼影像任务,限制了AI在肌肉骨骼放射学领域的应用。

核心思路:SKELEX的核心思路是利用自监督学习,在大规模未标注的肌肉骨骼X光片数据集上预训练一个通用的基础模型。通过自监督学习,模型可以学习到图像的底层特征表示,从而提高其在各种下游任务上的性能和泛化能力。这种方法避免了对大量标注数据的依赖,降低了训练成本。

技术框架:SKELEX的整体框架包括以下几个主要阶段:1) 数据收集:收集大规模的肌肉骨骼X光片数据集,包含各种疾病和解剖区域。2) 自监督预训练:使用自监督学习算法(具体算法未知)在收集到的数据集上训练基础模型。3) 下游任务微调:将预训练的基础模型应用于各种下游诊断任务,例如骨折检测、骨关节炎分级和骨肿瘤分类。4) 模型部署:将训练好的模型部署为Web应用程序,供临床医生使用。

关键创新:SKELEX最重要的技术创新点在于其通用性和可扩展性。与以往的特定任务模型相比,SKELEX是一个通用的基础模型,可以应用于各种肌肉骨骼影像任务。此外,SKELEX是在大规模数据集上训练的,具有很强的泛化能力。零样本异常定位能力也是一个重要的创新点,这意味着模型可以在没有特定任务训练的情况下,识别图像中的病理区域。

关键设计:论文中没有详细说明自监督学习的具体算法和网络结构等技术细节。但是,可以推测,模型可能使用了对比学习或掩码图像建模等自监督学习方法。损失函数的设计对于自监督学习至关重要,需要根据具体的自监督学习算法进行选择。网络结构可能采用了Transformer或卷积神经网络等常见的图像处理架构。具体的参数设置未知。

📊 实验亮点

SKELEX在12个下游诊断任务上进行了评估,结果表明,该模型在骨折检测、骨关节炎分级和骨肿瘤分类等任务上均优于基线模型。此外,SKELEX还展示了零样本异常定位能力,可以生成识别病理区域的误差图。一个基于SKELEX的骨肿瘤预测模型在独立的外部数据集上保持了强大的性能,并被部署为一个公开访问的Web应用程序。具体的性能提升数据未知。

🎯 应用场景

SKELEX在肌肉骨骼影像领域具有广泛的应用前景,可以用于辅助诊断、疾病筛查、治疗方案制定等。该模型可以帮助放射科医生提高诊断效率和准确性,减少误诊和漏诊。此外,SKELEX还可以应用于远程医疗和移动医疗,为偏远地区的患者提供高质量的医疗服务。未来,SKELEX有望成为肌肉骨骼放射学领域的重要工具。

📄 摘要(原文)

Artificial intelligence (AI) has shown promise in detecting and characterizing musculoskeletal diseases from radiographs. However, most existing models remain task-specific, annotation-dependent, and limited in generalizability across diseases and anatomical regions. Although a generalizable foundation model trained on large-scale musculoskeletal radiographs is clinically needed, publicly available datasets remain limited in size and lack sufficient diversity to enable training across a wide range of musculoskeletal conditions and anatomical sites. Here, we present SKELEX, a large-scale foundation model for musculoskeletal radiographs, trained using self-supervised learning on 1.2 million diverse, condition-rich images. The model was evaluated on 12 downstream diagnostic tasks and generally outperformed baselines in fracture detection, osteoarthritis grading, and bone tumor classification. Furthermore, SKELEX demonstrated zero-shot abnormality localization, producing error maps that identified pathologic regions without task-specific training. Building on this capability, we developed an interpretable, region-guided model for predicting bone tumors, which maintained robust performance on independent external datasets and was deployed as a publicly accessible web application. Overall, SKELEX provides a scalable, label-efficient, and generalizable AI framework for musculoskeletal imaging, establishing a foundation for both clinical translation and data-efficient research in musculoskeletal radiology.