SpineFM: Leveraging Foundation Models for Automatic Spine X-ray Segmentation
作者: Samuel J. Simons, Bartłomiej W. Papież
分类: eess.IV, cs.CV
发布日期: 2024-11-01 (更新: 2025-01-25)
备注: 4 pages, 3 figures, accepted for ISBI 2025
💡 一句话要点
SpineFM:利用Foundation Model实现脊柱X光片自动分割
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 脊柱X光片分割 Foundation Model Medical-SAM-Adaptor 椎体识别 顺序推断 医学影像分析 深度学习
📋 核心要点
- 现有脊柱X光片分割方法精度不足,且难以泛化到不同数据集,SpineFM旨在提升分割精度和鲁棒性。
- SpineFM利用脊柱的几何规律,通过归纳过程顺序推断每个椎体的位置,从而实现更精确的分割。
- 实验结果表明,SpineFM在两个公开数据集上均超越了现有方法,Dice系数分别达到0.942和0.921。
📝 摘要(中文)
本文介绍了一种名为SpineFM的新型流程,该流程在颈椎和腰椎X光片中椎体的自动分割和识别方面实现了最先进的性能。SpineFM利用脊柱的规则几何形状,采用一种新颖的归纳过程来顺序推断沿脊柱的每个椎体的位置。椎体使用Medical-SAM-Adaptor进行分割,这是一个强大的基础模型,它与常用的基于CNN的模型不同。我们在两个公开的脊柱X光数据集上取得了出色的结果,分别成功识别了97.8%和99.6%的带注释的椎体。其中,我们的分割达到了0.942和0.921的平均Dice系数,超过了以前最先进的方法。
🔬 方法详解
问题定义:脊柱X光片自动分割旨在准确识别和分割图像中的椎体,为诊断和治疗提供支持。现有方法,特别是基于CNN的模型,在处理不同质量和角度的X光片时,鲁棒性较差,且需要大量标注数据进行训练。此外,现有方法难以有效利用脊柱的结构信息。
核心思路:SpineFM的核心思路是利用脊柱的规则几何形状,通过顺序推断的方式定位每个椎体。这种方法借鉴了人类医生观察X光片的习惯,即先确定整体结构,再精确定位每个椎体。同时,引入Foundation Model,提升模型的泛化能力。
技术框架:SpineFM的整体框架包含两个主要阶段:1) 椎体定位:利用归纳过程,顺序推断每个椎体的位置。该过程可能涉及回归模型或规则算法。2) 椎体分割:使用Medical-SAM-Adaptor对定位到的椎体进行分割。Medical-SAM-Adaptor是一个基于Transformer的Foundation Model,经过医学图像的预训练和微调。
关键创新:SpineFM的关键创新在于:1) 提出了基于归纳过程的椎体顺序定位方法,有效利用了脊柱的结构信息。2) 采用了Medical-SAM-Adaptor作为分割模型,避免了对大量标注数据的依赖,并提升了模型的泛化能力。3) 将Foundation Model引入脊柱X光片分割任务,探索了新的研究方向。
关键设计:关于归纳过程的具体实现细节(例如,使用的回归模型、损失函数等)以及Medical-SAM-Adaptor的微调策略(例如,使用的数据集、训练参数等)论文中可能包含更详细的描述。这些细节对于复现和进一步改进SpineFM至关重要。
🖼️ 关键图片
📊 实验亮点
SpineFM在两个公开的脊柱X光数据集上取得了显著的性能提升。在椎体识别方面,成功识别率分别达到97.8%和99.6%。在椎体分割方面,平均Dice系数分别达到0.942和0.921,超越了之前最先进的方法。这些结果表明,SpineFM在脊柱X光片分割任务中具有很强的竞争力。
🎯 应用场景
SpineFM在临床诊断中具有广泛的应用前景,可以辅助医生进行脊柱疾病的诊断和治疗方案的制定。例如,可以用于脊柱侧弯的评估、椎体滑脱的检测、骨折的诊断等。此外,SpineFM还可以应用于医学影像教学和研究,为学生和研究人员提供更便捷的脊柱X光片分析工具。未来,SpineFM有望集成到智能医疗系统中,提升医疗服务的效率和质量。
📄 摘要(原文)
This paper introduces SpineFM, a novel pipeline that achieves state-of-the-art performance in the automatic segmentation and identification of vertebral bodies in cervical and lumbar spine radiographs. SpineFM leverages the regular geometry of the spine, employing a novel inductive process to sequentially infer the location of each vertebra along the spinal column. Vertebrae are segmented using Medical-SAM-Adaptor, a robust foundation model that diverges from commonly used CNN-based models. We achieved outstanding results on two publicly available spine X-Ray datasets, with successful identification of 97.8\% and 99.6\% of annotated vertebrae, respectively. Of which, our segmentation reached an average Dice of 0.942 and 0.921, surpassing previous state-of-the-art methods.