SpineFM: Leveraging Foundation Models for Automatic Spine X-ray Segmentation

作者: Samuel J. Simons, Bartłomiej W. Papież

分类: eess.IV, cs.CV

发布日期: 2024-11-01 (更新: 2025-01-25)

备注: 4 pages, 3 figures, accepted for ISBI 2025

💡 一句话要点

SpineFM：利用Foundation Model实现脊柱X光片自动分割

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 脊柱X光片分割 Foundation Model Medical-SAM-Adaptor 椎体识别 顺序推断 医学影像分析 深度学习

📋 核心要点

现有脊柱X光片分割方法精度不足，且难以泛化到不同数据集，SpineFM旨在提升分割精度和鲁棒性。
SpineFM利用脊柱的几何规律，通过归纳过程顺序推断每个椎体的位置，从而实现更精确的分割。
实验结果表明，SpineFM在两个公开数据集上均超越了现有方法，Dice系数分别达到0.942和0.921。

📝 摘要（中文）

本文介绍了一种名为SpineFM的新型流程，该流程在颈椎和腰椎X光片中椎体的自动分割和识别方面实现了最先进的性能。SpineFM利用脊柱的规则几何形状，采用一种新颖的归纳过程来顺序推断沿脊柱的每个椎体的位置。椎体使用Medical-SAM-Adaptor进行分割，这是一个强大的基础模型，它与常用的基于CNN的模型不同。我们在两个公开的脊柱X光数据集上取得了出色的结果，分别成功识别了97.8％和99.6％的带注释的椎体。其中，我们的分割达到了0.942和0.921的平均Dice系数，超过了以前最先进的方法。

🔬 方法详解

问题定义：脊柱X光片自动分割旨在准确识别和分割图像中的椎体，为诊断和治疗提供支持。现有方法，特别是基于CNN的模型，在处理不同质量和角度的X光片时，鲁棒性较差，且需要大量标注数据进行训练。此外，现有方法难以有效利用脊柱的结构信息。

核心思路：SpineFM的核心思路是利用脊柱的规则几何形状，通过顺序推断的方式定位每个椎体。这种方法借鉴了人类医生观察X光片的习惯，即先确定整体结构，再精确定位每个椎体。同时，引入Foundation Model，提升模型的泛化能力。

技术框架：SpineFM的整体框架包含两个主要阶段：1) 椎体定位：利用归纳过程，顺序推断每个椎体的位置。该过程可能涉及回归模型或规则算法。2) 椎体分割：使用Medical-SAM-Adaptor对定位到的椎体进行分割。Medical-SAM-Adaptor是一个基于Transformer的Foundation Model，经过医学图像的预训练和微调。

关键创新：SpineFM的关键创新在于：1) 提出了基于归纳过程的椎体顺序定位方法，有效利用了脊柱的结构信息。2) 采用了Medical-SAM-Adaptor作为分割模型，避免了对大量标注数据的依赖，并提升了模型的泛化能力。3) 将Foundation Model引入脊柱X光片分割任务，探索了新的研究方向。

关键设计：关于归纳过程的具体实现细节（例如，使用的回归模型、损失函数等）以及Medical-SAM-Adaptor的微调策略（例如，使用的数据集、训练参数等）论文中可能包含更详细的描述。这些细节对于复现和进一步改进SpineFM至关重要。

🖼️ 关键图片

📊 实验亮点

SpineFM在两个公开的脊柱X光数据集上取得了显著的性能提升。在椎体识别方面，成功识别率分别达到97.8%和99.6%。在椎体分割方面，平均Dice系数分别达到0.942和0.921，超越了之前最先进的方法。这些结果表明，SpineFM在脊柱X光片分割任务中具有很强的竞争力。

🎯 应用场景

SpineFM在临床诊断中具有广泛的应用前景，可以辅助医生进行脊柱疾病的诊断和治疗方案的制定。例如，可以用于脊柱侧弯的评估、椎体滑脱的检测、骨折的诊断等。此外，SpineFM还可以应用于医学影像教学和研究，为学生和研究人员提供更便捷的脊柱X光片分析工具。未来，SpineFM有望集成到智能医疗系统中，提升医疗服务的效率和质量。

📄 摘要（原文）

This paper introduces SpineFM, a novel pipeline that achieves state-of-the-art performance in the automatic segmentation and identification of vertebral bodies in cervical and lumbar spine radiographs. SpineFM leverages the regular geometry of the spine, employing a novel inductive process to sequentially infer the location of each vertebra along the spinal column. Vertebrae are segmented using Medical-SAM-Adaptor, a robust foundation model that diverges from commonly used CNN-based models. We achieved outstanding results on two publicly available spine X-Ray datasets, with successful identification of 97.8\% and 99.6\% of annotated vertebrae, respectively. Of which, our segmentation reached an average Dice of 0.942 and 0.921, surpassing previous state-of-the-art methods.

SpineFM: Leveraging Foundation Models for Automatic Spine X-ray Segmentation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理