Mamba-driven MRI-to-CT Synthesis for MRI-only Radiotherapy Planning

📄 arXiv: 2603.23295v1 📥 PDF

作者: Konstantinos Barmpounakis, Theodoros P. Vagenas, Maria Vakalopoulou, George K. Matsopoulos

分类: cs.CV

发布日期: 2026-03-24


💡 一句话要点

提出基于Mamba的MRI-to-CT合成方法,用于MRI引导的放疗计划。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱七:动作重定向 (Motion Retargeting)

关键词: MRI-to-CT合成 状态空间模型 Mamba架构 放疗计划 跨模态图像生成

📋 核心要点

  1. MRI引导的放疗计划能减少患者的电离辐射暴露,并避免模态间配准误差,但现有方法主要依赖于nnU-Net,存在长程依赖建模不足的问题。
  2. 本研究将U-Mamba和SegMamba架构适配于MRI到CT的跨模态图像生成,利用Mamba架构捕获体积特征和长程依赖关系。
  3. 实验结果表明,该方法在保持快速推理速度的同时,实现了精确的CT合成,并通过图像相似性和分割指标验证了几何一致性。

📝 摘要(中文)

本研究探索了基于Mamba架构的MRI到CT合成方法,旨在展示状态空间模型在跨模态转换方面相对于传统卷积神经网络的优势。针对MRI引导的放疗计划,提出将U-Mamba和SegMamba架构适配于跨模态图像生成任务。该3D Mamba架构能够有效捕获复杂的体积特征和长程依赖关系,从而实现精确的CT合成,同时保持快速的推理速度。实验在SynthRAD2025数据集的子集上进行,该数据集包含三个解剖区域的配准单通道MRI-CT体积对。通过在Hounsfield单位(HU)中计算的图像相似性指标以及从TotalSegmentator获得的基于分割的指标进行定量评估,以确保几何一致性得到保持。研究结果为将状态空间模型集成到放射治疗工作流程中铺平了道路。

🔬 方法详解

问题定义:论文旨在解决MRI-only放疗计划中,利用MRI图像合成CT图像的问题。现有方法,特别是基于nnU-Net的框架,在捕捉长程依赖关系和处理体积数据时存在局限性,影响了合成CT图像的质量和准确性。

核心思路:论文的核心思路是将状态空间模型(SSM),特别是Mamba架构,引入到MRI-to-CT合成任务中。Mamba架构通过其选择性扫描机制,能够有效地建模长程依赖关系,并处理高维体积数据,从而提高合成CT图像的质量。

技术框架:论文采用了两种基于Mamba的架构:U-Mamba和SegMamba。这两种架构都经过修改和适配,以适应跨模态图像生成任务。整体流程包括:输入MRI图像,通过Mamba架构进行特征提取和转换,最终生成合成的CT图像。使用SynthRAD2025数据集进行训练和验证。

关键创新:关键创新在于将Mamba架构应用于MRI-to-CT合成任务,并证明了其在捕捉长程依赖关系和处理体积数据方面的优势。与传统的卷积神经网络相比,Mamba架构能够更有效地建模全局上下文信息,从而提高合成CT图像的质量和准确性。

关键设计:论文对U-Mamba和SegMamba架构进行了适配,使其能够处理3D体积数据。使用了SynthRAD2025数据集进行训练,该数据集包含配准的MRI-CT图像对。通过图像相似性指标(如均方误差、峰值信噪比)和分割指标(如Dice系数)来评估合成CT图像的质量和几何一致性。具体参数设置和损失函数细节未知。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

研究结果表明,基于Mamba的MRI-to-CT合成方法能够有效地生成高质量的CT图像,并在图像相似性和几何一致性方面取得了良好的结果。虽然论文中没有给出具体的性能数据和提升幅度,但强调了Mamba架构在捕捉长程依赖关系和处理体积数据方面的优势,为后续研究提供了有价值的参考。

🎯 应用场景

该研究成果可应用于MRI引导的放疗计划,减少患者接受的电离辐射剂量,并避免因模态间配准产生的误差。通过高质量的合成CT图像,可以提高放疗计划的准确性和效率,最终改善患者的治疗效果。未来,该技术有望推广到其他医学影像模态转换任务中。

📄 摘要(原文)

Radiotherapy workflows for oncological patients increasingly rely on multi-modal medical imaging, commonly involving both Magnetic Resonance Imaging (MRI) and Computed Tomography (CT). MRI-only treatment planning has emerged as an attractive alternative, as it reduces patient exposure to ionizing radiation and avoids errors introduced by inter-modality registration. While nnU-Net-based frameworks are predominantly used for MRI-to-CT synthesis, we explore Mamba-based architectures for this task, aiming to showcase the advantages of state-space modeling for cross-modality translation compared to standard convolutional neural networks. Specifically, we adapt both the U-Mamba and the SegMamba architecture, originally proposed for segmentation, to perform cross-modality image generation. Our 3D Mamba architecture effectively captures complex volumetric features and long-range dependencies, thus allowing accurate CT synthesis while maintaining fast inference times. Experiments were conducted on a subset of SynthRAD2025 dataset, comprising registered single-channel MRI-CT volume pairs across three anatomical regions. Quantitative evaluation is performed via a combination of image similarity metrics computed in Hounsefield Units (HU) and segmentation-based metrics obtained from TotalSegmentator to ensure geometric consistency is preserved. The findings pave the way for the integration of state-space models into radiotherapy workflows.