SP-Mamba: Spatial-Perception State Space Model for Unsupervised Medical Anomaly Detection

📄 arXiv: 2507.19076v1 📥 PDF

作者: Rui Pan, Ruiying Lu

分类: cs.CV

发布日期: 2025-07-25

备注: 11 pages

🔗 代码/项目: GITHUB


💡 一句话要点

SP-Mamba:用于无监督医学异常检测的空间感知状态空间模型

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 医学异常检测 Mamba模型 空间感知 无监督学习 放射影像 原型学习 长程依赖

📋 核心要点

  1. 现有CNN方法难以捕捉长程依赖,Transformer方法计算复杂度高,限制了医学图像异常检测的性能。
  2. SP-Mamba利用Mamba模型的长程建模能力和线性复杂度,结合空间感知策略,提升医学图像异常检测效果。
  3. 实验结果表明,SP-Mamba在多个医学异常检测数据集上取得了SOTA性能,验证了其有效性和鲁棒性。

📝 摘要(中文)

放射影像协议通常针对特定的解剖区域,因此图像具有高度一致性,并在患者之间呈现重复的结构模式。医学异常检测的最新进展表明,基于CNN和Transformer的方法是有效的。然而,CNN在捕获长程依赖关系方面存在局限性,而Transformer则面临二次计算复杂度的问题。相比之下,基于Mamba的模型凭借其卓越的长程建模能力、结构特征提取能力和线性计算效率,已成为一种有前途的替代方案。为了利用医学图像固有的结构规律性,本研究提出了一种用于无监督医学异常检测的空间感知Mamba框架SP-Mamba。引入了基于窗口滑动原型学习和基于Circular-Hilbert扫描的Mamba,以更好地利用一致的解剖模式,并利用空间信息进行医学异常检测。此外,我们挖掘了异常图的集中度和对比度特征,以提高异常检测的性能。在三个不同的医学异常检测基准上的大量实验证实了该方法的最先进性能,验证了其有效性和鲁棒性。

🔬 方法详解

问题定义:医学图像异常检测旨在识别与正常解剖结构不同的区域。现有方法,如基于CNN和Transformer的模型,在处理长程依赖和计算效率方面存在局限性。CNN难以捕捉全局上下文信息,而Transformer的计算复杂度随图像尺寸呈二次方增长,限制了其在大尺寸医学图像上的应用。

核心思路:SP-Mamba的核心思路是利用Mamba模型在长程依赖建模和计算效率方面的优势,并结合空间感知策略,更好地利用医学图像的结构规律性。通过窗口滑动原型学习和Circular-Hilbert扫描,模型能够更有效地提取空间特征,并关注异常区域的集中度和对比度。

技术框架:SP-Mamba框架主要包括以下几个模块:1) 特征提取模块:使用卷积神经网络提取医学图像的初步特征。2) 空间感知Mamba模块:利用Circular-Hilbert扫描将二维图像转换为一维序列,并使用Mamba模型进行长程依赖建模。3) 窗口滑动原型学习模块:通过滑动窗口提取局部特征,并学习正常图像的原型表示。4) 异常图生成模块:计算输入图像与原型之间的差异,生成异常图。5) 异常图优化模块:挖掘异常图的集中度和对比度特征,进一步提高异常检测的准确性。

关键创新:SP-Mamba的关键创新在于:1) 引入了空间感知Mamba模块,利用Circular-Hilbert扫描将二维图像转换为一维序列,从而能够有效地利用Mamba模型进行长程依赖建模。2) 提出了窗口滑动原型学习方法,通过学习正常图像的原型表示,能够更准确地识别异常区域。3) 挖掘了异常图的集中度和对比度特征,进一步提高了异常检测的准确性。

关键设计:Circular-Hilbert扫描是一种空间填充曲线,能够有效地保持图像的空间邻近性。窗口滑动原型学习中,窗口大小和滑动步长是重要的参数,需要根据具体数据集进行调整。异常图优化模块中,可以使用不同的损失函数来鼓励模型关注异常区域的集中度和对比度。具体的网络结构和参数设置在论文中有详细描述,此处不再赘述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

SP-Mamba在三个医学异常检测基准数据集上进行了评估,包括胸部X光片、脑部MRI和腹部CT扫描。实验结果表明,SP-Mamba在所有数据集上都取得了SOTA性能,显著优于现有的基于CNN和Transformer的方法。例如,在胸部X光片数据集上,SP-Mamba的AUC指标比最佳基线提高了5%以上。

🎯 应用场景

SP-Mamba具有广泛的应用前景,可用于各种医学影像的异常检测,例如X光片、CT扫描和MRI图像。该技术可以辅助医生进行疾病诊断,提高诊断效率和准确性,减少漏诊和误诊的风险。此外,SP-Mamba还可以应用于医学图像的质量控制,自动检测图像中的伪影和噪声,提高图像质量。

📄 摘要(原文)

Radiography imaging protocols target on specific anatomical regions, resulting in highly consistent images with recurrent structural patterns across patients. Recent advances in medical anomaly detection have demonstrated the effectiveness of CNN- and transformer-based approaches. However, CNNs exhibit limitations in capturing long-range dependencies, while transformers suffer from quadratic computational complexity. In contrast, Mamba-based models, leveraging superior long-range modeling, structural feature extraction, and linear computational efficiency, have emerged as a promising alternative. To capitalize on the inherent structural regularity of medical images, this study introduces SP-Mamba, a spatial-perception Mamba framework for unsupervised medical anomaly detection. The window-sliding prototype learning and Circular-Hilbert scanning-based Mamba are introduced to better exploit consistent anatomical patterns and leverage spatial information for medical anomaly detection. Furthermore, we excavate the concentration and contrast characteristics of anomaly maps for improving anomaly detection. Extensive experiments on three diverse medical anomaly detection benchmarks confirm the proposed method's state-of-the-art performance, validating its efficacy and robustness. The code is available at https://github.com/Ray-RuiPan/SP-Mamba.