TopoMamba: Topology-Aware Scanning and Fusion for Segmenting Heterogeneous Medical Visual Media
作者: Fuchen Zheng, Chengpei Xu, Long Ma, Weixuan Li, Junhua Zhou, Xuhang Chen, Weihuang Liu, Haolun Li, Quanjun Li, Zhenxi Zhang, Lei Zhao, Chi-Man Pun, Shoujun Zhou
分类: cs.CV
发布日期: 2026-04-28
备注: 15 pages, 9 figures
💡 一句话要点
TopoMamba:面向异构医学视觉媒体分割的拓扑感知扫描与融合框架
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 医学图像分割 状态空间模型 拓扑感知 扫描与融合 依赖感知
📋 核心要点
- 现有医学图像分割方法难以有效建模倾斜和弯曲结构,且多分支融合易引入冗余信息。
- TopoMamba通过结合对角/反对角扫描分支与标准交叉扫描分支,引入拓扑感知的结构先验。
- 实验表明,TopoMamba在多种医学图像分割任务上优于现有CNN、Transformer和SSM方法,尤其在分割薄或弯曲目标时。
📝 摘要(中文)
视觉状态空间模型(SSMs)在医学图像分割中显示出强大的潜力,但其有效性常受限于两个实际问题:轴向偏置的扫描顺序削弱了对倾斜和弯曲结构的建模,以及朴素的多分支融合容易放大冗余响应。我们提出了TopoMamba,一个拓扑感知扫描与融合框架,用于分割异构医学视觉媒体。该方法结合了对角/反对角TopoA-Scan分支与标准Cross-Scan分支,以提供互补的结构先验,并引入了ScanCache,一种设备感知的缓存机制,可在重复分辨率上分摊显式扫描索引的构建。为了高效地融合异构扫描特征,我们进一步提出了一个轻量级的HSIC Gate,它使用依赖感知标量门控规则来调节分支交互。我们还实例化了一个用于实际3D临床分割的体积TopoMamba-3D。在Synapse CT、ISIC 2017皮肤镜检查和CVC-ClinicDB内窥镜检查上的实验表明,TopoMamba始终优于强大的CNN、Transformer和SSM基线,尤其是在胰腺和胆囊等薄或弯曲目标上,同时在动态输入分辨率下保持良好的部署效率。这些结果表明,拓扑感知扫描顺序和轻量级依赖感知融合构成了医学多媒体分割的有效且实用的设计。代码将公开提供。
🔬 方法详解
问题定义:医学图像分割任务中,现有方法在处理具有复杂拓扑结构(如倾斜、弯曲)的器官或病灶时,由于轴向偏置的扫描方式,难以有效捕捉全局结构信息。同时,简单地融合多个扫描分支的特征容易引入冗余信息,降低分割精度。
核心思路:TopoMamba的核心在于利用拓扑感知的扫描方式和依赖感知的融合机制。通过引入对角/反对角扫描分支,弥补传统扫描方式的不足,增强对复杂结构的建模能力。同时,使用HSIC Gate动态调节不同扫描分支的贡献,抑制冗余信息,提升特征表达能力。
技术框架:TopoMamba框架主要包含三个核心模块:TopoA-Scan分支、Cross-Scan分支和HSIC Gate。TopoA-Scan分支采用对角和反对角扫描方式,捕捉不同方向的结构信息。Cross-Scan分支采用传统的轴向扫描方式。ScanCache用于缓存扫描索引,加速计算过程。HSIC Gate则根据不同分支特征的依赖关系,动态调整其权重,实现高效的特征融合。对于3D医学图像分割,论文提出了TopoMamba-3D,将上述框架扩展到三维空间。
关键创新:TopoMamba的关键创新在于拓扑感知的扫描方式和依赖感知的融合机制。TopoA-Scan分支通过引入对角/反对角扫描,有效弥补了传统扫描方式的不足,增强了对复杂结构的建模能力。HSIC Gate则通过计算不同分支特征之间的HSIC(希尔伯特-施密特独立性准则),动态调节其权重,实现了高效的特征融合,避免了冗余信息的引入。
关键设计:TopoA-Scan分支的具体实现中,采用了对角和反对角两种扫描顺序,并使用ScanCache机制加速扫描索引的构建。HSIC Gate的实现中,使用了轻量级的网络结构来计算HSIC,并使用sigmoid函数将HSIC值映射到0-1之间,作为分支的权重。损失函数方面,采用了Dice Loss和Cross-Entropy Loss的组合,以平衡分割精度和类别平衡。
🖼️ 关键图片
📊 实验亮点
实验结果表明,TopoMamba在Synapse CT、ISIC 2017皮肤镜检查和CVC-ClinicDB内窥镜检查数据集上均取得了显著的性能提升。例如,在Synapse CT数据集上,TopoMamba在胰腺和胆囊等薄或弯曲目标的分割精度上,相比现有方法有明显提升。此外,TopoMamba在保持良好分割性能的同时,还具有较高的计算效率,适用于动态输入分辨率的场景。
🎯 应用场景
TopoMamba具有广泛的应用前景,可用于各种医学图像分割任务,例如CT、MRI、皮肤镜和内窥镜图像的器官、病灶分割。该方法能够有效提升对复杂结构目标的分割精度,有助于医生更准确地诊断和治疗疾病。未来,该方法有望应用于计算机辅助诊断、手术规划和机器人辅助手术等领域。
📄 摘要(原文)
Visual state-space models (SSMs) have shown strong potential for medical image segmentation, yet their effectiveness is often limited by two practical issues: axis-biased scan ordering weakens the modeling of oblique and curved structures, and naive multi-branch fusion tends to amplify redundant responses. We present TopoMamba, a topology-aware scan-and-fuse framework for segmenting heterogeneous medical visual media. The method combines a diagonal/anti-diagonal TopoA-Scan branch with the standard Cross-Scan branch to provide complementary structural priors, and introduces ScanCache, a device-aware caching mechanism that amortizes explicit scan-index construction across recurring resolutions. To fuse heterogeneous scan features efficiently, we further propose a lightweight HSIC Gate that regulates branch interaction using a dependence-aware scalar gating rule. We also instantiate a volumetric TopoMamba-3D for practical 3D clinical segmentation. Experiments on Synapse CT, ISIC 2017 dermoscopy, and CVC-ClinicDB endoscopy show that TopoMamba consistently improves segmentation quality over strong CNN, Transformer, and SSM baselines, with particularly clear gains on thin or curved targets such as the pancreas and gallbladder, while maintaining favorable deployment efficiency under dynamic input resolutions. These results suggest that topology-aware scan ordering and lightweight dependence-aware fusion form an effective and practical design for medical multimedia segmentation. The code will be made publicly available.