DB-MSMUNet:Dual Branch Multi-scale Mamba UNet for Pancreatic CT Scans Segmentation

📄 arXiv: 2601.04676v1 📥 PDF

作者: Qiu Guan, Zhiqiang Yang, Dezhang Ye, Yang Chen, Xinli Xu, Ying Tang

分类: cs.CV

发布日期: 2026-01-08


💡 一句话要点

提出DB-MSMUNet,用于胰腺CT扫描分割,提升分割精度和边缘细节。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 胰腺分割 CT图像 深度学习 UNet Mamba 多尺度特征 双分支解码器

📋 核心要点

  1. 胰腺CT分割面临组织对比度低、边界模糊、形状不规则和小病灶等挑战,影响诊断精度。
  2. DB-MSMUNet采用双分支解码器和多尺度Mamba模块,增强全局上下文建模和边缘细节捕捉能力。
  3. 实验表明,DB-MSMUNet在三个数据集上均优于现有方法,显著提升了分割精度和鲁棒性。

📝 摘要(中文)

胰腺及其病灶在CT扫描中的精确分割对于胰腺癌的精确诊断和治疗至关重要。然而,由于与周围器官的组织对比度低、解剖边界模糊、器官形状不规则以及病灶尺寸小等多种因素,这仍然是一项极具挑战性的任务。为了解决这些问题,我们提出了一种新的编码器-解码器架构DB-MSMUNet(双分支多尺度Mamba UNet),专门为鲁棒的胰腺分割而设计。编码器使用多尺度Mamba模块(MSMM)构建,该模块结合了可变形卷积和多尺度状态空间建模,以增强全局上下文建模和局部形变适应。该网络采用双解码器设计:边缘解码器引入边缘增强路径(EEP)以显式捕获边界线索并细化模糊轮廓,而区域解码器结合多层解码器(MLD)以通过利用多尺度深度语义特征来保留精细细节并准确重建小病灶。此外,在两个解码器的多个尺度上添加辅助深度监督(ADS)头,提供更准确的梯度反馈,并进一步增强多尺度特征的判别能力。我们在三个数据集上进行了广泛的实验:NIH胰腺数据集、MSD数据集以及合作医院提供的临床胰腺肿瘤数据集。DB-MSMUNet实现了89.47%、87.59%和89.02%的Dice相似系数,在分割精度、边缘保持和跨不同数据集的鲁棒性方面优于大多数现有的最先进方法。这些结果证明了所提出的方法在实际胰腺CT分割任务中的有效性和泛化性。

🔬 方法详解

问题定义:胰腺CT图像分割旨在精确识别和分割胰腺及其病灶区域。现有方法在处理低对比度、模糊边界和小尺寸病灶时表现不佳,容易造成分割不准确,影响后续的诊断和治疗计划。现有方法难以兼顾全局上下文信息和局部细节特征,导致分割结果的鲁棒性较差。

核心思路:DB-MSMUNet的核心思路是利用双分支解码器分别处理边缘信息和区域信息,并结合多尺度Mamba模块增强特征表示能力。边缘解码器专注于捕捉胰腺的边界信息,区域解码器则负责重建胰腺的整体形状和细节。多尺度Mamba模块能够有效地建模全局上下文信息,并自适应地调整局部形变,从而提高分割的准确性和鲁棒性。

技术框架:DB-MSMUNet采用编码器-解码器结构。编码器由多尺度Mamba模块(MSMM)构成,用于提取多尺度特征。解码器分为两个分支:边缘解码器和区域解码器。边缘解码器包含边缘增强路径(EEP),用于显式地捕获边界线索。区域解码器包含多层解码器(MLD),用于保留精细细节。此外,网络还使用了辅助深度监督(ADS)头,以提供更准确的梯度反馈。

关键创新:DB-MSMUNet的关键创新在于以下几点:1) 提出了多尺度Mamba模块(MSMM),结合了可变形卷积和多尺度状态空间建模,增强了全局上下文建模和局部形变适应能力。2) 采用了双分支解码器设计,分别处理边缘信息和区域信息,提高了分割的准确性和细节保留能力。3) 引入了辅助深度监督(ADS)头,提供了更准确的梯度反馈,增强了多尺度特征的判别能力。

关键设计:多尺度Mamba模块(MSMM)通过不同尺度的状态空间模型捕捉不同尺度的上下文信息。边缘增强路径(EEP)使用卷积操作提取边缘特征,并将其与解码器特征融合。多层解码器(MLD)通过多层卷积和上采样操作重建胰腺区域。辅助深度监督(ADS)头位于解码器的多个尺度上,使用Dice损失函数进行监督。

📊 实验亮点

DB-MSMUNet在NIH Pancreas数据集、MSD数据集和临床胰腺肿瘤数据集上分别取得了89.47%、87.59%和89.02%的Dice相似系数,显著优于现有方法。例如,在NIH Pancreas数据集上,DB-MSMUNet的Dice系数比现有最佳方法提高了约1-2个百分点,证明了其优越的分割性能。

🎯 应用场景

DB-MSMUNet可应用于胰腺癌的计算机辅助诊断、手术规划和疗效评估。通过精确分割胰腺及其病灶,医生可以更准确地评估病情,制定个性化的治疗方案,并监测治疗效果。该技术还可扩展到其他医学图像分割任务,例如肝脏、肺部等器官的分割。

📄 摘要(原文)

Accurate segmentation of the pancreas and its lesions in CT scans is crucial for the precise diagnosis and treatment of pancreatic cancer. However, it remains a highly challenging task due to several factors such as low tissue contrast with surrounding organs, blurry anatomical boundaries, irregular organ shapes, and the small size of lesions. To tackle these issues, we propose DB-MSMUNet (Dual-Branch Multi-scale Mamba UNet), a novel encoder-decoder architecture designed specifically for robust pancreatic segmentation. The encoder is constructed using a Multi-scale Mamba Module (MSMM), which combines deformable convolutions and multi-scale state space modeling to enhance both global context modeling and local deformation adaptation. The network employs a dual-decoder design: the edge decoder introduces an Edge Enhancement Path (EEP) to explicitly capture boundary cues and refine fuzzy contours, while the area decoder incorporates a Multi-layer Decoder (MLD) to preserve fine-grained details and accurately reconstruct small lesions by leveraging multi-scale deep semantic features. Furthermore, Auxiliary Deep Supervision (ADS) heads are added at multiple scales to both decoders, providing more accurate gradient feedback and further enhancing the discriminative capability of multi-scale features. We conduct extensive experiments on three datasets: the NIH Pancreas dataset, the MSD dataset, and a clinical pancreatic tumor dataset provided by collaborating hospitals. DB-MSMUNet achieves Dice Similarity Coefficients of 89.47%, 87.59%, and 89.02%, respectively, outperforming most existing state-of-the-art methods in terms of segmentation accuracy, edge preservation, and robustness across different datasets. These results demonstrate the effectiveness and generalizability of the proposed method for real-world pancreatic CT segmentation tasks.