MambaLiteUNet: Cross-Gated Adaptive Feature Fusion for Robust Skin Lesion Segmentation

📄 arXiv: 2604.20286v1 📥 PDF

作者: Md Maklachur Rahman, Soon Ki Jung, Tracy Hammond

分类: cs.CV, cs.AI

发布日期: 2026-04-22

备注: Accepted at CVPR 2026 Main

🔗 代码/项目: GITHUB


💡 一句话要点

提出MambaLiteUNet,通过跨门控自适应特征融合实现鲁棒的皮肤病灶分割

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 皮肤病灶分割 Mamba模型 U-Net 自适应特征融合 跨门控注意力 医学图像处理 领域泛化

📋 核心要点

  1. 现有分割模型在减少参数量和计算复杂度方面表现出潜力,但难以准确描绘精细的病灶边界和纹理模式。
  2. MambaLiteUNet将Mamba状态空间模型融入U-Net,并设计AMF、LGFM和CGA模块,增强局部-全局特征交互,保留空间细节。
  3. 实验结果表明,MambaLiteUNet在多个皮肤病灶分割数据集上优于现有模型,并在领域泛化方面表现出色,同时显著降低了参数量和计算量。

📝 摘要(中文)

本文提出了一种紧凑而鲁棒的分割框架MambaLiteUNet,它将Mamba状态空间建模集成到U-Net架构中,并结合了三个关键模块:自适应多分支Mamba特征融合(AMF)、局部-全局特征混合(LGFM)和跨门控注意力(CGA)。这些模块旨在增强局部-全局特征交互,保留空间细节,并提高跳跃连接的质量。在ISIC2017、ISIC2018、HAM10000和PH2基准测试中,MambaLiteUNet实现了87.12%的平均IoU和93.09%的平均Dice系数,优于最先进的模型。与U-Net相比,我们的模型将平均IoU和Dice分别提高了7.72和4.61个百分点,同时将参数减少了93.6%,GFLOPs减少了97.6%。此外,在具有六个未见病灶类别的领域泛化中,MambaLiteUNet实现了77.61%的IoU和87.23%的Dice,在所有评估模型中表现最佳。大量实验表明,MambaLiteUNet在准确性和效率之间取得了强大的平衡,使其成为皮肤病图像分割的一个有竞争力和实用的解决方案。我们的代码已在https://github.com/maklachur/MambaLiteUNet上公开。

🔬 方法详解

问题定义:论文旨在解决皮肤病灶分割任务中,现有模型在准确性和效率之间难以平衡的问题。现有模型通常参数量大、计算复杂度高,难以部署到资源受限的设备上,并且在精细病灶边界和纹理分割方面表现不佳。

核心思路:论文的核心思路是将Mamba状态空间模型与U-Net架构相结合,利用Mamba模型的长程依赖建模能力和高效计算特性,同时通过引入自适应特征融合和注意力机制,增强局部-全局特征交互,提高分割精度。这样设计的目的是在保证分割精度的前提下,显著降低模型的参数量和计算复杂度。

技术框架:MambaLiteUNet的整体架构是一个U-Net结构,包含编码器、解码器和跳跃连接。编码器和解码器中集成了Mamba状态空间模型,用于提取和处理特征。此外,还包括三个关键模块: 1. 自适应多分支Mamba特征融合(AMF):用于融合来自不同分支的Mamba特征,增强特征的多样性和表达能力。 2. 局部-全局特征混合(LGFM):用于混合局部和全局特征,提高模型对上下文信息的感知能力。 3. 跨门控注意力(CGA):用于增强跳跃连接的质量,将编码器的特征更好地传递到解码器。

关键创新:论文最重要的技术创新点在于将Mamba状态空间模型引入到皮肤病灶分割任务中,并设计了AMF、LGFM和CGA模块,从而在准确性和效率之间取得了更好的平衡。与现有方法相比,MambaLiteUNet能够以更少的参数和计算量,实现更高的分割精度和更好的领域泛化能力。

关键设计:AMF模块采用多分支结构,每个分支包含不同的卷积核大小,以提取不同尺度的特征。LGFM模块使用可分离卷积来降低计算复杂度。CGA模块使用跨门控机制来选择性地传递编码器的特征,从而提高跳跃连接的质量。具体的参数设置和损失函数细节在论文中未明确说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

MambaLiteUNet在ISIC2017、ISIC2018、HAM10000和PH2数据集上取得了显著的性能提升,平均IoU达到87.12%,平均Dice系数达到93.09%,优于现有模型。与U-Net相比,IoU和Dice分别提高了7.72和4.61个百分点,同时参数量减少了93.6%,GFLOPs减少了97.6%。在领域泛化实验中,MambaLiteUNet在六个未见病灶类别上实现了77.61%的IoU和87.23%的Dice,表现最佳。

🎯 应用场景

该研究成果可应用于皮肤癌的早期诊断和治疗计划制定。通过高效准确的皮肤病灶分割,医生可以更好地识别和评估病灶,从而提高诊断的准确性和效率。此外,该模型还可以部署到移动设备或嵌入式系统中,为偏远地区或资源匮乏的医疗机构提供支持。未来,该技术有望扩展到其他医学图像分割任务中。

📄 摘要(原文)

Recent segmentation models have demonstrated promising efficiency by aggressively reducing parameter counts and computational complexity. However, these models often struggle to accurately delineate fine lesion boundaries and texture patterns essential for early skin cancer diagnosis and treatment planning. In this paper, we propose MambaLiteUNet, a compact yet robust segmentation framework that integrates Mamba state space modeling into a U-Net architecture, along with three key modules: Adaptive Multi-Branch Mamba Feature Fusion (AMF), Local-Global Feature Mixing (LGFM), and Cross-Gated Attention (CGA). These modules are designed to enhance local-global feature interaction, preserve spatial details, and improve the quality of skip connections. MambaLiteUNet achieves an average IoU of 87.12% and average Dice score of 93.09% across ISIC2017, ISIC2018, HAM10000, and PH2 benchmarks, outperforming state-of-the-art models. Compared to U-Net, our model improves average IoU and Dice by 7.72 and 4.61 points, respectively, while reducing parameters by 93.6% and GFLOPs by 97.6%. Additionally, in domain generalization with six unseen lesion categories, MambaLiteUNet achieves 77.61% IoU and 87.23% Dice, performing best among all evaluated models. Our extensive experiments demonstrate that MambaLiteUNet achieves a strong balance between accuracy and efficiency, making it a competitive and practical solution for dermatological image segmentation. Our code is publicly available at: https://github.com/maklachur/MambaLiteUNet.