CDMamba: Incorporating Local Clues into Mamba for Remote Sensing Image Binary Change Detection
作者: Haotian Zhang, Keyan Chen, Chenyang Liu, Hao Chen, Zhengxia Zou, Zhenwei Shi
分类: cs.CV
发布日期: 2024-06-06 (更新: 2025-05-19)
🔗 代码/项目: GITHUB
💡 一句话要点
CDMamba:融合局部信息的Mamba模型用于遥感图像二元变化检测
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 遥感图像 变化检测 Mamba 局部信息 全局信息 特征融合 深度学习
📋 核心要点
- 现有基于Mamba的变化检测方法侧重全局感受野,忽略了局部信息对密集预测任务的重要性。
- CDMamba通过SRCM块融合Mamba的全局特征提取能力和卷积的局部细节增强能力,弥补细节缺失。
- AGLGF块利用另一时相的全局/局部特征引导双时相特征交互,从而获得更具区分性的变化特征。
📝 摘要(中文)
本文提出了一种名为CDMamba的模型,用于遥感图像二元变化检测任务,旨在有效结合全局和局部特征。现有方法主要通过修改Mamba的扫描模式来增强全局感受野,忽略了局部信息在密集预测任务中的关键作用。CDMamba模型包含Scaled Residual ConvMamba (SRCM)块,利用Mamba提取全局特征的能力和卷积增强局部细节,缓解了现有基于Mamba的方法缺乏细节信息和难以实现精细检测的问题。此外,考虑到变化检测所需的双时相特征交互,提出了自适应全局局部引导融合(AGLGF)块,以动态地促进由其他时相全局/局部特征引导的双时相交互。直觉是,在其他时相特征的指导下,可以获得更具区分性的变化特征。在五个数据集上的大量实验表明,所提出的CDMamba与当前方法具有可比性(例如,在LEVIR+CD和CLCD上,F1/IoU分数分别提高了2.10%/3.00%和2.44%/2.91%)。代码已开源。
🔬 方法详解
问题定义:遥感图像二元变化检测旨在识别不同时相图像中发生变化的区域。现有基于Mamba的方法主要关注全局信息的建模,忽略了局部细节信息,导致在密集预测任务中难以实现精细的变化检测,尤其是在小目标或复杂场景下表现不佳。
核心思路:CDMamba的核心思路是将Mamba的全局建模能力与卷积的局部特征提取能力相结合,同时利用双时相图像的互补信息来提升变化检测的准确性。通过融合全局上下文和局部细节,模型能够更准确地识别变化区域。
技术框架:CDMamba的整体架构包含以下主要模块:1) 特征提取模块:使用卷积神经网络提取双时相图像的初始特征。2) SRCM块:堆叠多个SRCM块,利用Mamba提取全局特征,并使用卷积增强局部细节。3) AGLGF块:利用AGLGF块进行双时相特征交互,其中一个时相的全局/局部特征引导另一个时相的特征学习。4) 分类模块:使用卷积层将融合后的特征映射到变化概率图。
关键创新:CDMamba的关键创新在于SRCM块和AGLGF块的设计。SRCM块将Mamba与卷积相结合,有效融合了全局上下文和局部细节信息。AGLGF块则利用双时相图像的互补信息,通过自适应的方式引导特征融合,从而提升了变化检测的准确性。
关键设计:SRCM块中,Mamba模块采用标准的Mamba架构,卷积层采用3x3卷积,并使用残差连接以加速收敛。AGLGF块中,使用注意力机制来计算全局和局部特征的权重,从而实现自适应的特征融合。损失函数采用二元交叉熵损失函数,用于优化模型参数。
🖼️ 关键图片
📊 实验亮点
在LEVIR+CD和CLCD数据集上,CDMamba的F1/IoU分数分别提高了2.10%/3.00%和2.44%/2.91%,表明其性能优于现有方法。实验结果验证了CDMamba在融合全局和局部信息方面的有效性,以及AGLGF块在双时相特征交互方面的优势。
🎯 应用场景
CDMamba在遥感图像变化检测领域具有广泛的应用前景,可用于城市扩张监测、自然灾害评估、森林砍伐监测、农作物生长监测等。该研究有助于提高变化检测的精度和效率,为相关领域的决策提供更可靠的数据支持,具有重要的实际应用价值和未来发展潜力。
📄 摘要(原文)
Recently, the Mamba architecture based on state space models has demonstrated remarkable performance in a series of natural language processing tasks and has been rapidly applied to remote sensing change detection (CD) tasks. However, most methods enhance the global receptive field by directly modifying the scanning mode of Mamba, neglecting the crucial role that local information plays in dense prediction tasks (e.g., binary CD). In this article, we propose a model called CDMamba, which effectively combines global and local features for handling binary CD tasks. Specifically, the Scaled Residual ConvMamba (SRCM) block is proposed to utilize the ability of Mamba to extract global features and convolution to enhance the local details to alleviate the issue that current Mamba-based methods lack detailed clues and are difficult to achieve fine detection in dense prediction tasks. Furthermore, considering the characteristics of bi-temporal feature interaction required for CD, the Adaptive Global Local Guided Fusion (AGLGF) block is proposed to dynamically facilitate the bi-temporal interaction guided by other temporal global/local features. Our intuition is that more discriminative change features can be acquired with the guidance of other temporal features. Extensive experiments on five datasets demonstrate that our proposed CDMamba is comparable to the current methods (such as the F1/IoU scores are improved by 2.10%/3.00% and 2.44%/2.91% on LEVIR+CD and CLCD, respectively). Our code is open-sourced at https://github.com/zmoka-zht/CDMamba.