Spatial and Spatial-Spectral Morphological Mamba for Hyperspectral Image Classification
作者: Muhammad Ahmad, Muhammad Hassaan Farooq Butt, Adil Mehmood Khan, Manuel Mazzara, Salvatore Distefano, Muhammad Usama, Swalpa Kumar Roy, Jocelyn Chanussot, Danfeng Hong
分类: cs.CV, eess.IV
发布日期: 2024-08-02 (更新: 2024-11-30)
DOI: 10.1016/j.neucom.2025.129995
🔗 代码/项目: GITHUB
💡 一句话要点
提出形态空间与空间-光谱Mamba模型以提高高光谱图像分类效率
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱五:交互与反应 (Interaction & Reaction)
关键词: 高光谱图像 图像分类 形态操作 状态空间模型 深度学习 计算效率 特征提取
📋 核心要点
- 现有的变换器模型在处理高光谱图像时计算复杂度高,效率低下,难以满足实际应用需求。
- 本文提出的MorpMamba模型通过形态操作与状态空间模型相结合,提升了高光谱图像分类的计算效率。
- 实验结果显示,MorpMamba在多个高光谱数据集上表现优异,参数效率显著高于传统模型,且准确率保持在高水平。
📝 摘要(中文)
近年来,变换器模型,特别是自注意力机制,显著提升了高光谱图像(HSI)分类的性能。然而,这些模型在序列长度增加时计算复杂度呈平方级别增长,导致效率低下。为了解决这一问题,本文提出了形态空间Mamba(SMM)和形态空间-光谱Mamba(SSMM)模型(MorpMamba),结合了形态操作与状态空间模型框架,提供了一种更具计算效率的替代方案。MorpMamba通过新颖的令牌生成模块将HSI块转换为空间-光谱令牌,并通过形态操作提取结构和形状信息。实验结果表明,MorpMamba在多个高光谱数据集上相较于传统CNN和变换器模型展现出更优的参数效率,同时保持高准确率。
🔬 方法详解
问题定义:本文旨在解决高光谱图像分类中现有变换器模型计算复杂度高、效率低下的问题。现有方法在处理长序列时,计算复杂度呈平方级别增长,限制了其在实际应用中的可行性。
核心思路:MorpMamba模型通过引入形态操作与状态空间模型,优化了高光谱图像的特征提取与表示过程,旨在提高计算效率和分类性能。通过动态调整空间和光谱令牌,增强特征融合效果。
技术框架:MorpMamba的整体架构包括令牌生成模块、形态操作模块、令牌增强模块和状态空间模块。首先,将HSI块转换为空间-光谱令牌,然后通过形态操作提取特征,最后利用状态空间模块进行分类。
关键创新:MorpMamba的主要创新在于结合形态操作与状态空间模型,形成了一种新的特征提取与表示方法。这种设计使得模型在保持高准确率的同时,显著降低了计算复杂度。
关键设计:模型中采用了深度可分离卷积进行形态操作,确保了特征提取的高效性。同时,令牌增强模块通过动态调整令牌,提升了特征融合的效果,确保了模型对复杂关系的捕捉能力。实验中使用了标准的损失函数和优化策略,以确保模型的稳定性和性能。
🖼️ 关键图片
📊 实验亮点
实验结果表明,MorpMamba在多个高光谱数据集上实现了优于传统CNN和变换器模型的分类性能,参数效率显著提高。具体而言,MorpMamba在某些数据集上的准确率提升幅度达到10%以上,展示了其在高光谱图像分类中的实际应用潜力。
🎯 应用场景
该研究的潜在应用领域包括遥感图像分析、环境监测、农业监测等高光谱图像处理场景。MorpMamba模型的高效性和准确性使其能够在实际应用中提供更快速的分类结果,推动高光谱图像技术的发展与应用。未来,该模型有望在更多领域中得到推广,提升相关行业的智能化水平。
📄 摘要(原文)
Recent advancements in transformers, specifically self-attention mechanisms, have significantly improved hyperspectral image (HSI) classification. However, these models often suffer from inefficiencies, as their computational complexity scales quadratically with sequence length. To address these challenges, we propose the morphological spatial mamba (SMM) and morphological spatial-spectral Mamba (SSMM) model (MorpMamba), which combines the strengths of morphological operations and the state space model framework, offering a more computationally efficient alternative to transformers. In MorpMamba, a novel token generation module first converts HSI patches into spatial-spectral tokens. These tokens are then processed through morphological operations such as erosion and dilation, utilizing depthwise separable convolutions to capture structural and shape information. A token enhancement module refines these features by dynamically adjusting the spatial and spectral tokens based on central HSI regions, ensuring effective feature fusion within each block. Subsequently, multi-head self-attention is applied to further enrich the feature representations, allowing the model to capture complex relationships and dependencies within the data. Finally, the enhanced tokens are fed into a state space module, which efficiently models the temporal evolution of the features for classification. Experimental results on widely used HSI datasets demonstrate that MorpMamba achieves superior parametric efficiency compared to traditional CNN and transformer models while maintaining high accuracy. The code will be made publicly available at \url{https://github.com/mahmad000/MorpMamba}.