WDMamba: When Wavelet Degradation Prior Meets Vision Mamba for Image Dehazing

📄 arXiv: 2505.04369v1 📥 PDF

作者: Jie Sun, Heng Liu, Yongzhen Wang, Xiao-Ping Zhang, Mingqiang Wei

分类: cs.CV

发布日期: 2025-05-07

🔗 代码/项目: GITHUB


💡 一句话要点

WDMamba:结合小波退化先验与Vision Mamba的图像去雾方法

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 图像去雾 Vision Mamba 小波变换 低频恢复 细节增强 对比正则化 状态空间模型

📋 核心要点

  1. 现有去雾方法难以有效区分雾霾信息与图像细节,导致去雾效果不佳或细节丢失。
  2. WDMamba利用雾霾主要存在于低频分量的小波退化先验,分阶段进行低频恢复和细节增强。
  3. 实验表明,WDMamba在多个去雾基准数据集上超越了现有最佳方法,实现了更好的去雾效果。

📝 摘要(中文)

本文揭示了一种新的雾霾特定的小波退化先验,该先验通过小波变换分析观察到,雾霾相关信息主要存在于低频分量中。利用这一洞察力,我们提出了一种新的去雾框架WDMamba,它将图像去雾任务分解为两个连续的阶段:低频恢复和细节增强。这种由粗到精的策略使WDMamba能够有效地捕获去雾过程中每个阶段的特定特征,从而产生高质量的恢复图像。具体来说,在低频恢复阶段,我们集成了Mamba块,以线性复杂度重建全局结构,有效地去除整体雾霾并产生粗略的恢复图像。此后,细节增强阶段恢复了在前一阶段可能被忽略的细粒度信息,最终得到最终的去雾输出。此外,为了增强细节保留并实现更自然的去雾效果,我们在网络训练期间引入了自引导对比正则化。通过利用粗略恢复的输出作为硬负例,我们的模型学习更具区分性的表示,从而大大提高了整体去雾性能。在公共去雾基准上的大量评估表明,我们的方法在质量和数量上都超过了最先进的方法。

🔬 方法详解

问题定义:图像去雾旨在从含有雾霾的图像中恢复出清晰的图像。现有方法通常难以有效区分雾霾信息和图像细节,导致去雾后的图像出现伪影、颜色失真或细节丢失等问题。因此,如何更准确地去除雾霾并保留图像细节是图像去雾领域的一个关键挑战。

核心思路:WDMamba的核心思路是利用雾霾在小波域主要集中于低频分量的特性,将去雾过程分解为两个阶段:首先进行低频恢复,去除主要的雾霾影响,然后进行细节增强,恢复可能在第一阶段丢失的细节信息。这种由粗到精的策略能够更有效地处理雾霾,并保留图像的细节信息。

技术框架:WDMamba框架包含两个主要阶段:低频恢复阶段和细节增强阶段。在低频恢复阶段,输入图像首先经过小波分解,提取低频分量。然后,Mamba块被用于处理这些低频分量,以去除雾霾并重建全局结构。在细节增强阶段,将低频恢复阶段的输出与原始图像结合,利用Mamba块恢复图像的细节信息,最终得到去雾后的图像。

关键创新:WDMamba的关键创新在于以下几点:1) 提出了一种新的雾霾特定的小波退化先验,为去雾算法的设计提供了新的视角。2) 将Mamba块引入到图像去雾任务中,利用其线性复杂度和全局建模能力,提高了去雾效率和效果。3) 引入了自引导对比正则化,通过将粗略恢复的输出作为硬负例,增强了模型的细节保留能力。

关键设计:在低频恢复和细节增强阶段,都使用了Mamba块作为核心处理单元。Mamba块的设计细节(如状态空间模型的具体参数设置)对最终的去雾效果有重要影响,但论文中可能没有详细描述。此外,自引导对比正则化的具体实现方式,包括损失函数的选择和参数设置,也是影响模型性能的关键因素。具体的小波分解方式(例如使用哪种小波基函数)也可能影响最终结果。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

WDMamba在多个公开的图像去雾基准数据集上取得了显著的性能提升。与现有最先进的方法相比,WDMamba在PSNR和SSIM等指标上均有明显提高,并且在视觉效果上能够更好地去除雾霾并保留图像细节。代码已开源,方便研究人员复现和进一步研究。

🎯 应用场景

WDMamba在智能交通、安防监控、遥感图像处理等领域具有广泛的应用前景。在这些领域,图像质量受到雾霾等恶劣天气条件的影响,WDMamba可以有效地提高图像的清晰度,从而提升相关系统的性能和可靠性。例如,在自动驾驶系统中,WDMamba可以帮助车辆在雾霾天气下更准确地识别道路和障碍物,提高驾驶安全性。

📄 摘要(原文)

In this paper, we reveal a novel haze-specific wavelet degradation prior observed through wavelet transform analysis, which shows that haze-related information predominantly resides in low-frequency components. Exploiting this insight, we propose a novel dehazing framework, WDMamba, which decomposes the image dehazing task into two sequential stages: low-frequency restoration followed by detail enhancement. This coarse-to-fine strategy enables WDMamba to effectively capture features specific to each stage of the dehazing process, resulting in high-quality restored images. Specifically, in the low-frequency restoration stage, we integrate Mamba blocks to reconstruct global structures with linear complexity, efficiently removing overall haze and producing a coarse restored image. Thereafter, the detail enhancement stage reinstates fine-grained information that may have been overlooked during the previous phase, culminating in the final dehazed output. Furthermore, to enhance detail retention and achieve more natural dehazing, we introduce a self-guided contrastive regularization during network training. By utilizing the coarse restored output as a hard negative example, our model learns more discriminative representations, substantially boosting the overall dehazing performance. Extensive evaluations on public dehazing benchmarks demonstrate that our method surpasses state-of-the-art approaches both qualitatively and quantitatively. Code is available at https://github.com/SunJ000/WDMamba.