Retinexmamba: Retinex-based Mamba for Low-light Image Enhancement

📄 arXiv: 2405.03349v2 📥 PDF

作者: Jiesong Bai, Yuhao Yin, Qiyuan He, Yuanxian Li, Xiaofeng Zhang

分类: cs.CV

发布日期: 2024-05-06 (更新: 2024-05-20)


💡 一句话要点

RetinexMamba:一种基于Retinex理论和Mamba架构的低光照图像增强方法

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 低光照图像增强 Retinex理论 状态空间模型 Mamba架构 深度学习 图像处理 光照估计

📋 核心要点

  1. 传统Retinex方法在低光照下噪声管理和细节保持方面存在困难,而Retinexformer可解释性不足,增强效果有待提升。
  2. RetinexMamba结合Retinex理论和Mamba架构,利用状态空间模型的计算效率,提升低光照图像增强效果。
  3. 实验结果表明,RetinexMamba在LOL数据集上优于现有基于Retinex理论的深度学习方法,验证了其有效性。

📝 摘要(中文)

本文提出了一种名为RetinexMamba的架构,用于低光照图像增强,旨在克服传统Retinex方法和Retinexformer等深度学习技术的局限性。传统Retinex方法虽然模拟人眼对亮度和颜色的感知,但难以处理噪声和保持细节。Retinexformer通过自注意力机制增强光照估计,但缺乏可解释性且增强效果欠佳。RetinexMamba结合了Retinex方法的物理直观性和Retinexformer的深度学习框架,利用状态空间模型(SSM)的计算效率来提高处理速度。该架构包含创新的光照估计器和损伤修复机制,以在增强过程中保持图像质量。此外,RetinexMamba用融合注意力机制取代了Retinexformer中的IG-MSA(光照引导多头注意力),提高了模型的可解释性。在LOL数据集上的实验结果表明,RetinexMamba在定量和定性指标上均优于现有的基于Retinex理论的深度学习方法,验证了其在低光照图像增强方面的有效性和优越性。

🔬 方法详解

问题定义:论文旨在解决低光照图像增强问题。现有方法,如传统Retinex方法,在噪声抑制和细节保持方面表现不佳。Retinexformer虽然利用深度学习,但其自注意力机制缺乏可解释性,且增强效果仍有提升空间。

核心思路:RetinexMamba的核心思路是将传统Retinex理论的物理直观性与深度学习框架相结合,并利用状态空间模型(SSM)的计算效率。通过模拟人眼对光照和反射的感知,并结合深度学习的强大表征能力,实现更有效的低光照图像增强。

技术框架:RetinexMamba的整体架构基于Retinexformer,但进行了关键改进。它包含光照估计器和损伤修复机制,用于分别估计图像的光照分量和修复图像中的损伤。关键在于用Mamba架构替换了Retinexformer中的自注意力机制。

关键创新:RetinexMamba的关键创新在于使用Mamba架构来建模图像的光照和反射分量之间的关系。Mamba架构是一种状态空间模型,具有高效的计算能力和长距离依赖建模能力,能够更好地捕捉图像中的全局信息。此外,RetinexMamba还引入了融合注意力机制,取代了Retinexformer中的光照引导多头注意力(IG-MSA),提高了模型的可解释性。

关键设计:RetinexMamba的关键设计包括:1) 使用状态空间模型(Mamba)来建模光照和反射分量;2) 设计了光照估计器和损伤修复机制,以提高增强效果;3) 使用融合注意力机制来提高模型的可解释性。具体的参数设置和损失函数等细节在论文中进行了详细描述(未知)。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

RetinexMamba在LOL数据集上的实验结果表明,其在定量和定性指标上均优于现有的基于Retinex理论的深度学习方法。具体性能数据(如PSNR、SSIM等)和提升幅度在论文中进行了详细展示(未知)。实验结果验证了RetinexMamba在低光照图像增强方面的有效性和优越性。

🎯 应用场景

RetinexMamba在安防监控、医学影像、自动驾驶等领域具有广泛的应用前景。在安防监控中,可以提高低光照环境下的图像质量,增强目标检测和识别的准确性。在医学影像中,可以改善低剂量CT图像的质量,降低辐射剂量。在自动驾驶中,可以提高夜间或弱光环境下的感知能力,增强驾驶安全性。该研究的实际价值在于提供了一种更有效、更可解释的低光照图像增强方法,未来可能推动相关领域的技术发展。

📄 摘要(原文)

In the field of low-light image enhancement, both traditional Retinex methods and advanced deep learning techniques such as Retinexformer have shown distinct advantages and limitations. Traditional Retinex methods, designed to mimic the human eye's perception of brightness and color, decompose images into illumination and reflection components but struggle with noise management and detail preservation under low light conditions. Retinexformer enhances illumination estimation through traditional self-attention mechanisms, but faces challenges with insufficient interpretability and suboptimal enhancement effects. To overcome these limitations, this paper introduces the RetinexMamba architecture. RetinexMamba not only captures the physical intuitiveness of traditional Retinex methods but also integrates the deep learning framework of Retinexformer, leveraging the computational efficiency of State Space Models (SSMs) to enhance processing speed. This architecture features innovative illumination estimators and damage restorer mechanisms that maintain image quality during enhancement. Moreover, RetinexMamba replaces the IG-MSA (Illumination-Guided Multi-Head Attention) in Retinexformer with a Fused-Attention mechanism, improving the model's interpretability. Experimental evaluations on the LOL dataset show that RetinexMamba outperforms existing deep learning approaches based on Retinex theory in both quantitative and qualitative metrics, confirming its effectiveness and superiority in enhancing low-light images.