DPMambaIR: All-in-One Image Restoration via Degradation-Aware Prompt State Space Model
作者: Zhanwen Liu, Sai Zhou, Yuchao Dai, Yang Wang, Yisheng An, Xiangmo Zhao
分类: cs.CV
发布日期: 2025-04-24 (更新: 2025-10-29)
💡 一句话要点
DPMambaIR:基于退化感知提示状态空间模型的全能图像复原
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 图像复原 全能模型 状态空间模型 退化感知 Mamba 深度学习 计算机视觉
📋 核心要点
- 现有全能图像复原方法在细粒度退化建模和平衡多任务冲突方面存在不足。
- DPMambaIR通过引入细粒度退化提取器和退化感知提示状态空间模型(DP-SSM)来解决上述问题。
- 实验表明,DPMambaIR在包含七种退化类型的混合数据集上取得了最佳的图像复原性能。
📝 摘要(中文)
本文提出了一种名为DPMambaIR的新型全能图像复原框架,旨在利用单一模型解决多种图像退化问题。现有方法通常依赖于特定退化模型或粗粒度的退化提示,缺乏对退化信息的细粒度建模,并且难以平衡多任务冲突。为了克服这些限制,DPMambaIR引入了细粒度的退化提取器和一个退化感知提示状态空间模型(DP-SSM)。DP-SSM利用提取器捕获的细粒度退化特征作为动态提示,并将其融入状态空间建模过程,从而增强模型对不同退化类型的适应性。此外,还设计了一个互补的高频增强块(HEB)来恢复局部高频细节。在包含七种退化类型的混合数据集上的大量实验表明,DPMambaIR取得了最佳性能,PSNR达到27.69dB,SSIM达到0.893。这些结果突显了DPMambaIR作为全能图像复原统一解决方案的潜力和优越性。
🔬 方法详解
问题定义:全能图像复原旨在用单个模型处理多种图像退化问题,但现有方法要么依赖于特定退化模型,缺乏通用性;要么使用粗粒度的退化提示,无法充分利用退化信息。此外,不同退化类型之间的任务冲突也限制了模型的性能。
核心思路:本文的核心思路是利用细粒度的退化信息来指导图像复原过程。通过设计一个退化提取器来捕获图像中细微的退化特征,并将其作为动态提示融入到状态空间模型中,从而使模型能够自适应地处理不同的退化类型。
技术框架:DPMambaIR框架主要包含三个部分:细粒度退化提取器、退化感知提示状态空间模型(DP-SSM)和高频增强块(HEB)。首先,退化提取器从输入图像中提取细粒度的退化特征。然后,DP-SSM利用这些特征作为动态提示,指导状态空间建模过程,从而实现对退化信息的有效利用。最后,HEB用于恢复图像的局部高频细节,进一步提升复原效果。
关键创新:DPMambaIR的关键创新在于提出了退化感知提示状态空间模型(DP-SSM)。与传统的状态空间模型不同,DP-SSM能够动态地利用退化特征作为提示,从而更好地适应不同的退化类型。这种动态提示机制使得模型能够更加灵活地处理各种复杂的图像退化问题。
关键设计:退化提取器采用卷积神经网络结构,用于提取图像的低级特征和高级语义信息,从而捕获细粒度的退化特征。DP-SSM基于Mamba架构,通过将退化特征作为动态提示注入到状态转移矩阵中,实现对退化信息的有效利用。HEB采用残差连接和卷积层,用于恢复图像的局部高频细节。损失函数包括L1损失和感知损失,用于优化模型的复原效果。
🖼️ 关键图片
📊 实验亮点
DPMambaIR在包含七种退化类型的混合数据集上取得了显著的性能提升。实验结果表明,DPMambaIR的PSNR达到27.69dB,SSIM达到0.893,优于现有的全能图像复原方法。与次优方法相比,PSNR提升了超过0.5dB,SSIM提升了超过0.01。这些结果充分证明了DPMambaIR在全能图像复原方面的优越性。
🎯 应用场景
DPMambaIR具有广泛的应用前景,可用于各种图像复原任务,例如图像去噪、图像去模糊、图像超分辨率等。该模型可以应用于医学图像处理、遥感图像处理、视频监控等领域,提高图像质量,改善视觉效果,为后续分析和应用提供更好的数据基础。未来,该研究可以扩展到视频复原领域,解决视频中的各种退化问题。
📄 摘要(原文)
All-in-One image restoration aims to address multiple image degradation problems using a single model, offering a more practical and versatile solution compared to designing dedicated models for each degradation type. Existing approaches typically rely on Degradation-specific models or coarse-grained degradation prompts to guide image restoration. However, they lack fine-grained modeling of degradation information and face limitations in balancing multi-task conflicts. To overcome these limitations, we propose DPMambaIR, a novel All-in-One image restoration framework that introduces a fine-grained degradation extractor and a Degradation-Aware Prompt State Space Model (DP-SSM). The DP-SSM leverages the fine-grained degradation features captured by the extractor as dynamic prompts, which are then incorporated into the state space modeling process. This enhances the model's adaptability to diverse degradation types, while a complementary High-Frequency Enhancement Block (HEB) recovers local high-frequency details. Extensive experiments on a mixed dataset containing seven degradation types show that DPMambaIR achieves the best performance, with 27.69dB and 0.893 in PSNR and SSIM, respectively. These results highlight the potential and superiority of DPMambaIR as a unified solution for All-in-One image restoration.