RL-AWB: Deep Reinforcement Learning for Auto White Balance Correction in Low-Light Night-time Scenes

📄 arXiv: 2601.05249 📥 PDF

作者: Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, Yu-Lun Liu

分类: cs.CV

发布日期: 2026-04-07


💡 一句话要点

提出RL-AWB,利用深度强化学习解决低光夜景场景的自动白平衡问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 自动白平衡 深度强化学习 低光照图像 夜间场景 色彩恒常性

📋 核心要点

  1. 夜间场景的自动白平衡受限于低光照噪声和复杂光照,传统方法难以有效处理。
  2. RL-AWB结合统计方法与深度强化学习,动态优化参数,模拟专业人员的白平衡调整过程。
  3. 论文构建了多传感器夜间数据集,实验表明该方法在不同光照条件下均表现出良好的泛化能力。

📝 摘要(中文)

由于低光噪声和复杂的光照条件,夜间色彩恒常性仍然是计算摄影中一个具有挑战性的问题。我们提出了RL-AWB,这是一个结合统计方法和深度强化学习的新型框架,用于夜间白平衡。我们的方法首先采用一种为夜间场景量身定制的统计算法,该算法集成了显著灰像素检测和新型光照估计。在此基础上,我们开发了第一个用于色彩恒常性的深度强化学习方法,它利用统计算法作为其核心,通过动态优化每个图像的参数来模仿专业的AWB调整专家。为了方便跨传感器评估,我们引入了第一个多传感器夜间数据集。实验结果表明,我们的方法在低光和光照良好的图像中都具有卓越的泛化能力。

🔬 方法详解

问题定义:论文旨在解决低光夜间场景中自动白平衡校正的难题。现有方法在处理此类场景时,由于光照不足、噪声干扰以及复杂的光照条件,往往难以获得准确的色彩还原,导致图像偏色严重,影响视觉效果。现有方法的痛点在于对复杂光照的鲁棒性不足,且难以适应不同传感器的特性差异。

核心思路:论文的核心思路是将传统的统计方法与深度强化学习相结合。首先利用统计方法进行初步的光照估计,然后利用深度强化学习动态地调整白平衡参数,从而模拟专业人员的调色过程。这种结合的优势在于,统计方法可以提供一个合理的初始值,而深度强化学习可以根据图像的具体内容进行精细的调整。

技术框架:RL-AWB的整体框架包含以下几个主要模块:1) 统计白平衡模块:该模块采用一种专门为夜间场景设计的统计算法,包括显著灰像素检测和新型光照估计。2) 深度强化学习模块:该模块以统计白平衡模块的输出为基础,通过深度强化学习算法动态优化白平衡参数。3) 多传感器夜间数据集:为了方便跨传感器评估,论文构建了一个包含多个传感器采集的夜间图像数据集。整个流程是先用统计方法进行初步估计,然后用强化学习进行精细调整。

关键创新:论文最重要的技术创新点在于将深度强化学习引入到自动白平衡领域,并将其与传统的统计方法相结合。与现有方法相比,RL-AWB能够根据图像的内容自适应地调整白平衡参数,从而获得更好的色彩还原效果。此外,论文还构建了一个多传感器夜间数据集,为该领域的研究提供了新的资源。

关键设计:在统计白平衡模块中,论文提出了一种新型的光照估计方法,该方法能够有效地抑制噪声干扰。在深度强化学习模块中,论文采用了一种基于策略梯度的强化学习算法,并设计了一个合适的奖励函数,以鼓励智能体学习到最佳的白平衡参数。具体的网络结构和参数设置在论文中有详细描述,但此处未给出具体数值。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,RL-AWB在低光和光照良好的图像中都具有卓越的泛化能力。相较于传统方法,RL-AWB在色彩还原方面取得了显著的提升。具体性能数据(例如PSNR、SSIM等)以及与其他基线方法的对比结果在论文中有详细展示,但此处未给出具体数值。

🎯 应用场景

该研究成果可应用于夜间监控、自动驾驶、夜间摄影等领域。通过提升低光照条件下的图像色彩还原度,可以提高夜间监控的准确性,改善自动驾驶系统的环境感知能力,并为夜间摄影提供更好的图像质量。未来,该技术有望进一步推广到其他图像处理任务中,例如图像增强、目标检测等。

📄 摘要(原文)

Nighttime color constancy still remains a challenging problem in computational photography due to low-light noise and complex illumination conditions. We present RL-AWB, a novel framework combining statistical methods with deep reinforcement learning for nighttime white balance. Our method begins with a statistical algorithm tailored for nighttime scenes, integrating salient gray pixel detection with novel illumination estimation. Building on this foundation, we develop the first deep reinforcement learning approach for color constancy that leverages the statistical algorithm as its core, mimicking professional AWB tuning experts by dynamically optimizing parameters for each image. To facilitate cross-sensor evaluation, we introduce the first multi-sensor nighttime dataset. Experiment results show that our method achieves superior generalization capability across low-light and well-illuminated images. Project page:this https URL