RealRep: Generalized SDR-to-HDR Conversion via Attribute-Disentangled Representation Learning

📄 arXiv: 2505.07322v3 📥 PDF

作者: Li Xu, Siqi Wang, Kepeng Xu, Gang He, Lin Zhang, Weiran Wang, Yu-Wing Tai

分类: cs.CV

发布日期: 2025-05-12 (更新: 2025-11-11)

备注: Published on AAAI'26(Oral): The Annual AAAI Conference on Artificial Intelligence


💡 一句话要点

提出RealRep框架,通过解耦表征学习实现SDR到HDR的通用转换。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: SDR到HDR转换 属性解耦 表征学习 对比学习 图像增强 高动态范围 色域重建

📋 核心要点

  1. 现有SDR到HDR转换方法依赖固定色调映射算子,难以应对真实SDR内容的多样性和退化。
  2. RealRep框架通过解耦亮度和色度属性,学习退化感知的表征,提升模型对不同SDR风格的适应性。
  3. 实验表明,RealRep在泛化性和HDR色域重建的感知质量上优于现有方法,实现了更好的转换效果。

📝 摘要(中文)

高动态范围广色域(HDR-WCG)技术日益普及,对标准动态范围(SDR)内容转换为HDR的需求不断增长。现有方法主要依赖于固定的色调映射算子,难以处理真实SDR内容中普遍存在的各种外观和退化。为了解决这个局限性,我们提出了一个通用的SDR到HDR框架,通过学习属性解耦的表征来增强鲁棒性。该框架的核心是Realistic Attribute-Disentangled Representation Learning (RealRep),它显式地解耦亮度和色度分量,以捕获不同SDR分布中内在的内容变化。此外,我们设计了一种亮度/色度感知的负样本生成策略,构建对退化敏感的对比对,有效地建模SDR风格之间的色调差异。在此基础上,我们引入了Degradation-Domain Aware Controlled Mapping Network (DDACMNet),这是一个轻量级的两阶段框架,通过控制感知的归一化机制执行自适应分层映射,通过退化条件特征动态地调节映射过程,从而实现跨不同退化域的鲁棒适应。大量实验表明,RealRep在泛化能力和感知上逼真的HDR色域重建方面始终优于最先进的方法。

🔬 方法详解

问题定义:论文旨在解决现有SDR到HDR转换方法泛化性不足的问题。现有方法依赖固定的色调映射算子,无法有效处理真实世界SDR内容中存在的各种外观和退化,导致转换后的HDR图像质量不佳。

核心思路:论文的核心思路是通过学习属性解耦的表征来增强模型的鲁棒性。具体来说,将图像的亮度和色度信息进行解耦,并学习一个退化感知的表征空间,使得模型能够更好地适应不同SDR风格和退化情况。

技术框架:整体框架包含两个主要部分:Realistic Attribute-Disentangled Representation Learning (RealRep) 和 Degradation-Domain Aware Controlled Mapping Network (DDACMNet)。RealRep负责学习解耦的亮度和色度表征,并生成退化感知的对比样本。DDACMNet是一个两阶段的映射网络,利用RealRep学习到的表征,通过控制感知的归一化机制进行自适应的分层映射。

关键创新:论文的关键创新在于提出了Realistic Attribute-Disentangled Representation Learning (RealRep) 方法,该方法能够显式地解耦亮度和色度分量,并设计了一种亮度/色度感知的负样本生成策略,从而有效地建模SDR风格之间的色调差异。与现有方法相比,RealRep能够更好地捕捉SDR图像的内在属性,并生成更具代表性的表征。

关键设计:RealRep中,使用了对比学习损失函数来训练模型,鼓励模型学习到对退化敏感的表征。DDACMNet中,使用了控制感知的归一化机制,通过退化条件特征动态地调节映射过程。具体的网络结构和参数设置在论文中有详细描述,但未在摘要中体现。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,RealRep在泛化能力和感知上逼真的HDR色域重建方面始终优于最先进的方法。具体性能数据和对比基线在论文中详细给出,摘要中未提供具体数值,但强调了其优越性。

🎯 应用场景

该研究成果可应用于视频内容增强、图像编辑、电影制作等领域,提升SDR内容的视觉体验,使其在高动态范围显示设备上呈现更逼真、更生动的效果。该技术有助于推动HDR技术的普及,并为用户带来更好的视觉享受。

📄 摘要(原文)

High-Dynamic-Range Wide-Color-Gamut (HDR-WCG) technology is becoming increasingly widespread, driving a growing need for converting Standard Dynamic Range (SDR) content to HDR. Existing methods primarily rely on fixed tone mapping operators, which struggle to handle the diverse appearances and degradations commonly present in real-world SDR content. To address this limitation, we propose a generalized SDR-to-HDR framework that enhances robustness by learning attribute-disentangled representations. Central to our approach is Realistic Attribute-Disentangled Representation Learning (RealRep), which explicitly disentangles luminance and chrominance components to capture intrinsic content variations across different SDR distributions. Furthermore, we design a Luma-/Chroma-aware negative exemplar generation strategy that constructs degradation-sensitive contrastive pairs, effectively modeling tone discrepancies across SDR styles. Building on these attribute-level priors, we introduce the Degradation-Domain Aware Controlled Mapping Network (DDACMNet), a lightweight, two-stage framework that performs adaptive hierarchical mapping guided by a control-aware normalization mechanism. DDACMNet dynamically modulates the mapping process via degradation-conditioned features, enabling robust adaptation across diverse degradation domains. Extensive experiments demonstrate that RealRep consistently outperforms state-of-the-art methods in both generalization and perceptually faithful HDR color gamut reconstruction.