Complex-Valued Holographic Radiance Fields
作者: Yicheng Zhan, Dong-Ha Shin, Seung-Hwan Baek, Kaan Akşit
分类: cs.GR, cs.CV, cs.ET
发布日期: 2025-06-10
备注: 28 pages, 21 figures
💡 一句话要点
提出复杂值全息辐射场以解决光的全特性建模问题
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics) 支柱四:生成式动作 (Generative Motion)
关键词: 全息显示 复杂值高斯 三维场景表示 物理渲染 光波建模
📋 核心要点
- 现有方法在三维场景中无法全面建模光的幅度和相位,限制了全息显示的效果。
- 本文提出了一种基于复杂值高斯原语的三维场景表示方法,直接优化光波的特性。
- 实验结果显示,该方法在速度上提升了30倍至10,000倍,同时保持了图像质量,具有显著优势。
📝 摘要(中文)
在三维表示中建模光的全特性,包括幅度和相位,对于推进物理上可信的渲染至关重要,尤其是在全息显示中。为支持这些特性,本文提出了一种新颖的表示方法,通过复杂值高斯原语优化三维场景,避免依赖基于强度的中介。我们利用RGBD多视图图像,直接优化复杂值高斯作为三维全息场景表示,从而消除了计算昂贵的全息图重新优化的需求。与最先进的方法相比,我们的方法在保持图像质量的同时,实现了30倍至10,000倍的速度提升,标志着朝着几何对齐、物理可信的全息场景表示迈出了第一步。
🔬 方法详解
问题定义:本文旨在解决现有三维场景表示方法无法全面建模光的幅度和相位的问题,导致全息显示效果不佳。现有方法通常依赖于强度中介,计算复杂且效率低下。
核心思路:论文提出通过复杂值高斯原语来优化三维场景,直接处理光波的幅度和相位信息,从而避免了传统方法的局限性。该设计使得全息场景的表示更加精确和高效。
技术框架:整体架构包括数据采集、复杂值高斯优化和渲染三个主要模块。首先,通过RGBD多视图图像进行数据采集,然后直接优化复杂值高斯,最后进行高效渲染。
关键创新:最重要的技术创新在于引入复杂值高斯原语作为三维场景的表示方式,与传统的强度基础方法相比,能够更全面地捕捉光的特性,显著提升渲染效率。
关键设计:在参数设置上,优化过程中采用了特定的损失函数,以确保幅度和相位的准确性。同时,网络结构设计上考虑了复杂值的特性,确保了高效的计算和渲染。
📊 实验亮点
实验结果表明,本文方法在速度上相比于最先进的技术实现了30倍至10,000倍的提升,同时保持了相同的图像质量。这一显著的性能提升展示了复杂值高斯原语在全息场景表示中的有效性和优势。
🎯 应用场景
该研究在全息显示、虚拟现实和增强现实等领域具有广泛的应用潜力。通过提供更高效的三维场景表示方法,可以显著提升用户体验和视觉效果,推动相关技术的发展和应用。未来,该方法可能在更复杂的光学场景中得到进一步应用,促进物理上可信的渲染技术进步。
📄 摘要(原文)
Modeling the full properties of light, including both amplitude and phase, in 3D representations is crucial for advancing physically plausible rendering, particularly in holographic displays. To support these features, we propose a novel representation that optimizes 3D scenes without relying on intensity-based intermediaries. We reformulate 3D Gaussian splatting with complex-valued Gaussian primitives, expanding support for rendering with light waves. By leveraging RGBD multi-view images, our method directly optimizes complex-valued Gaussians as a 3D holographic scene representation. This eliminates the need for computationally expensive hologram re-optimization. Compared with state-of-the-art methods, our method achieves 30x-10,000x speed improvements while maintaining on-par image quality, representing a first step towards geometrically aligned, physically plausible holographic scene representations.