Optimized Minimal 4D Gaussian Splatting

📄 arXiv: 2510.03857v1 📥 PDF

作者: Minseo Lee, Byeonghyeon Lee, Lucas Yunkyu Lee, Eunsoo Lee, Sangmin Kim, Seunghyeon Song, Joo Chan Lee, Jong Hwan Ko, Jaesik Park, Eunbyung Park

分类: cs.CV

发布日期: 2025-10-04

备注: 17 pages, 8 figures

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

OMG4:优化的最小4D高斯溅射,显著降低动态场景表示的存储开销。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 4D高斯溅射 动态场景表示 模型压缩 高斯函数优化 实时渲染

📋 核心要点

  1. 现有4D高斯溅射方法需要大量高斯函数以保证重建质量,导致存储开销巨大,限制了其应用。
  2. OMG4通过高斯采样、修剪和合并三个阶段,构建紧凑的关键高斯函数集合,有效减少冗余信息。
  3. 实验表明,OMG4在保持重建质量的同时,模型大小比现有方法减少超过60%,性能提升显著。

📝 摘要(中文)

4D高斯溅射已成为动态场景表示的新范式,能够实时渲染具有复杂运动的场景。然而,它面临着存储开销大的主要挑战,因为需要数百万个高斯函数才能实现高保真重建。虽然一些研究试图减轻这种内存负担,但它们在压缩率或视觉质量方面仍然面临限制。本文提出了OMG4(优化的最小4D高斯溅射),该框架构建了一组紧凑的显著高斯函数,能够忠实地表示4D高斯模型。我们的方法逐步修剪高斯函数,分为三个阶段:(1)高斯采样,以识别对重建保真度至关重要的基元;(2)高斯修剪,以消除冗余;(3)高斯合并,以融合具有相似特征的基元。此外,我们集成了隐式外观压缩,并将子向量量化(SVQ)推广到4D表示,进一步降低了存储空间,同时保持了质量。在标准基准数据集上的大量实验表明,OMG4明显优于最新的方法,在保持重建质量的同时,将模型大小减少了60%以上。这些结果使OMG4成为紧凑型4D场景表示方面的重要一步,为各种应用开辟了新的可能性。

🔬 方法详解

问题定义:论文旨在解决4D高斯溅射中模型尺寸过大的问题。现有方法虽然尝试压缩模型,但在压缩率和视觉质量之间难以取得平衡,仍然需要大量的存储空间。

核心思路:核心思路是通过逐步筛选和优化高斯函数,保留对场景重建至关重要的部分,去除冗余和相似的高斯函数,从而在不损失视觉质量的前提下,显著降低模型大小。

技术框架:OMG4框架包含三个主要阶段:1. 高斯采样:识别对重建保真度至关重要的基元。2. 高斯修剪:移除冗余的高斯函数。3. 高斯合并:融合具有相似特征的基元。此外,还集成了隐式外观压缩和推广的子向量量化(SVQ)技术。

关键创新:关键创新在于三阶段的高斯函数优化策略,能够有效地识别、去除和合并冗余高斯函数,从而构建一个紧凑且具有代表性的高斯函数集合。同时,将SVQ推广到4D表示,进一步提升了压缩效率。

关键设计:具体的技术细节包括:高斯采样策略的选择,修剪阈值的设定,合并相似性度量的定义,以及隐式外观压缩的具体实现方式。此外,4D SVQ的推广也需要考虑时间维度上的相关性,以保证压缩后的质量。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

OMG4在标准基准数据集上进行了广泛的实验,结果表明,与现有最先进的方法相比,OMG4在保持重建质量的同时,可以将模型大小减少超过60%。这一显著的性能提升证明了OMG4在紧凑型4D场景表示方面的有效性,为相关领域的研究提供了新的思路。

🎯 应用场景

OMG4在动态场景的实时渲染、虚拟现实/增强现实、机器人导航、自动驾驶等领域具有广泛的应用前景。更小的模型尺寸意味着更低的存储和传输成本,使得在移动设备或资源受限的环境中部署高质量的动态场景成为可能。此外,OMG4还可以用于动态场景的编辑和重建,为用户提供更灵活和高效的工具。

📄 摘要(原文)

4D Gaussian Splatting has emerged as a new paradigm for dynamic scene representation, enabling real-time rendering of scenes with complex motions. However, it faces a major challenge of storage overhead, as millions of Gaussians are required for high-fidelity reconstruction. While several studies have attempted to alleviate this memory burden, they still face limitations in compression ratio or visual quality. In this work, we present OMG4 (Optimized Minimal 4D Gaussian Splatting), a framework that constructs a compact set of salient Gaussians capable of faithfully representing 4D Gaussian models. Our method progressively prunes Gaussians in three stages: (1) Gaussian Sampling to identify primitives critical to reconstruction fidelity, (2) Gaussian Pruning to remove redundancies, and (3) Gaussian Merging to fuse primitives with similar characteristics. In addition, we integrate implicit appearance compression and generalize Sub-Vector Quantization (SVQ) to 4D representations, further reducing storage while preserving quality. Extensive experiments on standard benchmark datasets demonstrate that OMG4 significantly outperforms recent state-of-the-art methods, reducing model sizes by over 60% while maintaining reconstruction quality. These results position OMG4 as a significant step forward in compact 4D scene representation, opening new possibilities for a wide range of applications. Our source code is available at https://minshirley.github.io/OMG4/.