Lightweight 3D Gaussian Splatting Compression via Video Codec
作者: Qi Yang, Geert Van Der Auwera, Zhu Li
分类: cs.CV
发布日期: 2025-12-12
备注: Accepted by DCC2026 Oral
🔗 代码/项目: GITHUB
💡 一句话要点
提出基于视频编解码器的轻量级3D高斯溅射压缩方法,提升低比特率下的压缩性能。
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 3D高斯溅射 视频压缩 Morton扫描 主成分分析 率失真优化 轻量级编码 MiniPLAS
📋 核心要点
- 现有基于视频的GS压缩方法依赖于并行线性分配排序(PLAS),计算量大且耗时,限制了GS在轻量级设备上的应用。
- 论文提出一种轻量级3D高斯溅射压缩方法,通过两阶段Morton扫描生成块状2D映射,并结合PCA降维和MiniPLAS优化中低比特率性能。
- 实验结果表明,该方法在率失真性能上优于现有方法20%以上,同时显著降低了2D映射生成时间和编码时间。
📝 摘要(中文)
本文提出了一种基于视频编解码器的轻量级3D高斯溅射(GS)压缩方法(LGSCV)。该方法首先采用一种两阶段Morton扫描,生成适用于标准视频编解码器的块状2D映射,其中编码单元(CU)是方形块。具体而言,使用3D Morton扫描置换GS图元,然后使用2D Morton扫描以块状方式将排序后的GS图元映射到2D映射。为了解决块状2D映射在中低比特率下质量下降的问题,采用主成分分析(PCA)来降低球谐函数(SH)的维度,并设计了一种灵活快速的MiniPLAS来置换特定块大小内的图元。结合SH PCA和MiniPLAS显著提高了率失真(RD)性能,尤其是在中低比特率下。MiniPLAS还可以指导编解码器CU大小配置,并显著减少编码时间。在MPEG数据集上的实验结果表明,所提出的LGSCV与最先进的方法相比,实现了超过20%的RD增益,同时将2D映射生成时间减少到大约1秒,并将编码时间减少了50%。
🔬 方法详解
问题定义:现有基于视频编解码器的高斯溅射(GS)压缩方法,依赖于PLAS算法将3D GS转换为2D映射,该算法计算复杂度高,耗时较长,难以在资源受限的设备上应用。因此,需要一种更轻量级且高效的GS压缩方法,尤其是在中低比特率下保持良好的压缩性能。
核心思路:论文的核心思路是利用视频编解码器对GS数据进行压缩,并针对视频编解码器的特性进行优化。通过两阶段Morton扫描生成适合视频编解码器处理的块状2D映射,并结合PCA降维和MiniPLAS算法,提升中低比特率下的压缩性能。这样既能利用成熟的视频编解码技术,又能降低计算复杂度,提高压缩效率。
技术框架:该方法主要包含以下几个阶段: 1. 3D Morton扫描:对GS图元进行排序,提高空间局部性。 2. 2D Morton扫描:将排序后的GS图元映射到块状2D映射中,方便视频编解码器处理。 3. SH PCA:对球谐函数进行降维,减少数据量。 4. MiniPLAS:在块内进行图元置换,优化压缩性能。 5. 视频编码:使用标准视频编解码器(如HEVC)对2D映射进行编码。
关键创新:该方法的主要创新点在于: 1. 两阶段Morton扫描:相比于PLAS算法,Morton扫描计算复杂度更低,更适合轻量级设备。 2. MiniPLAS:在块内进行图元置换,能够有效提升中低比特率下的压缩性能,同时计算复杂度可控。 3. 结合SH PCA:通过降维减少数据量,进一步提升压缩效率。
关键设计: * 两阶段Morton扫描:首先进行3D Morton扫描,然后进行2D Morton扫描,保证空间局部性。 * MiniPLAS:在固定大小的块内进行PLAS算法,限制了计算复杂度。 * SH PCA:选择保留的主成分数量,需要在压缩率和质量之间进行权衡。 * CU大小配置:MiniPLAS的结果可以指导视频编解码器的CU大小配置,从而进一步优化编码效率。
🖼️ 关键图片
📊 实验亮点
实验结果表明,所提出的LGSCV方法在MPEG数据集上,相比于最先进的方法,实现了超过20%的率失真(RD)增益。同时,2D映射生成时间减少到大约1秒,编码时间减少了50%。这些结果表明,该方法在压缩效率和计算复杂度上都具有显著优势。
🎯 应用场景
该研究成果可应用于各种需要高效3D高斯溅射压缩的场景,例如移动设备上的3D场景渲染、虚拟现实/增强现实应用、以及云游戏等。通过降低计算复杂度和提高压缩效率,该方法使得3D高斯溅射技术能够在资源受限的设备上得到更广泛的应用,并降低了数据传输和存储的成本。
📄 摘要(原文)
Current video-based GS compression methods rely on using Parallel Linear Assignment Sorting (PLAS) to convert 3D GS into smooth 2D maps, which are computationally expensive and time-consuming, limiting the application of GS on lightweight devices. In this paper, we propose a Lightweight 3D Gaussian Splatting (GS) Compression method based on Video codec (LGSCV). First, a two-stage Morton scan is proposed to generate blockwise 2D maps that are friendly for canonical video codecs in which the coding units (CU) are square blocks. A 3D Morton scan is used to permute GS primitives, followed by a 2D Morton scan to map the ordered GS primitives to 2D maps in a blockwise style. However, although the blockwise 2D maps report close performance to the PLAS map in high-bitrate regions, they show a quality collapse at medium-to-low bitrates. Therefore, a principal component analysis (PCA) is used to reduce the dimensionality of spherical harmonics (SH), and a MiniPLAS, which is flexible and fast, is designed to permute the primitives within certain block sizes. Incorporating SH PCA and MiniPLAS leads to a significant gain in rate-distortion (RD) performance, especially at medium and low bitrates. MiniPLAS can also guide the setting of the codec CU size configuration and significantly reduce encoding time. Experimental results on the MPEG dataset demonstrate that the proposed LGSCV achieves over 20% RD gain compared with state-of-the-art methods, while reducing 2D map generation time to approximately 1 second and cutting encoding time by 50%. The code is available at https://github.com/Qi-Yangsjtu/LGSCV .