BitC-3DGS: High-Capacity 3D Gaussian Splatting Watermarking via Bit Compression
作者: Yuquan Bi, Baosheng Yu, Yingke Lei, Jianwei Yang, Hongsong Wang, Jie Gui, Yuan Yan Tang, James Tin-Yau Kwok
分类: cs.CV
发布日期: 2026-05-28
💡 一句话要点
BitC-3DGS:通过比特压缩实现高容量3D高斯溅射水印
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 3D高斯溅射 水印技术 比特压缩 高容量水印 版权保护
📋 核心要点
- 现有3DGS水印方法受限于CLIP的令牌长度,导致水印容量不足,无法嵌入丰富的版权信息。
- BitC-3DGS通过比特压缩技术,将多个比特编码到单个令牌中,显著提升了水印容量。
- 实验表明,BitC-3DGS在提升水印容量的同时,保持了较高的消息恢复精度和渲染质量。
📝 摘要(中文)
针对3D高斯溅射(3DGS)资产,高容量水印技术对于嵌入丰富的版权信息(如所有权、来源和认证码)至关重要,这使得在大型3D资产管道中进行可靠的身份识别和完整性验证成为可能。现有的基于预训练文本编码器的比特到令牌水印方法受限于CLIP固定的77个令牌上下文长度,导致只能处理77比特的消息。为了解决这一限制,我们提出了BitC-3DGS,一种比特压缩框架,它可以在每个令牌中编码多个消息比特。该框架采用比特压缩的令牌化方案,将同一块中的多个比特编码成单个语义令牌。为了恢复压缩的信息,它进一步引入了双分支架构,用于联合块解压缩和比特解码,以及一种硬消息采样策略,以提高解码器训练期间的组合覆盖率。在Blender和LLFF数据集上的大量实验表明,BitC-3DGS在高容量水印方面非常有效,实现了高消息恢复精度和渲染保真度。例如,它支持128比特的消息容量,其恢复精度与最新方法中64比特消息的恢复精度相当。
🔬 方法详解
问题定义:现有基于文本编码器的3DGS水印方法,如利用CLIP,受到其固定长度的token限制(通常为77个token),导致水印容量受限,无法嵌入足够的版权信息,例如所有权、来源和认证码等。这限制了其在大型3D资产管道中的应用,因为需要更大的容量来保证可靠的身份验证和完整性验证。
核心思路:BitC-3DGS的核心思路是通过比特压缩技术,将多个消息比特压缩编码到一个token中,从而突破token数量的限制,实现高容量水印。通过设计专门的编码和解码机制,保证在压缩和解压缩过程中信息的准确恢复。
技术框架:BitC-3DGS采用双分支架构。首先,使用比特压缩的token化方案,将多个比特压缩成单个语义token。然后,通过一个双分支网络进行联合块解压缩和比特解码。一个分支负责将压缩的token解压缩回原始的比特块,另一个分支负责从解压缩的比特块中解码出原始消息。此外,还引入了硬消息采样策略,以提高解码器训练期间的组合覆盖率。
关键创新:BitC-3DGS的关键创新在于其比特压缩的token化方案和双分支解码架构。传统的token化方法通常一个token对应一个信息单元,而BitC-3DGS通过压缩,使得一个token可以携带多个比特的信息,从而突破了容量限制。双分支解码架构则保证了压缩信息的可靠恢复。
关键设计:BitC-3DGS的关键设计包括:1) 比特压缩的token化方案的具体压缩算法;2) 双分支解码网络的结构和损失函数设计,用于联合优化块解压缩和比特解码;3) 硬消息采样策略,用于提高解码器对各种比特组合的鲁棒性。具体的参数设置和网络结构等细节在论文中进行了详细描述,但此处未知。
🖼️ 关键图片
📊 实验亮点
BitC-3DGS在Blender和LLFF数据集上进行了广泛的实验,结果表明其能够显著提高水印容量,同时保持较高的消息恢复精度和渲染保真度。例如,BitC-3DGS支持128比特的消息容量,其恢复精度与现有最先进方法中64比特消息的恢复精度相当,实现了容量和精度的双重提升。
🎯 应用场景
BitC-3DGS可广泛应用于3D资产的版权保护、来源追溯和完整性验证。在游戏开发、电影制作、建筑设计等领域,可以嵌入版权信息,防止盗用和篡改。此外,还可以用于数字孪生、元宇宙等新兴领域,确保虚拟资产的安全和可信。
📄 摘要(原文)
High-capacity watermarking is necessary for 3D Gaussian Splatting (3DGS) assets to embed rich information (e.g., ownership, provenance, and authentication codes), enabling reliable identification and integrity verification in large-scale 3D asset pipelines. Existing bit-to-token watermarking methods based on a pre-trained text encoder are limited to 77-bit messages due to CLIP's fixed 77-token context length, as tokens beyond this limit are unsupported by learned positional embeddings. To address this limitation, we introduce BitC-3DGS, a bit-compression framework that encodes multiple message bits per token. It employs a bit-compressed tokenization scheme that encodes multiple bits within the same chunk into a single semantic token. To enable recovery of the compressed information, it further introduces a dual-branch architecture for joint chunk decompression and bit decoding, along with a hard-message sampling strategy to improve combinatorial coverage during decoder training. Extensive experiments on the Blender and LLFF datasets demonstrate the effectiveness of BitC-3DGS for high-capacity watermarking, achieving high message recovery accuracy and rendering fidelity. For example, it supports 128-bit message capacity with recovery accuracy comparable to that of 64-bit messages in recent state-of-the-art methods.