WorldCup Sampling for Multi-bit LLM Watermarking

作者: Yidan Wang, Yubing Ren, Yanan Cao, Li Guo

分类: cs.CL, cs.CR

发布日期: 2026-02-02

💡 一句话要点

提出WorldCup，通过层级竞争采样实现多比特LLM水印嵌入，提升容量与鲁棒性。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: LLM水印 多比特水印 分层采样 信息嵌入 版权保护

📋 核心要点

现有LLM水印方法依赖种子驱动，信息流间接，容量受限，解码效果不佳。
WorldCup将采样视为通信通道，通过分层竞争机制直接嵌入多比特信息。
WorldCup采用熵感知调制保证文本质量，置信度感知解码提升鲁棒性，性能优于基线。

📝 摘要（中文）

随着大型语言模型（LLMs）生成越来越像人类的文本，水印技术提供了一种可靠的归属方案，超越了简单的检测。虽然多比特水印能够实现更丰富的来源编码，但现有方法主要通过种子驱动的引导来扩展零比特方案，导致间接的信息流、有限的有效容量和次优的解码。在本文中，我们提出了WorldCup，一个用于LLM的多比特水印框架，它将采样视为一种自然的通信通道，并通过由互补信号引导的分层竞争机制将消息比特直接嵌入到token选择中。此外，WorldCup进一步采用熵感知调制来保持生成质量，并通过置信度感知解码来支持鲁棒的消息恢复。综合实验表明，WorldCup在容量、可检测性、鲁棒性、文本质量和解码效率之间实现了强大的平衡，始终优于先前的基线，并为未来的LLM水印研究奠定了坚实的基础。

🔬 方法详解

问题定义：现有LLM多比特水印方法主要通过扩展零比特水印方案实现，依赖种子驱动的token选择，导致信息嵌入间接，有效容量受限，解码性能不佳，难以在容量、鲁棒性、文本质量和解码效率之间取得平衡。

核心思路：WorldCup的核心思路是将LLM的token采样过程视为一个天然的通信信道，通过精心设计的层级竞争机制，将水印信息（多比特）直接嵌入到token的选择过程中，从而实现高效、鲁棒的水印嵌入和提取。这种直接嵌入避免了现有方法中种子驱动的间接信息流，提高了水印容量。

技术框架：WorldCup框架主要包含以下几个关键模块：1) 分层竞争采样：将候选token分成多个层级，每一层级的token根据互补信号进行竞争，最终胜出的token被选中。水印信息通过控制每一层级的竞争结果嵌入到token选择中。2) 熵感知调制：根据候选token的熵值动态调整水印嵌入强度，以在保证水印鲁棒性的同时，尽量减小对生成文本质量的影响。3) 置信度感知解码：在解码阶段，利用token选择的置信度信息来提高水印提取的准确性和鲁棒性。

关键创新：WorldCup的关键创新在于其将采样过程视为通信信道，并设计了分层竞争采样机制，实现了多比特水印的直接嵌入。与现有方法相比，WorldCup避免了间接的信息流，显著提高了水印容量和鲁棒性。此外，熵感知调制和置信度感知解码进一步提升了文本质量和解码效率。

关键设计：WorldCup的关键设计包括：1) 分层竞争机制：具体的分层策略和每一层级的竞争规则需要根据具体的LLM和应用场景进行设计。2) 熵感知调制：熵值的计算方法和调制强度的调整策略需要仔细选择，以平衡水印鲁棒性和文本质量。3) 置信度感知解码：置信度阈值的选择和解码算法的设计需要考虑噪声的影响，以提高解码的准确性。

🖼️ 关键图片

📊 实验亮点

实验结果表明，WorldCup在容量、可检测性、鲁棒性、文本质量和解码效率方面均优于现有基线方法。具体而言，WorldCup在保持相当文本质量的前提下，水印容量提升了XX%，水印检测准确率提升了YY%，水印鲁棒性提升了ZZ%。这些结果表明WorldCup在LLM水印领域具有显著的优势。

🎯 应用场景

WorldCup水印技术可应用于LLM生成内容的版权保护、来源追溯、内容认证等领域。例如，可以用于防止恶意用户伪造LLM生成的内容，或者用于追踪LLM生成内容的传播路径，从而维护LLM生态的安全和健康发展。该技术还可用于内容审查，标记由特定模型生成的内容。

📄 摘要（原文）

As large language models (LLMs) generate increasingly human-like text, watermarking offers a promising solution for reliable attribution beyond mere detection. While multi-bit watermarking enables richer provenance encoding, existing methods largely extend zero-bit schemes through seed-driven steering, leading to indirect information flow, limited effective capacity, and suboptimal decoding. In this paper, we propose WorldCup, a multi-bit watermarking framework for LLMs that treats sampling as a natural communication channel and embeds message bits directly into token selection via a hierarchical competition mechanism guided by complementary signals. Moreover, WorldCup further adopts entropy-aware modulation to preserve generation quality and supports robust message recovery through confidence-aware decoding. Comprehensive experiments show that WorldCup achieves a strong balance across capacity, detectability, robustness, text quality, and decoding efficiency, consistently outperforming prior baselines and laying a solid foundation for future LLM watermarking studies.

WorldCup Sampling for Multi-bit LLM Watermarking

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理