Prompt2Fingerprint: Plug-and-Play LLM Fingerprinting via Text-to-Weight Generation

📄 arXiv: 2605.18474v1 📥 PDF

作者: Sixu Chen, Xiang Chen, Hongyao Yu, Jiaxin Hong, Hao Fang, Shuoyang Sun, Bin Chen, Shu-Tao Xia

分类: cs.CR, cs.AI, cs.CL, cs.LG

发布日期: 2026-05-18


💡 一句话要点

提出Prompt2Fingerprint,通过文本到权重的生成实现即插即用的LLM指纹识别。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: LLM指纹识别 模型溯源 参数生成 低秩参数增量 即插即用 所有权管理 模型安全

📋 核心要点

  1. 现有LLM指纹识别方法需为每个身份单独训练,计算成本高昂,缺乏可扩展性。
  2. Prompt2Fingerprint (P2F) 将指纹识别转化为条件参数生成,通过文本描述直接生成模型参数增量。
  3. 实验表明,P2F在降低计算开销的同时,保持了指纹识别的精度、无害性和鲁棒性。

📝 摘要(中文)

大型语言模型(LLM)的广泛部署和再分发使得模型溯源追踪成为一项关键挑战。现有的LLM指纹识别方法,特别是通过微调嵌入身份信号的主动方法,虽然实现了高精度和鲁棒性,但存在显著的可扩展性瓶颈。这些方法通常将指纹注入视为独立的、一次性的优化任务,而不是可重用的能力,因此每次新的身份都需要单独的、资源密集型的训练,导致过高的计算成本和部署延迟。为了解决这个问题,我们提出了Prompt2Fingerprint (P2F),这是第一个将指纹识别重新定义为条件参数生成任务的框架。通过利用专门的生成器,P2F在单个前向传递中将文本描述直接映射到低秩参数增量,从而实现即插即用的LLM指纹注入,而无需进一步的模型再训练。我们的实验表明,P2F在显著降低计算开销的同时,保持了高指纹精度、无害性和鲁棒性,为LLM所有权管理提供了一种可扩展的即时解决方案。

🔬 方法详解

问题定义:现有LLM指纹识别方法,特别是主动指纹识别方法,需要对每个模型进行单独的微调,以嵌入特定的身份信息。这种方式计算成本高昂,难以扩展到大规模的模型部署和所有权管理场景。痛点在于无法将指纹注入过程视为一种可重用的能力,每次都需要从头开始训练。

核心思路:P2F的核心思路是将指纹识别问题转化为一个条件参数生成问题。不再直接微调目标LLM,而是训练一个独立的生成器,该生成器能够根据输入的文本描述(prompt)生成特定的模型参数增量。这样,只需要训练一次生成器,就可以为不同的模型注入不同的指纹,实现即插即用的效果。

技术框架:P2F框架包含两个主要部分:指纹生成器和目标LLM。指纹生成器接收文本描述作为输入,输出低秩参数增量。这些增量被添加到目标LLM的参数中,从而嵌入指纹。整个过程无需对目标LLM进行额外的训练。具体流程为:首先,使用文本描述训练指纹生成器;然后,在需要注入指纹时,使用生成器生成参数增量,并将其添加到目标LLM中。

关键创新:P2F的关键创新在于将指纹识别问题从一个独立的优化问题转化为一个条件生成问题。通过训练一个独立的生成器,实现了指纹的即插即用,避免了对每个模型进行单独训练的需要。这种方法显著降低了计算成本,提高了可扩展性。与现有方法的本质区别在于,P2F不再直接修改目标LLM的参数,而是通过生成参数增量来实现指纹嵌入。

关键设计:P2F的关键设计包括:1) 使用低秩参数增量,以减少需要生成的参数数量,降低计算复杂度;2) 设计合适的损失函数,以确保生成的指纹具有高精度、无害性和鲁棒性;3) 选择合适的网络结构,以提高生成器的性能。具体而言,可以使用Transformer架构作为生成器的基础,并采用对抗训练等技术来提高生成指纹的鲁棒性。参数设置方面,需要仔细调整生成器的学习率、batch size等超参数,以获得最佳的生成效果。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,P2F在保持高指纹识别精度的同时,显著降低了计算开销。与传统的微调方法相比,P2F无需对每个模型进行单独训练,大大缩短了部署时间。此外,P2F生成的指纹具有良好的鲁棒性,能够抵抗各种攻击,例如参数剪枝和对抗攻击。具体性能数据未知,但论文强调了计算效率的显著提升。

🎯 应用场景

Prompt2Fingerprint (P2F) 可应用于LLM的所有权管理、模型溯源、版权保护等领域。通过为每个模型注入独特的指纹,可以追踪模型的来源和使用情况,防止未经授权的复制和分发。该技术还可用于检测恶意模型,例如被用于生成有害内容的模型。未来,P2F有望成为LLM安全和治理的重要组成部分。

📄 摘要(原文)

The widespread deployment and redistribution of large language models (LLMs) have made model provenance tracking a critical challenge. While existing LLM fingerprinting methods, particularly active approaches that embed identity signals via fine-tuning, achieve high accuracy and robustness, they suffer from significant scalability bottlenecks. These methods typically treat fingerprint injection as an independent, one-off optimization task rather than a reusable capability, necessitating separate, resource-intensive training for every new identity. This incurs prohibitive computational costs and deployment delays. To address this, we propose Prompt2Fingerprint (P2F), the first framework that reformulates fingerprinting as a conditional parameter generation task. By leveraging a specialized generator, P2F maps textual descriptions directly to low-rank parameter increments in a single forward pass, enabling plug-and-play LLM fingerprint injection without further model retraining. Our experiments demonstrate that P2F maintains high fingerprint accuracy, harmlessness, and robustness while significantly reducing computational overhead, offering a scalable and instant solution for LLM ownership management.