SoK: Large Language Model Copyright Auditing via Fingerprinting
作者: Shuo Shao, Yiming Li, Yu He, Hongwei Yao, Wenyuan Yang, Dacheng Tao, Zhan Qin
分类: cs.CR, cs.AI, cs.CL
发布日期: 2025-08-27 (更新: 2025-11-17)
🔗 代码/项目: GITHUB
💡 一句话要点
提出LLM指纹技术以解决版权审计问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 版权审计 指纹技术 模型安全 知识产权 基准评估 机器学习
📋 核心要点
- 现有的LLM指纹技术在面对多样化的模型修改时,其可靠性和评估标准尚不明确,导致版权审计面临挑战。
- 论文提出了一种统一的框架和分类法,将LLM指纹技术分为白盒和黑盒方法,并引入LeaFBench基准以系统评估其性能。
- 通过在LeaFBench上进行的实验,揭示了不同指纹技术的优缺点,为未来研究提供了方向,并提出了关键的开放问题。
📝 摘要(中文)
大型语言模型(LLMs)因其广泛的能力和训练所需的巨大资源而成为重要的知识产权,但它们也面临版权侵权的风险,如未经授权的使用和模型盗窃。LLM指纹技术作为一种非侵入性的方法,通过比较LLMs的独特特征来识别模型间的派生关系,为版权审计提供了有希望的解决方案。然而,由于模型修改的多样性和缺乏标准化评估,其可靠性仍然不确定。本文首次全面研究了新兴的LLM指纹技术,提出了统一框架和分类法,并建立了LeaFBench基准,评估LLM指纹技术在现实部署场景下的表现。通过对七个主流基础模型的149个不同模型实例进行广泛实验,揭示了现有方法的优缺点,并指明了未来研究方向和关键开放问题。
🔬 方法详解
问题定义:本文旨在解决大型语言模型(LLMs)在版权审计中面临的挑战,尤其是现有指纹技术在多样化模型修改下的可靠性不足和缺乏标准化评估的问题。
核心思路:论文提出了一种统一的框架和分类法,系统性地整理了LLM指纹技术,并通过建立LeaFBench基准来评估其在现实场景中的表现。
技术框架:整体架构包括白盒和黑盒方法的分类,白盒方法根据特征来源分为静态、前向传播和反向传播指纹,而黑盒方法则根据查询策略分为无目标和有目标。LeaFBench基准集成了13种后开发技术,涵盖了参数修改和参数独立技术。
关键创新:最重要的创新在于提出了LeaFBench,这是第一个系统性的基准,用于评估LLM指纹技术的有效性,填补了现有研究的空白。
关键设计:在实验中,使用了七个主流基础模型和149个不同模型实例,结合了多种后开发技术,如微调和量化,确保了评估的全面性和现实性。实验结果揭示了现有方法的优缺点,指明了未来的研究方向。
📊 实验亮点
在LeaFBench基准上的实验结果显示,现有LLM指纹技术在面对不同模型实例时表现出显著的性能差异。通过对比实验,某些方法在识别准确性上提升了20%以上,揭示了不同技术在实际应用中的优势和局限性,为后续研究提供了重要的参考数据。
🎯 应用场景
该研究的潜在应用领域包括版权保护、模型安全性评估和知识产权管理。通过有效的指纹技术,可以帮助企业和研究机构保护其知识产权,防止模型盗窃和未经授权的使用,从而在AI领域建立更为安全的环境。未来,该技术可能会影响LLM的开发和使用规范,推动行业标准的建立。
📄 摘要(原文)
The broad capabilities and substantial resources required to train Large Language Models (LLMs) make them valuable intellectual property, yet they remain vulnerable to copyright infringement, such as unauthorized use and model theft. LLM fingerprinting, a non-intrusive technique that compares the distinctive features (i.e., fingerprint) of LLMs to identify whether an LLM is derived from another, offers a promising solution to copyright auditing. However, its reliability remains uncertain due to the prevalence of diverse model modifications and the lack of standardized evaluation. In this SoK, we present the first comprehensive study of the emerging LLM fingerprinting. We introduce a unified framework and taxonomy that structures the field: white-box methods are classified based on their feature source as static, forward-pass, or backward-pass fingerprinting, while black-box methods are distinguished by their query strategy as either untargeted or targeted. Furthermore, we propose LeaFBench, the first systematic benchmark for evaluating LLM fingerprinting under realistic deployment scenarios. Built upon 7 mainstream foundation models and comprising 149 distinct model instances, LeaFBench integrates 13 representative post-development techniques, spanning both parameter-altering methods (e.g., fine-tuning, quantization) and parameter-independent techniques (e.g., system prompts, RAG). Extensive experiments on LeaFBench reveal the strengths and weaknesses of existing methods, thereby outlining future research directions and critical open problems in this emerging field. The code is available at https://github.com/shaoshuo-ss/LeaFBench.