The Ghost Couple: Correlated LLM Name Priors and Their Haunting of the Web and Academic Publishing

📄 arXiv: 2606.02184v1 📥 PDF

作者: Michał Brzozowski, Neo Christopher Chung

分类: cs.DL, cs.LG

发布日期: 2026-06-01


💡 一句话要点

揭示LLM生成的虚构人物关联先验及其在网络和学术出版中的影响

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 虚构人物 关联先验 模型溯源 学术出版

📋 核心要点

  1. 现有方法难以识别LLM生成内容中存在的虚构人物关联先验,这可能导致对生成内容的误判和滥用。
  2. 该研究通过分析LLM生成文本中人物名字的共现模式,揭示了模型内部存在的角色关联先验知识。
  3. 研究发现这些关联先验具有模型家族和版本特异性,并且在模型发布时会被抑制,为追溯模型来源提供了线索。

📝 摘要(中文)

本文揭示了大型语言模型(LLM)在生成虚构专家时,并非简单地选择高概率的个体名字,而是会产生具有相关性的角色组合,这些角色对或三人组的共现率远超随机水平,并且在独立生成过程中保持一致。这些先验知识具有模型家族特异性(例如,Claude:Elena Vasquez + Marcus Chen + Amara Okafor;Gemini:Aris Thorne + Lena Petrova;GPT:Elara Voss,无固定搭档)和版本特异性,并且在模型发布边界处会被主动抑制,从而在生成的内容中留下可追溯的行为指纹。本文记录了一个大规模的下游影响:在CERN运营的Zenodo存储库中,发现了1655条幽灵作者记录,声称发表在不存在的期刊上,并伪造了出版日期。服务器端的DataCite时间戳证明了存在故意的日期倒填行为,其中991条记录在一个月内注册;这些记录带有在DataCite中注册的真实DOI,使其能够被任何摄取DOI元数据的学术聚合器收集。幽灵名字还出现在ResearchGate上,形成了由多个模型家族的合作者组成的合成研究小组;这些记录上的出版日期为模型部署窗口提供了可靠的时间代理。

🔬 方法详解

问题定义:现有方法主要关注LLM生成文本的流畅性和一致性,忽略了模型内部可能存在的虚构人物关联先验。这种忽略可能导致对生成内容的误判,例如将虚构作者误认为真实专家,或者被恶意行为者利用来传播虚假信息。此外,现有方法缺乏有效手段来追溯LLM生成内容的来源和版本信息。

核心思路:该研究的核心思路是通过分析LLM生成文本中人物名字的共现模式,来揭示模型内部存在的角色关联先验知识。研究人员假设,如果LLM在生成虚构人物时并非随机选择名字,而是倾向于选择某些特定的名字组合,那么这些名字组合的共现率应该远超随机水平。通过统计和分析这些共现模式,可以推断出模型内部存在的角色关联先验。

技术框架:该研究主要分为两个阶段。第一阶段,研究人员使用不同的LLM(包括Claude、Gemini和GPT)生成大量的文本,并从中提取人物名字。然后,他们统计这些名字的共现频率,并计算共现率。通过比较不同模型和不同版本之间的共现模式,研究人员识别出了具有模型家族和版本特异性的角色关联先验。第二阶段,研究人员在Zenodo和ResearchGate等学术平台上搜索包含这些虚构人物名字的记录,并分析这些记录的元数据(例如,出版日期、DOI等)。通过分析这些元数据,研究人员揭示了这些虚构人物名字在学术出版领域中的滥用情况。

关键创新:该研究最重要的技术创新点在于揭示了LLM内部存在的虚构人物关联先验。与现有方法相比,该研究不仅关注LLM生成文本的表面特征,还深入分析了模型内部的知识表示和生成机制。此外,该研究还提出了一种基于名字共现模式的LLM溯源方法,可以用于识别生成内容的模型来源和版本信息。

关键设计:该研究的关键设计包括:(1) 选择具有代表性的LLM家族(Claude、Gemini和GPT)进行分析;(2) 使用大量的生成文本来保证统计结果的可靠性;(3) 设计合理的共现率计算方法来量化角色关联强度;(4) 分析学术平台上的元数据来揭示虚构人物名字的滥用情况。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

研究发现,不同LLM家族具有不同的角色关联先验,例如Claude倾向于生成Elena Vasquez、Marcus Chen和Amara Okafor的组合,而Gemini倾向于生成Aris Thorne和Lena Petrova的组合。此外,研究还发现这些关联先验在模型发布边界处会被抑制,这为追溯模型来源提供了线索。在Zenodo上发现了1655条幽灵作者记录,证明了这些虚构人物名字在学术出版领域中的滥用情况。

🎯 应用场景

该研究的成果可以应用于多个领域。例如,可以用于检测和过滤LLM生成的虚假信息,防止其在网络和学术出版领域传播。此外,还可以用于追溯LLM生成内容的来源和版本信息,为版权保护和责任追究提供依据。未来,该研究可以扩展到其他类型的生成内容,例如图像和音频,以更全面地评估LLM的潜在风险。

📄 摘要(原文)

These names do not exist. Elena Vasquez and Marcus Chen have appeared as volcano experts, astronauts, thriller protagonists, podcast hosts, and academic co-authors across hundreds of independently produced AI-generated documents, never having lived. We show that large language models do not merely default to high-probability individual names when generating fictional experts: they produce correlated character ensembles, pairs and trios whose co-occurrence rates far exceed chance and are consistent across independent generations. These priors are model-family-specific (Claude: Elena Vasquez + Marcus Chen + Amara Okafor; Gemini: Aris Thorne + Lena Petrova; GPT: Elara Voss with no fixed partner), version-specific, and actively suppressed at model release boundaries, leaving dateable behavioral fingerprints in the content they produced. We document a downstream consequence at scale. On Zenodo, a CERN-operated repository that mints real DataCite DOIs, we identify 1,655 ghost-authored records claiming nonexistent journals with fabricated publication dates: server-side DataCite timestamps prove deliberate backdating, and 991 records were registered in a single month; these carry real DOIs registered in DataCite, making them harvestable by any scholarly aggregator that ingests DOI metadata. Ghost names additionally appear on ResearchGate forming synthetic research groups with collaborators drawn from multiple model families; publication dates on these records provide a reliable temporal proxy for model deployment windows.