BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation

📄 arXiv: 2510.10157v2 📥 PDF

作者: Tsung-Min Pai, Jui-I Wang, Li-Chun Lu, Shao-Hua Sun, Hung-Yi Lee, Kai-Wei Chang

分类: cs.CL, cs.AI

发布日期: 2025-10-11 (更新: 2026-01-24)


💡 一句话要点

BILLY:通过融合Persona向量引导大语言模型进行创造性生成

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 创造性生成 Persona向量 模型引导 多LLM系统

📋 核心要点

  1. 多LLM系统提升创造力,但计算成本高、延迟大,限制了其应用。
  2. BILLY框架通过融合Persona向量,在单模型内模拟多LLM协作,无需训练。
  3. 实验表明,BILLY在创造性任务上优于单模型和传统多LLM方法,且效率更高。

📝 摘要(中文)

多LLM系统通过模拟人类集体智慧来增强大语言模型的创造力,但存在计算成本高和推理延迟等显著缺点。为了解决这些限制,我们提出了BILLY(BlendIng persona vectors for Large Language model creativitY),这是一个无需训练的框架,它在单个模型中捕获多LLM协作的优势,即诱导不同的视角和专业的知识。BILLY通过直接在模型的激活空间中提取和混合多个不同的persona向量来运行。我们使用这个融合向量在推理时引导模型的生成过程,从而实现多视角输出,而无需显式的多LLM通信。我们在面向创造力的基准测试中进行的实验表明,BILLY超越了单模型提示和传统的多LLM方法,同时显著减少了推理时间和计算成本。我们的分析进一步表明,不同的persona向量可以混合,以实现对生成互补方面的有效控制和更高的可解释性。

🔬 方法详解

问题定义:现有方法,特别是多LLM系统,虽然能够提升大语言模型的创造力,但由于需要运行多个独立的LLM,导致计算成本显著增加,推理延迟也较高,这限制了它们在实际应用中的部署。论文旨在解决如何在不增加计算负担的前提下,利用多LLM的优势,提升单个LLM的创造性生成能力。

核心思路:论文的核心思路是通过提取和融合不同“persona”的向量表示,来引导单个LLM的生成过程。这里的“persona”可以理解为模型在特定任务或风格下的状态。通过将这些状态融合,模型可以同时具备多种视角和专业知识,从而产生更具创造性的输出。这种方法避免了运行多个LLM,降低了计算成本和延迟。

技术框架:BILLY框架主要包含以下几个步骤:1) Persona向量提取:首先,针对不同的任务或风格,提取LLM在特定状态下的激活向量,作为该persona的表示。2) Persona向量融合:然后,将提取到的多个persona向量进行融合,得到一个混合的persona向量。融合的方式可以是简单的加权平均,也可以是更复杂的非线性变换。3) 生成引导:最后,使用融合后的persona向量来引导LLM的生成过程。具体来说,可以将该向量添加到模型的激活空间中,从而影响模型的输出分布。

关键创新:BILLY的关键创新在于它提供了一种无需训练的方法,可以在单个LLM中模拟多LLM的协作。与需要大量训练数据的微调方法不同,BILLY直接在模型的激活空间中操作,避免了额外的训练成本。此外,BILLY还具有很高的可解释性,因为可以通过调整不同persona向量的权重来控制模型的生成行为。

关键设计:论文中,persona向量的提取方式是关键。通常选择模型中间层的激活值作为persona向量,因为这些层既包含了语义信息,又具有一定的抽象性。融合方式可以选择加权平均,权重可以根据任务需求进行调整。在生成引导阶段,可以将融合后的persona向量添加到模型的激活空间中,例如,可以将其添加到Transformer模型的某个中间层的输出中。具体添加的位置和方式需要根据实验结果进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,BILLY在多个创造性任务上显著优于单模型prompting和传统的多LLM方法。例如,在故事生成任务中,BILLY生成的文本在多样性和新颖性方面均有明显提升。同时,BILLY的推理速度比多LLM方法快数倍,计算成本也大幅降低。分析表明,通过调整不同persona向量的权重,可以有效控制生成文本的风格和内容。

🎯 应用场景

BILLY框架可应用于各种需要创造性生成的场景,如故事创作、诗歌生成、剧本编写、广告文案生成等。它能够提升生成内容的多样性和新颖性,同时降低计算成本,使得创造性AI应用更易于部署和推广。未来,该技术有望应用于智能助手、内容创作平台等领域,赋能用户进行更高效、更具创意的文本生成。

📄 摘要(原文)

Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.