Agents' Room: Narrative Generation through Multi-step Collaboration

📄 arXiv: 2410.02603v2 📥 PDF

作者: Fantine Huot, Reinald Kim Amplayo, Jennimaria Palomaki, Alice Shoshana Jakobovits, Elizabeth Clark, Mirella Lapata

分类: cs.CL, cs.LG, cs.MA

发布日期: 2024-10-03 (更新: 2025-03-14)

备注: Published as a conference paper at ICLR 2025


💡 一句话要点

提出Agents' Room框架,通过多智能体协作生成高质量叙事故事

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 叙事生成 多智能体系统 长文本生成 故事写作 语言模型

📋 核心要点

  1. 现有大型语言模型在故事生成方面依赖复杂的提示工程,缺乏灵活性和可控性。
  2. Agents' Room框架将故事写作分解为多个子任务,由专门的智能体协作完成,模拟人类写作过程。
  3. 通过Tell Me A Story数据集和评估框架,证明Agents' Room生成的长篇故事质量优于现有基线系统。

📝 摘要(中文)

创作引人入胜的虚构故事是一个复杂的过程,需要结合情节设计、角色塑造和生动的语言运用等要素。虽然大型语言模型(LLMs)在故事写作方面展现出潜力,但它们目前严重依赖复杂的提示工程,限制了其应用。我们提出了Agents' Room,一个受叙事理论启发的生成框架,它将叙事写作分解为由专门智能体处理的子任务。为了展示我们的方法,我们引入了Tell Me A Story,一个包含高质量写作提示和人类撰写故事的数据集,以及一个专门为评估长篇叙事而设计的新型评估框架。我们表明,通过利用协作和专业化将复杂的故事写作任务分解为可处理的组成部分,Agents' Room 生成的故事比基线系统更受专家评估者的青睐。我们提供了对生成输出的广泛分析,包括自动化和人工评估指标。

🔬 方法详解

问题定义:论文旨在解决长篇叙事生成中,大型语言模型过度依赖复杂prompt,导致生成质量不稳定、缺乏创造性和可控性的问题。现有方法难以模拟人类写作过程中情节构建、角色塑造和语言润色等多个环节的协同工作。

核心思路:论文的核心思路是将复杂的故事写作任务分解为多个子任务,并为每个子任务设计专门的智能体(Agent)。这些智能体通过协作完成各自的任务,最终生成完整的故事。这种分解和协作的方式借鉴了叙事理论,更贴近人类的写作过程。

技术框架:Agents' Room框架包含多个智能体,每个智能体负责故事写作的不同方面,例如情节构建、角色塑造、场景描述和语言润色。这些智能体通过消息传递和共享信息进行协作。框架通常包含一个中心协调器,负责任务分配和结果整合。具体流程包括:接收写作提示,协调器将任务分配给各个智能体,智能体独立工作并生成相应内容,协调器整合各个智能体的输出,最终生成完整的故事。

关键创新:该方法最重要的创新点在于将故事生成任务分解为多个可控的子任务,并利用专门的智能体进行协作。这种分解和协作的方式使得模型能够更好地理解和处理复杂的写作提示,并生成更具创造性和连贯性的故事。与传统的端到端生成方法相比,Agents' Room框架具有更高的可解释性和可控性。

关键设计:论文提出了Tell Me A Story数据集,包含高质量的写作提示和人类撰写的故事,用于训练和评估模型。此外,论文还设计了一个专门用于评估长篇叙事的评估框架,包括自动化指标和人工评估指标。具体的智能体实现细节(例如使用的模型架构、损失函数等)可能因具体任务而异,但通常会采用预训练语言模型进行微调。

🖼️ 关键图片

img_0

📊 实验亮点

实验结果表明,Agents' Room框架生成的长篇故事在专家评估中优于基线系统。通过人工评估,专家更倾向于选择Agents' Room生成的故事情节和角色塑造。此外,自动化评估指标也显示Agents' Room在故事连贯性和流畅性方面有所提升。具体提升幅度未知,但专家偏好表明该方法在故事质量方面具有显著优势。

🎯 应用场景

该研究成果可应用于自动化故事生成、游戏剧情设计、教育辅助写作等领域。通过Agents' Room框架,可以生成更具吸引力和创造性的故事内容,为用户提供个性化的阅读体验。未来,该技术有望应用于虚拟现实、增强现实等领域,创造更沉浸式的互动叙事体验。

📄 摘要(原文)

Writing compelling fiction is a multifaceted process combining elements such as crafting a plot, developing interesting characters, and using evocative language. While large language models (LLMs) show promise for story writing, they currently rely heavily on intricate prompting, which limits their use. We propose Agents' Room, a generation framework inspired by narrative theory, that decomposes narrative writing into subtasks tackled by specialized agents. To illustrate our method, we introduce Tell Me A Story, a high-quality dataset of complex writing prompts and human-written stories, and a novel evaluation framework designed specifically for assessing long narratives. We show that Agents' Room generates stories that are preferred by expert evaluators over those produced by baseline systems by leveraging collaboration and specialization to decompose the complex story writing task into tractable components. We provide extensive analysis with automated and human-based metrics of the generated output.