Drama Engine: A Framework for Narrative Agents

📄 arXiv: 2408.11574v1 📥 PDF

作者: Martin Pichlmair, Riddhi Raj, Charlene Putney

分类: cs.AI, cs.CL

发布日期: 2024-08-21

备注: 10 pages, 2 figures, 2 tables


💡 一句话要点

Drama Engine:用于叙事代理的、基于多智能体原则的大语言模型交互框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 叙事代理 多智能体系统 大型语言模型 动态提示 上下文感知

📋 核心要点

  1. 现有叙事代理系统缺乏动态性和上下文感知能力,难以实现自然流畅的交互和长期发展。
  2. Drama Engine通过多智能体系统,实现代理之间的委托、动态提示组装和上下文总结,提升交互质量。
  3. 该框架使用TypeScript实现,可应用于多智能体聊天和创意写作等场景,具有良好的扩展性和实用性。

📝 摘要(中文)

本技术报告介绍了Drama Engine,这是一个新颖的框架,用于与大型语言模型进行代理交互,专为叙事目的而设计。该框架采用多智能体系统原则,创建动态的、上下文感知的伙伴,这些伙伴可以随着时间的推移而发展,并与用户和彼此互动。主要功能包括具有委托功能的多智能体工作流程、动态提示组装和模型无关设计。Drama Engine引入了独特的元素,例如伙伴发展、情绪系统和自动上下文总结。它使用TypeScript实现。该框架的应用包括多智能体聊天和用于创意写作的虚拟同事。本文讨论了系统的架构、提示组装过程、委托机制和审核技术,以及潜在的伦理考量和未来的扩展。

🔬 方法详解

问题定义:现有叙事代理系统通常是静态的,缺乏长期记忆和动态适应能力,难以模拟复杂的人际关系和故事发展。它们难以根据用户行为和环境变化调整自身行为,导致交互体验不自然,缺乏沉浸感。此外,不同代理之间的协作和知识共享也存在挑战。

核心思路:Drama Engine的核心思路是将叙事代理视为一个多智能体系统,每个智能体负责不同的任务或角色。通过智能体之间的委托、协作和竞争,以及动态的上下文感知和提示组装,实现更自然、更动态的叙事体验。这种设计允许代理随着时间的推移而发展,并适应不断变化的环境。

技术框架:Drama Engine的整体架构包括以下主要模块:1) 智能体管理模块,负责创建、管理和调度不同的智能体;2) 提示组装模块,根据当前上下文和智能体的状态,动态生成提示;3) 委托机制,允许智能体将任务委托给其他智能体;4) 上下文总结模块,自动总结对话历史,为智能体提供长期记忆;5) 情绪系统,模拟智能体的情绪状态,影响其行为。

关键创新:Drama Engine的关键创新在于其多智能体架构和动态提示组装机制。与传统的单智能体叙事系统相比,多智能体架构能够更好地模拟复杂的人际关系和故事发展。动态提示组装机制允许智能体根据当前上下文和自身状态,生成更具针对性的回复,从而提高交互的自然性和流畅性。此外,伙伴发展和情绪系统也是该框架的独特之处。

关键设计:Drama Engine使用TypeScript实现,具有良好的可扩展性和可维护性。提示组装模块使用模板引擎,允许灵活地定义提示模板。委托机制使用消息队列,实现智能体之间的异步通信。上下文总结模块使用自然语言处理技术,自动提取对话历史中的关键信息。情绪系统使用状态机,模拟智能体的情绪变化。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

由于该论文是技术报告,侧重于框架的设计和实现,因此没有提供具体的实验结果。但是,该框架的设计理念和功能特性表明,它具有很大的潜力,可以显著提升叙事代理系统的性能和用户体验。未来的研究可以集中在评估该框架在不同应用场景下的表现,并与其他叙事代理系统进行比较。

🎯 应用场景

Drama Engine可应用于多种场景,包括多智能体聊天、虚拟角色扮演、创意写作辅助工具等。它可以帮助用户创建更具沉浸感和互动性的叙事体验,例如,在游戏中创建更智能、更逼真的NPC,或在写作过程中提供灵感和建议。该框架还可用于教育领域,例如,模拟历史事件或社会情境,帮助学生更好地理解和学习。

📄 摘要(原文)

This technical report presents the Drama Engine, a novel framework for agentic interaction with large language models designed for narrative purposes. The framework adapts multi-agent system principles to create dynamic, context-aware companions that can develop over time and interact with users and each other. Key features include multi-agent workflows with delegation, dynamic prompt assembly, and model-agnostic design. The Drama Engine introduces unique elements such as companion development, mood systems, and automatic context summarising. It is implemented in TypeScript. The framework's applications include multi-agent chats and virtual co-workers for creative writing. The paper discusses the system's architecture, prompt assembly process, delegation mechanisms, and moderation techniques, as well as potential ethical considerations and future extensions.