CreAgentive: An Agent Workflow Driven Multi-Category Creative Generation Engine
作者: Yuyang Cheng, Linyue Cai, Changwei Peng, Yumiao Xu, Rongfang Bie, Yong Zhao
分类: cs.CL
发布日期: 2025-09-30
💡 一句话要点
CreAgentive:一种基于Agent工作流的多类别创意生成引擎
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 创意生成 Agent工作流 多类别生成 故事原型 知识图谱
📋 核心要点
- 现有大型语言模型在创意写作中存在类型单一、篇幅有限、叙事性差、结构控制弱等问题。
- CreAgentive通过故事原型解耦故事逻辑与风格,并采用三阶段Agent工作流驱动多类别创意生成。
- 实验结果表明,CreAgentive在多种类型中均优于现有基线,且成本较低,质量接近人类水平。
📝 摘要(中文)
本文提出CreAgentive,一种基于Agent工作流的多类别创意生成引擎,旨在解决当前大型语言模型在故事、戏剧等创意写作中存在的四个关键限制:类型多样性受限、输出长度不足、叙事连贯性弱以及无法强制执行复杂的结构构造。CreAgentive的核心是故事原型,这是一种与类型无关的、基于知识图谱的叙事表示,通过将角色、事件和环境编码为语义三元组,将故事逻辑与风格实现解耦。CreAgentive采用三阶段Agent工作流:初始化阶段构建用户指定的叙事骨架;生成阶段通过长短期目标指导多Agent对话来实例化故事原型;写作阶段利用该原型生成具有高级结构(如追溯和伏笔)的多类型文本。该架构减少了存储冗余,克服了长文本生成的典型瓶颈。大量实验表明,CreAgentive使用通用骨干模型以稳定质量和低成本(每100章不到1美元)生成数千章内容。为了评估性能,我们定义了一个包含10个叙事指标的二维框架,用于衡量质量和长度。结果表明,CreAgentive始终优于强大的基线,并在各种类型中实现了稳健的性能,接近人类创作的小说质量。
🔬 方法详解
问题定义:当前大型语言模型在故事、戏剧等创意写作领域面临四大挑战:一是生成内容的类型多样性不足;二是生成文本的长度有限;三是叙事连贯性较弱,难以维持长篇故事的逻辑一致性;四是难以强制执行复杂的叙事结构,如伏笔、倒叙等。这些问题限制了LLM在创意写作领域的应用。
核心思路:CreAgentive的核心思路是将故事的逻辑结构与风格表达解耦。通过引入“故事原型”(Story Prototype),将故事中的角色、事件、环境等要素抽象为语义三元组,形成一个与具体文风无关的知识图谱。然后,利用Agent工作流,逐步将这个抽象的故事原型实例化为具体的文本内容。这种解耦的设计使得模型可以灵活地生成不同风格、不同长度的故事,并更好地控制叙事结构。
技术框架:CreAgentive的整体架构包含三个主要阶段: 1. 初始化阶段:根据用户输入,构建一个叙事骨架,确定故事的基本情节和主要角色。 2. 生成阶段:利用多Agent对话机制,根据长短期目标,逐步填充故事原型中的细节,例如角色对话、场景描写等。 3. 写作阶段:将故事原型转化为最终的文本输出,并利用高级结构(如追溯和伏笔)增强故事的叙事效果。
关键创新:CreAgentive的关键创新在于其“故事原型”的设计和三阶段Agent工作流。故事原型实现了故事逻辑与风格表达的解耦,使得模型可以灵活地生成不同风格的故事。三阶段Agent工作流则将复杂的创意生成任务分解为多个可控的子任务,提高了生成质量和效率。与现有方法相比,CreAgentive能够更好地控制叙事结构,生成更长、更连贯的故事。
关键设计:故事原型采用知识图谱的形式,节点表示角色、事件、环境等,边表示它们之间的关系。生成阶段采用多Agent对话机制,每个Agent负责故事的不同方面,例如角色塑造、情节发展等。通过长短期目标的引导,Agent之间可以协同工作,共同完成故事的创作。具体的技术细节包括Agent的角色分配、对话策略、目标函数的设计等,但论文中没有详细说明。
🖼️ 关键图片
📊 实验亮点
CreAgentive在实验中生成了数千章的故事,成本低于每100章1美元。通过包含10个叙事指标的二维框架评估,结果表明CreAgentive在质量和长度上均优于现有基线模型,并且在不同类型的故事生成中表现出稳健性,其生成质量接近人类创作水平。这些结果验证了CreAgentive的有效性和优越性。
🎯 应用场景
CreAgentive具有广泛的应用前景,可用于自动化故事创作、剧本生成、游戏剧情设计等领域。它能够帮助作家、编剧和游戏开发者快速生成高质量的创意内容,提高创作效率。此外,CreAgentive还可以应用于教育领域,辅助学生进行写作练习,提高写作能力。该研究的未来影响在于推动人工智能在创意内容生成领域的应用,并为人类的文化创作提供新的可能性。
📄 摘要(原文)
We present CreAgentive, an agent workflow driven multi-category creative generation engine that addresses four key limitations of contemporary large language models in writing stories, drama and other categories of creatives: restricted genre diversity, insufficient output length, weak narrative coherence, and inability to enforce complex structural constructs. At its core, CreAgentive employs a Story Prototype, which is a genre-agnostic, knowledge graph-based narrative representation that decouples story logic from stylistic realization by encoding characters, events, and environments as semantic triples. CreAgentive engages a three-stage agent workflow that comprises: an Initialization Stage that constructs a user-specified narrative skeleton; a Generation Stage in which long- and short-term objectives guide multi-agent dialogues to instantiate the Story Prototype; a Writing Stage that leverages this prototype to produce multi-genre text with advanced structures such as retrospection and foreshadowing. This architecture reduces storage redundancy and overcomes the typical bottlenecks of long-form generation. In extensive experiments, CreAgentive generates thousands of chapters with stable quality and low cost (less than $1 per 100 chapters) using a general-purpose backbone model. To evaluate performance, we define a two-dimensional framework with 10 narrative indicators measuring both quality and length. Results show that CreAgentive consistently outperforms strong baselines and achieves robust performance across diverse genres, approaching the quality of human-authored novels.