TaleFrame: An Interactive Story Generation System with Fine-Grained Control and Large Language Models
作者: Yunchao Wang, Guodao Sun, Zihang Fu, Zhehao Liu, Kaixing Du, Haidong Gao, Ronghua Liang
分类: cs.CL, cs.HC
发布日期: 2025-12-02
备注: 11 pages
🔗 代码/项目: HUGGINGFACE
💡 一句话要点
TaleFrame:结合大语言模型与人机交互的细粒度可控交互式故事生成系统
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 故事生成 人机交互 大语言模型 结构化信息 创意写作 自然语言生成 Llama模型
📋 核心要点
- 现有故事生成系统缺乏细粒度控制和明确输入,难以准确捕捉用户意图,导致生成的故事质量受限。
- TaleFrame通过将故事分解为实体、事件、关系和故事大纲四个基本单元,结合人机交互实现精确控制。
- 通过在偏好数据集上微调Llama模型,TaleFrame能够将结构化数据转化为连贯的故事,并通过用户交互进行迭代优化。
📝 摘要(中文)
随着自然语言生成(NLG)技术的进步,创意故事生成系统越来越受到关注。然而,由于缺乏细粒度的控制和不明确的输入规范,当前的系统通常无法准确地将用户意图转化为令人满意的故事输出,从而限制了它们的适用性。为了解决这个问题,我们提出了TaleFrame,一个结合大型语言模型(LLMs)与人机交互(HCI)的系统,通过结构化信息生成故事,从而实现对生成过程的精确控制。TaleFrame的创新之处在于将故事结构分解为四个基本单元:实体、事件、关系和故事大纲。我们利用Tinystories数据集,解析并构建了一个包含9,851个JSON格式条目的偏好数据集,然后用它来微调一个本地Llama模型。通过采用这种JSON2Story方法,结构化数据被转化为连贯的故事。TaleFrame还提供了一个直观的界面,支持用户创建和编辑实体和事件,并通过结构化框架生成故事。用户可以通过简单的交互(例如,拖放、附加和连接)来控制这些单元,从而影响故事的细节和进展。生成的故事可以在七个维度(例如,创造力、结构完整性)上进行评估,系统根据这些评估提供改进建议。用户可以迭代地调整故事,直到获得满意的结果。最后,我们进行了定量评估和用户研究,证明了TaleFrame的实用性。
🔬 方法详解
问题定义:现有故事生成系统难以实现细粒度控制,用户无法精确表达创作意图,导致生成的故事与用户期望存在偏差。现有方法缺乏对故事结构的有效建模,难以保证故事的连贯性和逻辑性。此外,用户交互方式不够直观,难以引导故事生成过程。
核心思路:TaleFrame的核心思路是将故事生成过程分解为结构化的信息单元,包括实体、事件、关系和故事大纲,并通过人机交互界面允许用户对这些单元进行精确控制。通过这种方式,用户可以更清晰地表达创作意图,系统可以更好地理解用户需求,从而生成更符合用户期望的故事。
技术框架:TaleFrame的整体架构包含以下几个主要模块:1) 数据准备模块:解析Tinystories数据集,构建JSON格式的偏好数据集。2) 模型训练模块:使用偏好数据集微调本地Llama模型,实现JSON2Story的转换。3) 用户交互界面:提供直观的界面,支持用户创建和编辑实体、事件等故事单元,并通过拖放、连接等操作控制故事发展。4) 故事生成模块:根据用户输入的结构化信息,利用微调后的Llama模型生成故事。5) 评估与优化模块:对生成的故事进行多维度评估,并根据评估结果向用户提供改进建议。
关键创新:TaleFrame最重要的技术创新点在于将故事结构分解为四个基本单元,并结合人机交互实现对这些单元的细粒度控制。与现有方法相比,TaleFrame能够更有效地建模故事结构,保证故事的连贯性和逻辑性。此外,TaleFrame的用户交互方式更加直观,用户可以更轻松地引导故事生成过程。
关键设计:TaleFrame的关键设计包括:1) JSON格式的偏好数据集,用于训练Llama模型。2) 基于Llama模型的JSON2Story转换方法,将结构化数据转化为自然语言故事。3) 直观的用户交互界面,支持用户创建和编辑故事单元,并通过拖放、连接等操作控制故事发展。4) 多维度故事评估指标,用于评估生成的故事的质量,并向用户提供改进建议。具体参数设置和损失函数等细节在论文中未明确说明,属于未知信息。
🖼️ 关键图片
📊 实验亮点
论文构建了一个包含9,851个JSON格式条目的偏好数据集,并在此基础上微调了一个本地Llama模型。通过用户研究表明,TaleFrame能够有效提升故事生成的质量和用户满意度。论文对生成的故事进行了七个维度的评估,包括创造力、结构完整性等,并根据评估结果向用户提供改进建议,实现了故事的迭代优化。具体的性能数据和对比基线在论文中未明确给出,属于未知信息。
🎯 应用场景
TaleFrame可应用于创意写作辅助、教育娱乐、游戏剧情生成等领域。它可以帮助作家快速生成故事草稿,激发创作灵感;也可以用于儿童教育,培养孩子的创造力和写作能力;还可以用于游戏开发,自动生成游戏剧情和对话。该研究有望推动人机协作在创意内容生成领域的应用,提升内容创作的效率和质量。
📄 摘要(原文)
With the advancement of natural language generation (NLG) technologies, creative story generation systems have gained increasing attention. However, current systems often fail to accurately translate user intent into satisfactory story outputs due to a lack of fine-grained control and unclear input specifications, limiting their applicability. To address this, we propose TaleFrame, a system that combines large language models (LLMs) with human-computer interaction (HCI) to generate stories through structured information, enabling precise control over the generation process. The innovation of TaleFrame lies in decomposing the story structure into four basic units: entities, events, relationships, and story outline. We leverage the Tinystories dataset, parsing and constructing a preference dataset consisting of 9,851 JSON-formatted entries, which is then used to fine-tune a local Llama model. By employing this JSON2Story approach, structured data is transformed into coherent stories. TaleFrame also offers an intuitive interface that supports users in creating and editing entities and events and generates stories through the structured framework. Users can control these units through simple interactions (e.g., drag-and-drop, attach, and connect), thus influencing the details and progression of the story. The generated stories can be evaluated across seven dimensions (e.g., creativity, structural integrity), with the system providing suggestions for refinement based on these evaluations. Users can iteratively adjust the story until a satisfactory result is achieved. Finally, we conduct quantitative evaluation and user studies that demonstrate the usefulness of TaleFrame. Dataset available at https://huggingface.co/datasets/guodaosun/tale-frame.