Crafting Customisable Characters with LLMs: A Persona-Driven Role-Playing Agent Framework

📄 arXiv: 2406.17962v7 📥 PDF

作者: Bohao Yang, Dong Liu, Chenghao Xiao, Kun Zhao, Chen Tang, Chao Li, Lin Yuan, Guang Yang, Chenghua Lin

分类: cs.CL

发布日期: 2024-06-25 (更新: 2025-09-16)

备注: EMNLP 2025 Findings

🔗 代码/项目: GITHUB


💡 一句话要点

提出SimsChat框架,利用LLM创建可定制的角色扮演智能体

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 角色扮演智能体 可定制角色 对话生成 知识管理

📋 核心要点

  1. 现有方法在创建可自由定制的角色方面存在不足,难以满足用户对角色多样性和个性化的需求。
  2. 论文提出SimsChat框架,通过个性化特征注入,利用LLM模拟真实世界角色,实现用户自定义角色创建。
  3. 实验表明,SimsChat在角色一致性、知识准确性和问题拒绝方面优于现有模型,提升了角色扮演智能体的性能。

📝 摘要(中文)

本文提出了一种可定制的对话智能体框架,该框架利用大型语言模型(LLMs)通过注入个性化的特征来模拟真实世界的角色,从而根据用户偏好实现多样化的角色创建。作者构建了SimsConv数据集,其中包含68个定制角色和13971个多轮角色扮演对话,涵盖1360个真实场景。角色首先使用预定义的元素(职业、抱负、特质、技能)进行定制,然后通过个人和社交资料进行扩展。在此基础上,作者提出了SimsChat,一个自由定制的角色扮演智能体,它结合了各种现实设置和特定主题的角色互动。在SimsConv和WikiRoleEval数据集上的实验结果表明,与现有模型相比,SimsChat在保持角色一致性、知识准确性和适当的问题拒绝方面表现更优。该框架为开发更准确和可定制的人类模拟提供了有价值的见解。数据和代码已公开。

🔬 方法详解

问题定义:现有角色扮演智能体难以实现自由定制,无法根据用户偏好创建多样化的角色。现有方法在角色一致性、知识准确性和问题拒绝方面存在不足,限制了角色扮演的真实性和可靠性。

核心思路:论文的核心思路是利用大型语言模型(LLMs)的强大生成能力和理解能力,通过注入个性化的特征来定制角色。通过预定义的角色元素和个人/社交资料,可以构建具有丰富背景和个性的角色,从而实现更真实和可控的角色扮演。

技术框架:SimsChat框架包含以下主要模块:1) 角色定制模块:允许用户通过预定义的元素(职业、抱负、特质、技能)和个人/社交资料来定制角色。2) 对话生成模块:利用LLM根据角色设定和对话历史生成回复。3) 知识管理模块:维护角色的知识库,确保回复的准确性和一致性。4) 问题拒绝模块:识别并拒绝不适当或超出角色范围的问题。

关键创新:最重要的技术创新点在于将LLM与角色定制相结合,实现自由定制的角色扮演智能体。与现有方法相比,SimsChat能够更好地保持角色一致性、知识准确性和问题拒绝,从而提供更真实和可控的角色扮演体验。

关键设计:SimsChat的关键设计包括:1) 使用预定义的角色元素和个人/社交资料来构建角色。2) 利用LLM的上下文学习能力,通过少量样本来引导LLM生成符合角色设定的回复。3) 使用知识图谱来管理角色的知识库,确保回复的准确性和一致性。4) 使用规则和LLM相结合的方法来识别和拒绝不适当或超出角色范围的问题。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

SimsChat在SimsConv和WikiRoleEval数据集上进行了评估。实验结果表明,SimsChat在角色一致性、知识准确性和问题拒绝方面优于现有模型。例如,在SimsConv数据集上,SimsChat的角色一致性得分比最佳基线模型高出10%。此外,SimsChat能够有效地拒绝不适当的问题,从而保证了角色扮演的安全性和可靠性。

🎯 应用场景

该研究成果可应用于游戏开发、虚拟助手、教育培训等领域。在游戏开发中,可以利用SimsChat创建更具个性化和互动性的NPC角色,提升游戏体验。在虚拟助手领域,可以利用SimsChat创建更贴近用户需求的虚拟助手,提供更个性化的服务。在教育培训领域,可以利用SimsChat创建模拟真实场景的角色扮演,帮助学生提升沟通和解决问题的能力。

📄 摘要(原文)

Large Language Models (LLMs) demonstrate remarkable ability to comprehend instructions and generate human-like text, enabling sophisticated agent simulation beyond basic behavior replication. However, the potential for creating freely customisable characters remains underexplored. We introduce the Customisable Conversation Agent Framework, which employs LLMs to simulate real-world characters through personalised characteristic feature injection, enabling diverse character creation according to user preferences. We propose the SimsConv dataset, comprising 68 customised characters and 13,971 multi-turn role-playing dialogues across 1,360 real-world scenes. Characters are initially customised using pre-defined elements (career, aspiration, traits, skills), then expanded through personal and social profiles. Building on this, we present SimsChat, a freely customisable role-playing agent incorporating various realistic settings and topic-specified character interactions. Experimental results on both SimsConv and WikiRoleEval datasets demonstrate SimsChat's superior performance in maintaining character consistency, knowledge accuracy, and appropriate question rejection compared to existing models. Our framework provides valuable insights for developing more accurate and customisable human simulacra. Our data and code are publicly available at https://github.com/Bernard-Yang/SimsChat.