Fame Fades, Nature Remains: Disentangling the Character Identity of Role-Playing Agents
作者: Yonghyun Jun, Junhyuk Choi, Jihyeong Park, Hwanhee Lee
分类: cs.CL
发布日期: 2026-01-08
备注: 27 pages
💡 一句话要点
提出角色身份解耦框架,区分参数化和属性化身份,提升角色扮演Agent的真实性。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 角色扮演Agent 大型语言模型 角色身份 参数化身份 属性化身份
📋 核心要点
- 现有角色扮演Agent(RPA)通常将角色视为任意文本输入,缺乏对角色身份结构化维度的形式化定义。
- 论文提出角色身份的概念,将其解耦为参数化身份(预训练知识)和属性化身份(行为属性)两个层次。
- 实验表明,名人角色的初始优势会随对话轮数增加而消失,且RPA对道德和人际关系的负面倾向表现敏感。
📝 摘要(中文)
本文提出“角色身份”的概念,将其解耦为两个不同的层次:(1)“参数化身份”,指从LLM预训练中编码的角色特定知识;(2)“属性化身份”,捕捉细粒度的行为属性,如性格特征和道德价值观。为了系统地研究这些层次,我们构建了一个统一的角色档案模式,并在相同的结构约束下生成了名人角色和合成角色。通过单轮和多轮交互的评估,揭示了两个关键现象。首先,我们发现“名气消退”:由于参数化知识,名人角色在初始轮次中具有显著优势,但随着模型优先考虑累积对话上下文而非预训练先验,这种优势迅速消失。其次,我们发现“本性难移”:虽然模型能够稳健地描绘一般性格特征,但RPA的性能对道德和人际关系的效价高度敏感。我们的发现表明,消极的社会本性是RPA保真度的主要瓶颈,为未来的角色构建和评估提供了指导。
🔬 方法详解
问题定义:现有角色扮演Agent (RPA) 的角色构建方法缺乏对角色身份的结构化定义,通常将角色视为任意文本输入,导致角色一致性和真实性难以保证。现有方法难以区分角色固有的知识和后天行为属性,限制了对角色扮演Agent行为的精细控制和评估。
核心思路:论文的核心思路是将角色身份解耦为两个不同的层次:参数化身份和属性化身份。参数化身份代表角色从预训练语言模型中获得的固有知识,而属性化身份则代表角色后天习得的行为属性,如性格、道德观等。通过这种解耦,可以更好地理解和控制角色扮演Agent的行为,并针对性地进行优化。
技术框架:论文构建了一个统一的角色档案模式,用于描述角色的参数化身份和属性化身份。该模式包括角色的背景信息、性格特征、道德价值观等。然后,论文生成了两种类型的角色:名人角色(利用LLM中已有的知识)和合成角色(根据设定的属性生成)。最后,通过单轮和多轮对话交互实验,评估RPA在不同角色设定下的表现,并分析参数化身份和属性化身份对RPA行为的影响。
关键创新:论文最重要的创新点在于提出了角色身份解耦的概念,将角色身份分解为参数化身份和属性化身份。这种解耦使得可以更加精细地控制和评估角色扮演Agent的行为,并针对性地进行优化。此外,论文还构建了一个统一的角色档案模式,为角色扮演Agent的研究提供了一个标准化的框架。
关键设计:论文的关键设计包括:(1) 统一的角色档案模式,用于描述角色的各种属性;(2) 名人角色和合成角色的生成方法,用于评估参数化身份和属性化身份的影响;(3) 单轮和多轮对话交互实验,用于评估RPA在不同角色设定下的表现。具体的参数设置、损失函数、网络结构等技术细节在论文中未详细描述,属于未知信息。
📊 实验亮点
实验结果表明,名人角色在初始轮次中具有优势,但随着对话轮数增加,这种优势会逐渐消失。同时,RPA对道德和人际关系的负面倾向表现敏感,表明消极的社会本性是RPA保真度的主要瓶颈。这些发现为未来的角色构建和评估提供了重要的指导。
🎯 应用场景
该研究成果可应用于各种需要角色扮演的场景,例如游戏、虚拟助手、教育等。通过解耦角色身份,可以创建更加真实、一致和可控的角色扮演Agent,提升用户体验。未来,该研究可以进一步扩展到更复杂的角色设定和交互场景,例如多角色对话、情境推理等。
📄 摘要(原文)
Despite the rapid proliferation of Role-Playing Agents (RPAs) based on Large Language Models (LLMs), the structural dimensions defining a character's identity remain weakly formalized, often treating characters as arbitrary text inputs. In this paper, we propose the concept of \textbf{Character Identity}, a multidimensional construct that disentangles a character into two distinct layers: \textbf{(1) Parametric Identity}, referring to character-specific knowledge encoded from the LLM's pre-training, and \textbf{(2) Attributive Identity}, capturing fine-grained behavioral properties such as personality traits and moral values. To systematically investigate these layers, we construct a unified character profile schema and generate both Famous and Synthetic characters under identical structural constraints. Our evaluation across single-turn and multi-turn interactions reveals two critical phenomena. First, we identify \textit{"Fame Fades"}: while famous characters hold a significant advantage in initial turns due to parametric knowledge, this edge rapidly vanishes as models prioritize accumulating conversational context over pre-trained priors. Second, we find that \textit{"Nature Remains"}: while models robustly portray general personality traits regardless of polarity, RPA performance is highly sensitive to the valence of morality and interpersonal relationships. Our findings pinpoint negative social natures as the primary bottleneck in RPA fidelity, guiding future character construction and evaluation.