PersonaFuse: A Personality Activation-Driven Framework for Enhancing Human-LLM Interactions

📄 arXiv: 2509.07370v2 📥 PDF

作者: Yixuan Tang, Yi Yang, Ahmed Abbasi

分类: cs.CL

发布日期: 2025-09-09 (更新: 2025-09-11)


💡 一句话要点

PersonaFuse:基于人格激活的框架,增强人与LLM的交互

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 人机交互 情感计算 人格建模 混合专家模型

📋 核心要点

  1. 现有LLM在情感感知和社会能力方面存在局限,无法根据不同情境调整沟通风格。
  2. PersonaFuse框架通过混合专家架构和动态路由网络,使LLM能够表达不同人格。
  3. 实验表明PersonaFuse在社会情感智能方面优于基线,且不牺牲推理能力和安全性。

📝 摘要(中文)

大型语言模型(LLM)的最新进展展示了在各个领域的卓越能力。这些发展促成了人类与LLM在各种情境下的更直接沟通,例如社交陪伴和心理支持。然而,LLM在现实对话中常常表现出情感感知和社会能力方面的局限性。这些局限性部分源于它们无法根据不同的社交和任务环境调整其沟通风格和情感表达。本文介绍了一种新颖的LLM后训练框架PersonaFuse,使LLM能够适应和表达不同情境下的人格。受特质激活理论和五大人格模型的启发,PersonaFuse采用混合专家架构,将人格适配器与动态路由网络相结合,从而实现情境化的特质表达。实验结果表明,PersonaFuse在社会情感智能的多个维度上显著优于基线模型。重要的是,这些提升是在不牺牲通用推理能力或模型安全性的前提下实现的,而这仍然是直接提示和监督微调方法的常见限制。PersonaFuse还在下游以人为本的应用中实现了持续改进,例如心理健康咨询和基于评论的客户服务。最后,针对包括GPT-4o和DeepSeek在内的领先LLM的人工偏好评估表明,PersonaFuse在模型尺寸相对较小的情况下实现了具有竞争力的响应质量。这些发现表明,PersonaFuse为开发具有社会情感增强的LLM提供了一种理论上可靠且实用的方法,标志着朝着更以人为本的AI系统迈出了重要一步。

🔬 方法详解

问题定义:现有大型语言模型(LLM)在人机交互中,尤其是在社交陪伴和心理支持等场景下,缺乏足够的情感感知和社会适应能力。它们难以根据不同的社交环境和任务需求,灵活地调整自身的沟通方式和情感表达,导致交互体验不佳。直接提示工程和监督微调等方法虽然可以一定程度上改善这一问题,但往往会牺牲模型的通用推理能力和安全性。

核心思路:PersonaFuse的核心思路是借鉴心理学中的特质激活理论和五大人格模型,将人格特质融入到LLM中,使其能够根据情境激活不同的人格特征。通过这种方式,LLM可以更好地理解和响应人类的情感需求,从而提升人机交互的质量。这种方法避免了直接修改模型参数,而是通过后训练的方式,在不影响模型原有能力的前提下,增强其社会情感智能。

技术框架:PersonaFuse采用混合专家(Mixture-of-Experts, MoE)架构,包含多个“人格适配器”(Persona Adapters)和一个动态路由网络(Dynamic Routing Network)。每个人格适配器负责学习一种特定的人格特征,例如外向、友善等。动态路由网络则根据输入文本的情境,决定激活哪些人格适配器,并将它们的输出进行加权融合,最终生成LLM的响应。整个框架通过后训练的方式进行优化,目标是使LLM能够根据情境表达合适的人格特征。

关键创新:PersonaFuse的关键创新在于将特质激活理论引入到LLM的训练中,并设计了一种混合专家架构来实现情境化的人格表达。与传统的微调方法相比,PersonaFuse能够在不牺牲模型通用能力和安全性的前提下,显著提升其社会情感智能。动态路由网络的设计使得模型能够灵活地组合不同的人格特征,从而更好地适应复杂的社交情境。

关键设计:PersonaFuse的关键设计包括:1) 人格适配器的数量和类型,需要根据具体应用场景进行选择;2) 动态路由网络的结构和训练方法,需要保证其能够准确地识别情境并激活合适的人格适配器;3) 损失函数的设计,需要同时考虑模型的情感表达能力和通用推理能力。论文中可能使用了对比学习或者强化学习等方法来优化动态路由网络,并采用正则化技术来防止过拟合。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,PersonaFuse在社会情感智能的多个维度上显著优于基线模型,包括情感识别、共情能力和社交技巧。在心理健康咨询和在线客服等下游任务中,PersonaFuse也取得了持续的改进。人工评估结果显示,PersonaFuse在响应质量上与GPT-4o和DeepSeek等领先LLM具有竞争力,同时保持了较小的模型尺寸。

🎯 应用场景

PersonaFuse具有广泛的应用前景,例如心理健康咨询、在线客服、社交陪伴机器人等。通过赋予LLM更丰富的情感表达能力和社交智能,可以提升用户体验,增强人机交互的信任感和亲和力。未来,PersonaFuse还可以应用于教育、娱乐等领域,创造更具个性化和情感化的AI服务。

📄 摘要(原文)

Recent advancements in Large Language Models (LLMs) demonstrate remarkable capabilities across various fields. These developments have led to more direct communication between humans and LLMs in various situations, such as social companionship and psychological support. However, LLMs often exhibit limitations in emotional perception and social competence during real-world conversations. These limitations partly originate from their inability to adapt their communication style and emotional expression to different social and task contexts. In this work, we introduce PersonaFuse, a novel LLM post-training framework that enables LLMs to adapt and express different personalities for varying situations. Inspired by Trait Activation Theory and the Big Five personality model, PersonaFuse employs a Mixture-of-Expert architecture that combines persona adapters with a dynamic routing network, enabling contextual trait expression. Experimental results show that PersonaFuse substantially outperforms baseline models across multiple dimensions of social-emotional intelligence. Importantly, these gains are achieved without sacrificing general reasoning ability or model safety, which remain common limitations of direct prompting and supervised fine-tuning approaches. PersonaFuse also delivers consistent improvements in downstream human-centered applications, such as mental health counseling and review-based customer service. Finally, human preference evaluations against leading LLMs, including GPT-4o and DeepSeek, demonstrate that PersonaFuse achieves competitive response quality despite its comparatively smaller model size. These findings demonstrate that PersonaFuse offers a theoretically grounded and practical approach for developing social-emotional enhanced LLMs, marking a significant advancement toward more human-centric AI systems.