From Stateless to Situated: Building a Psychological World for LLM-Based Emotional Support

📄 arXiv: 2603.25031v1 📥 PDF

作者: Boning Zhao, Clover Hu, Xinnuo Li

分类: cs.AI

发布日期: 2026-03-26


💡 一句话要点

LEKIA 2.0:构建情境感知的LLM心理支持系统,解决多轮对话中的状态缺失问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 情感支持 大型语言模型 情境感知 多轮对话 心理咨询

📋 核心要点

  1. 现有LLM在情感支持中缺乏时间连续性、阶段感知和用户意愿边界维护,导致对话过程中的不稳定性。
  2. LEKIA 2.0通过分离认知层和执行层,构建可更新的外部情境结构,实现情境建模与干预执行的解耦。
  3. 实验表明,LEKIA 2.0在深度干预循环完成度上,相比prompt-only基线提升约31%,验证了情境结构的重要性。

📝 摘要(中文)

大型语言模型(LLM)在心理支持和情感陪伴场景中的核心局限性不仅在于回复质量,更在于其依赖局部token预测,这阻碍了多轮干预所需的时间连续性、阶段感知和用户意愿边界的维护。这种无状态特性使得系统在连续对话中容易过早推进、阶段错位和违反边界。为了解决这个问题,我们认为面向过程的情感支持的关键挑战不是简单地生成自然语言,而是为模型构建一个可持续更新的外部情境结构。因此,我们提出了LEKIA 2.0,一种情境感知的LLM架构,它将认知层与执行层分离,从而将情境建模与干预执行解耦。这种设计使系统能够在持续交互过程中保持用户情境和意愿边界的稳定表示。为了评估这种过程控制能力,我们进一步引入了一种用于多轮交互的静态到动态在线评估协议。LEKIA在深度干预循环完成方面实现了相对于仅使用prompt的基线平均约31%的绝对改进。结果表明,外部情境结构是构建稳定、可控和情境感知的情感支持系统的关键使能条件。

🔬 方法详解

问题定义:现有基于LLM的情感支持系统,由于LLM本身的无状态性,无法在多轮对话中维持用户状态、对话阶段和用户意愿边界,导致对话过程不稳定,容易出现过早推进、阶段错位和违反边界等问题。这些问题严重影响了情感支持的有效性。

核心思路:论文的核心思路是为LLM配备一个外部的、可更新的情境结构,用于显式地维护用户状态、对话阶段和用户意愿边界。通过将情境建模与干预执行解耦,使得LLM能够基于稳定的情境表示进行决策,从而提高对话的稳定性和可控性。这种设计模拟了人类心理咨询师对来访者状态的持续跟踪和理解。

技术框架:LEKIA 2.0架构包含两个主要层:认知层和执行层。认知层负责维护和更新外部情境结构,包括用户状态、对话历史、目标和意愿等信息。执行层则基于认知层提供的上下文信息,生成相应的回复。认知层和执行层之间通过明确的接口进行通信,实现情境建模与干预执行的解耦。整个系统通过多轮对话不断更新情境结构,从而实现情境感知。

关键创新:最重要的技术创新点在于引入了外部情境结构,并将情境建模与干预执行解耦。与传统的prompt-only方法相比,LEKIA 2.0能够显式地维护和更新用户状态,从而更好地理解用户需求,并生成更合适的回复。此外,论文还提出了一个静态到动态的在线评估协议,用于评估多轮交互中的过程控制能力。

关键设计:LEKIA 2.0的关键设计包括:1) 情境结构的表示方式,例如使用知识图谱或向量表示;2) 认知层如何更新情境结构,例如使用规则或机器学习模型;3) 执行层如何利用情境信息生成回复,例如使用条件生成模型;4) 静态到动态的在线评估协议的具体实现,包括评估指标和评估流程。具体参数设置和网络结构等细节在论文中可能有所描述,但此处无法详细展开。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

LEKIA 2.0在深度干预循环完成度上,相比prompt-only基线取得了显著提升,平均绝对改进约为31%。这一结果表明,外部情境结构对于构建稳定、可控和情境感知的情感支持系统至关重要。此外,论文提出的静态到动态在线评估协议,为评估多轮交互中的过程控制能力提供了一种新的方法。

🎯 应用场景

该研究成果可应用于智能心理咨询、情感陪伴机器人、在线心理健康平台等领域。通过构建情境感知的LLM系统,可以提供更稳定、更有效的心理支持服务,帮助用户缓解情绪困扰,改善心理健康状况。未来,该技术有望进一步发展,实现个性化、主动式的心理干预。

📄 摘要(原文)

In psychological support and emotional companionship scenarios, the core limitation of large language models (LLMs) lies not merely in response quality, but in their reliance on local next-token prediction, which prevents them from maintaining the temporal continuity, stage awareness, and user consent boundaries required for multi-turn intervention. This stateless characteristic makes systems prone to premature advancement, stage misalignment, and boundary violations in continuous dialogue. To address this problem, we argue that the key challenge in process-oriented emotional support is not simply generating natural language, but constructing a sustainably updatable external situational structure for the model. We therefore propose LEKIA 2.0, a situated LLM architecture that separates the cognitive layer from the executive layer, thereby decoupling situational modeling from intervention execution. This design enables the system to maintain stable representations of the user's situation and consent boundaries throughout ongoing interaction. To evaluate this process-control capability, we further introduce a Static-to-Dynamic online evaluation protocol for multi-turn interaction. LEKIA achieved an average absolute improvement of approximately 31% over prompt-only baselines in deep intervention loop completion. The results suggest that an external situational structure is a key enabling condition for building stable, controllable, and situated emotional support systems.