Adaptive Interviewing for Persona Simulation in LLMs: Evidence-Grounded Reasoning Improves Decision Alignment

📄 arXiv: 2605.29458v1 📥 PDF

作者: Ruoxi Su, Yuhan Liu, Jingyu Hu

分类: cs.CL, cs.AI

发布日期: 2026-05-28

备注: 20 pages, 2 figures, 12 tables


💡 一句话要点

提出自适应访谈框架,提升LLM在个体决策模拟中的证据一致性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 自适应访谈 LLM 个体决策模拟 人物角色模拟 证据一致性

📋 核心要点

  1. 现有方法依赖静态的人物角色描述,缺乏个体决策所需的价值观和情境信息,导致LLM难以准确模拟个体决策。
  2. 提出自适应访谈框架,通过核心问题、动态追问和人格总结,结构化地收集人物角色相关信息,为LLM提供更丰富的决策依据。
  3. 实验表明,自适应访谈的关键在于选择性地 grounding,即模型将决策建立在用户特定证据之上,从而提升决策模拟的准确性。

📝 摘要(中文)

大型语言模型(LLM)准确模拟特定个体的决策仍然具有挑战性,部分原因是人物角色信息通常以静态描述的形式提供,缺少个体层面决策模拟所需的价值观、经验和情境线索。我们提出了一个自适应访谈框架,通过结构化的三个阶段对话收集与人物角色相关的信息:核心问题、动态追问和一个综合的人格总结。利用由此产生的访谈记录,我们评估了LLM是否能够模拟参与者在道德困境场景中的决策。我们比较了三种对话情境——Core-10回答、完整的访谈对话和一个总结性的人物角色表示。我们发现,自适应访谈的作用并非统一提升准确性,而更像是一种选择性的 grounding 机制:大约40%的完整访谈记录中包含了追问得出的证据,并且这些基于追问的预测比仅基于核心问题的预测更准确(45.5% vs. 39.3%)。这些发现强调,更丰富的人物角色背景信息本身是不够的:只有当模型真正将决策建立在用户特定的证据之上时,才能带来改进。

🔬 方法详解

问题定义:论文旨在解决大型语言模型(LLM)在模拟特定个体决策时准确性不足的问题。现有的方法通常使用静态的人物角色描述作为输入,这些描述缺乏个体决策所需的价值观、经验和情境线索,导致LLM难以进行有效的个体层面决策模拟。因此,如何为LLM提供更丰富、更具个体特性的信息,是提升决策模拟准确性的关键挑战。

核心思路:论文的核心思路是通过自适应访谈的方式,动态地收集与人物角色相关的信息,从而为LLM提供更全面的决策依据。这种方法模拟了人类访谈的过程,通过提问和追问,逐步挖掘出人物角色的价值观、经验和情境认知,从而使LLM能够更好地理解和模拟个体的决策过程。核心在于让LLM的决策过程能够 grounding 到用户特定的证据上。

技术框架:论文提出的自适应访谈框架包含三个主要阶段: 1. 核心问题(Core Questions):首先提出一系列核心问题,旨在快速了解人物角色的基本情况和价值观。 2. 动态追问(Dynamic Follow-ups):根据核心问题的回答,动态地生成追问问题,深入挖掘人物角色的特定经验和情境认知。追问问题的生成策略未知。 3. 人格总结(Synthesized Personality Summary):将访谈记录进行总结,生成一个简洁的人物角色表示,供LLM进行决策模拟。

关键创新:论文的关键创新在于提出了自适应访谈的概念,并将其应用于LLM的个体决策模拟中。与现有方法相比,该方法能够动态地收集人物角色信息,从而为LLM提供更丰富、更具个体特性的决策依据。此外,论文还强调了 grounding 的重要性,即LLM的决策过程需要建立在用户特定的证据之上,才能实现准确的决策模拟。

关键设计:论文中关于动态追问问题的生成策略以及人格总结的具体方法没有详细说明,属于未知部分。实验中比较了三种不同的对话情境:Core-10回答、完整的访谈对话和总结性的人物角色表示,以评估自适应访谈框架的效果。具体的参数设置、损失函数和网络结构等技术细节也未在论文中详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,自适应访谈框架能够有效提升LLM在个体决策模拟中的准确性。具体而言,大约40%的完整访谈记录中包含了追问得出的证据,并且这些基于追问的预测比仅基于核心问题的预测更准确(45.5% vs. 39.3%)。这表明,通过动态收集人物角色信息,并将其 grounding 到用户特定的证据之上,可以显著提升LLM的决策模拟能力。

🎯 应用场景

该研究成果可应用于个性化推荐系统、智能客服、心理咨询等领域。通过模拟用户的决策过程,可以更准确地预测用户的需求和偏好,从而提供更个性化的服务。此外,该方法还可以用于训练AI代理,使其能够更好地理解和与人类进行交互,从而提高人机协作的效率。

📄 摘要(原文)

Accurately simulating the decisions of a specific individual remains challenging for large language models (LLMs), partly because persona information is often provided as static descriptions that miss the values, experiences, and contextual cues needed for individual-level decision simulation. We propose an adaptive interview framework that gathers persona-relevant information through a structured three-stage dialogue: core questions, dynamic follow-ups, and a synthesized personality summary. Using the resulting interview transcripts, we evaluate whether LLMs can simulate participants' decisions in moral dilemma scenarios. We compare three conversational contexts -- Core-10 responses, the full interview dialogue, and a summarized persona representation. We find that adaptive interviewing functions less as a uniform accuracy booster and more as a selective grounding mechanism: follow-up-derived evidence is incorporated in around 40% of full-interview traces, and these follow-up-grounded predictions are more accurate than core-only grounded ones (45.5% vs. 39.3%). These findings highlight that richer persona context alone is insufficient: improvements arise only when models actually ground their decisions in user-specific evidence.