Using Large Language Models to Categorize Strategic Situations and Decipher Motivations Behind Human Behaviors

📄 arXiv: 2503.15752v5 📥 PDF

作者: Yutong Xie, Qiaozhu Mei, Walter Yuan, Matthew O. Jackson

分类: cs.AI

发布日期: 2025-03-20 (更新: 2025-07-02)


💡 一句话要点

利用大型语言模型分类策略情境并解读人类行为动机

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 行为经济学 策略情境 人类行为动机 提示工程

📋 核心要点

  1. 现有方法难以有效推断人类在复杂策略情境中的行为动机。
  2. 通过设计不同的提示词,利用大型语言模型模拟人类在经济博弈中的行为。
  3. 分析提示词与行为之间的关系,从而分类策略情境并解读行为动机。

📝 摘要(中文)

本文通过改变大型语言模型的提示,在经典经济博弈的各种不同场景中,激发了全方位的人类行为。通过分析哪些提示引发了哪些行为,我们可以对不同的策略情境进行分类和比较,这也有助于深入了解不同的经济场景诱导人们思考的内容。我们讨论了这如何为推断(解读)人类行为背后的动机提供了一种非标准方法的第一步。我们还展示了如何利用这种解读过程来对不同人群的行为倾向差异进行分类。

🔬 方法详解

问题定义:论文旨在解决如何有效推断和理解人类在策略情境下的行为动机这一问题。现有方法通常依赖于直接观察或问卷调查,但这些方法可能受到观察者偏差或受访者主观性的影响,难以准确捕捉行为背后的真实动机。此外,现有方法在处理复杂、多变的策略情境时,往往缺乏足够的灵活性和适应性。

核心思路:论文的核心思路是利用大型语言模型(LLM)的强大语言理解和生成能力,通过精心设计的提示词(prompts)来模拟人类在不同策略情境下的行为。通过分析不同提示词与LLM生成的行为之间的关系,可以反推出人类在类似情境下的潜在动机。这种方法将LLM视为一个“代理人”,通过观察其在不同“刺激”下的反应来推断其“内在状态”。

技术框架:该方法主要包含以下几个阶段:1) 情境构建:选择或设计一系列具有代表性的策略情境,例如经典的经济博弈(囚徒困境、最后通牒博弈等)。2) 提示词设计:针对每个情境,设计一系列不同的提示词,这些提示词旨在引导LLM从不同的角度思考问题,例如强调合作、竞争、公平等。3) 行为生成:将提示词输入LLM,让其生成相应的行为决策。4) 行为分析:分析不同提示词下LLM生成的行为模式,例如统计不同选择的频率、计算收益等。5) 动机推断:根据行为模式与提示词之间的关系,推断人类在类似情境下的潜在动机。

关键创新:该方法的主要创新在于将LLM作为一种新的研究工具,用于推断人类行为动机。与传统方法相比,该方法具有以下优势:1) 客观性:LLM的行为是基于算法的,不受主观偏差的影响。2) 灵活性:可以通过改变提示词来模拟不同的情境和动机。3) 可扩展性:可以应用于各种不同的策略情境。

关键设计:关键设计包括:1) 提示词的设计:提示词需要足够清晰、明确,能够有效地引导LLM的行为。2) LLM的选择:选择具有足够强的语言理解和生成能力的LLM,例如GPT-3、GPT-4等。3) 行为分析方法:选择合适的统计方法和机器学习算法来分析LLM生成的行为数据。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该研究通过实验验证了利用大型语言模型解读人类行为动机的可行性。通过改变提示词,可以诱导出大型语言模型在不同经济博弈场景下的全方位人类行为。对提示词和行为的分析,能够有效分类策略情境,并洞察不同经济场景下人们的思考模式。

🎯 应用场景

该研究成果可应用于行为经济学、心理学、社会学等领域,帮助研究人员更深入地理解人类在策略情境下的决策过程和动机。此外,该方法还可以用于设计更有效的谈判策略、改善人机交互体验、预测市场行为等方面,具有广泛的应用前景。

📄 摘要(原文)

By varying prompts to a large language model, we can elicit the full range of human behaviors in a variety of different scenarios in classic economic games. By analyzing which prompts elicit which behaviors, we can categorize and compare different strategic situations, which can also help provide insight into what different economic scenarios induce people to think about. We discuss how this provides a first step towards a non-standard method of inferring (deciphering) the motivations behind the human behaviors. We also show how this deciphering process can be used to categorize differences in the behavioral tendencies of different populations.