Economic Rationality under Specialization: Evidence of Decision Bias in AI Agents

📄 arXiv: 2501.18190v2 📥 PDF

作者: ShuiDe Wen

分类: cs.AI

发布日期: 2025-01-30 (更新: 2025-03-17)


💡 一句话要点

专业化AI决策易偏离理性:基于GARP和CCEI的决策偏差分析

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 经济理性 决策偏差 专业化Agent 广义显示偏好公理 临界成本效率指数

📋 核心要点

  1. 现有研究表明大型语言模型在经济理性方面表现出色,但缺乏对专业化Agent理性水平的深入考察。
  2. 本研究对比通用Agent和专业Agent在经济决策中的理性程度,揭示专业化可能导致决策偏差。
  3. 实验结果表明,专业Agent更易违反理性原则,而通用Agent表现更稳定,揭示了专业化与理性间的权衡。

📝 摘要(中文)

本文基于Chen et al. (2023)的研究,该研究表明大型语言模型GPT在预算分配和风险偏好等任务中表现出与人类平均水平相当或更高的经济理性。本文进一步纳入了生物技术专家和经济学家等专业化Agent进行横向比较,以探索专业化是否能增强或保持与GPT相当的经济理性。结果表明,当Agent在专业领域投入更多精力时,其决策行为更容易出现“理性转移”,具体表现为更多地违反GARP(广义显示偏好公理)、CCEI(临界成本效率指数)降低以及在高风险条件下更显著的决策偏差。相比之下,GPT和更通用的基础Agent在多个任务中保持了更稳定和一致的理性水平。这项研究揭示了专业化和经济理性之间固有的冲突,为构建在各种场景中平衡专业化和泛化的AI决策系统提供了新的见解。

🔬 方法详解

问题定义:论文旨在研究在经济决策任务中,AI Agent的专业化程度对其经济理性的影响。现有方法主要关注通用AI模型的理性水平,忽略了专业化Agent可能存在的决策偏差。专业化Agent在特定领域知识丰富,但可能过度依赖专业知识,导致决策偏离理性。

核心思路:论文的核心思路是通过对比通用Agent(如GPT)和专业Agent(如生物技术专家和经济学家)在相同经济决策任务中的表现,来评估专业化对经济理性的影响。通过分析Agent的决策行为是否符合经济理性原则(如GARP),来量化其理性程度。

技术框架:论文的技术框架主要包括以下几个步骤:1) 选择合适的经济决策任务,例如预算分配和风险偏好选择;2) 构建通用Agent(GPT)和专业Agent(生物技术专家、经济学家);3) 让Agent独立完成决策任务;4) 使用GARP和CCEI等指标评估Agent的决策理性程度;5) 分析不同Agent在不同任务中的表现差异,从而得出专业化对经济理性影响的结论。

关键创新:论文最重要的技术创新点在于揭示了AI Agent专业化与经济理性之间的潜在冲突。以往研究主要关注如何提高AI模型的通用能力,而忽略了专业化可能带来的负面影响。本研究首次发现,过度专业化可能导致Agent的决策行为偏离理性,为AI决策系统的设计提供了新的视角。

关键设计:论文的关键设计包括:1) 选择GARP和CCEI作为评估经济理性的指标,这些指标能够有效量化Agent的决策行为是否符合理性原则;2) 构建具有不同专业背景的Agent,以便进行横向比较;3) 设计包含不同风险水平的决策任务,以考察Agent在不同情境下的理性表现;4) 采用统计分析方法,对实验结果进行显著性检验,确保结论的可靠性。

📊 实验亮点

实验结果表明,专业化Agent在决策中更容易违反GARP原则,CCEI值更低,在高风险条件下决策偏差更显著。相比之下,GPT等通用Agent在多个任务中表现出更稳定和一致的理性水平。这些结果量化了专业化对AI决策理性的负面影响。

🎯 应用场景

该研究成果可应用于构建更可靠的AI决策系统,尤其是在需要平衡专业知识和理性决策的领域,如金融投资、医疗诊断和政策制定。通过避免过度专业化,可以提升AI决策的稳定性和可靠性,减少潜在的决策偏差,从而提高决策质量。

📄 摘要(原文)

In the study by Chen et al. (2023) [01], the large language model GPT demonstrated economic rationality comparable to or exceeding the average human level in tasks such as budget allocation and risk preference. Building on this finding, this paper further incorporates specialized agents, such as biotechnology experts and economists, for a horizontal comparison to explore whether specialization can enhance or maintain economic rationality equivalent to that of GPT in similar decision-making scenarios. The results indicate that when agents invest more effort in specialized fields, their decision-making behavior is more prone to 'rationality shift,' specifically manifested as increased violations of GARP (Generalized Axiom of Revealed Preference), decreased CCEI (Critical Cost Efficiency Index), and more significant decision deviations under high-risk conditions. In contrast, GPT and more generalized basic agents maintain a more stable and consistent level of rationality across multiple tasks. This study reveals the inherent conflict between specialization and economic rationality, providing new insights for constructing AI decision-making systems that balance specialization and generalization across various scenarios.