AgentEconomist: An End-to-end Agentic System Translating Economic Intuitions into Executable Computational Experiments

📄 arXiv: 2604.27725v1 📥 PDF

作者: Jiaju Chen, Jinghua Piao, Xia Xu, Songwei Li, Tong Xia, Xiangnan He, Yong Li

分类: cs.HC, cs.AI

发布日期: 2026-04-30


💡 一句话要点

AgentEconomist:将经济学直觉转化为可执行计算实验的端到端智能系统

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 经济学 计算实验 人机协作 大型语言模型 领域知识库

📋 核心要点

  1. 经济学研究面临的挑战是将研究者的直觉转化为可验证的实验,现有方法难以有效实现。
  2. AgentEconomist通过模块化的多阶段架构,将经济学家的直觉转化为可执行的计算实验。
  3. 实验结果表明,AgentEconomist生成的科研想法在文献基础、创新性和洞察力方面优于现有LLM。

📝 摘要(中文)

经济学研究的长期挑战在于将直觉转化为可验证的研究的困难。为了解决这个问题,我们提出了AgentEconomist,一个端到端交互式系统,旨在将抽象的直觉转化为可执行的计算实验。该系统基于包含超过13000篇高质量学术论文的领域特定知识库,采用模块化的多阶段架构。具体来说,构思阶段生成基于文献的假设,实验设计阶段配置与模拟器对齐的实验参数和协议,实验执行阶段运行实验并返回结构化分析。这些阶段共同构成了一个人机协作的迭代工作流程,将经济学直觉转化为可执行的计算实验。通过涉及人类专家评估和大型语言模型(LLM)作为评判的大量实验,我们表明该系统生成的科研想法比最先进的通用LLM具有更强的文献基础、更高的创新性和洞察力。总体而言,AgentEconomist采用了一种人机协作模式,使研究人员能够专注于高层次的直觉,同时将劳动密集型的翻译和计算执行过程委托给智能体。

🔬 方法详解

问题定义:经济学研究中,研究者往往拥有深刻的直觉,但难以将其转化为可验证的计算实验。现有方法,如人工设计实验,耗时耗力且容易出错;而通用LLM在经济学领域的知识储备和推理能力不足,难以生成高质量的实验方案。因此,如何高效、准确地将经济学直觉转化为可执行的计算实验是一个亟待解决的问题。

核心思路:AgentEconomist的核心思路是构建一个端到端的人机协作系统,利用领域知识库和模块化的智能体,将经济学家的直觉逐步转化为可执行的计算实验。通过将复杂的实验设计过程分解为多个阶段,并让人类专家参与其中,AgentEconomist能够有效地利用人类的直觉和机器的计算能力,从而提高实验设计的效率和质量。

技术框架:AgentEconomist采用模块化的多阶段架构,主要包含以下三个阶段:1) 构思阶段 (Idea Development Stage):基于领域知识库,生成与文献相关的假设。2) 实验设计阶段 (Experimental Design Stage):配置与模拟器对齐的实验参数和协议。3) 实验执行阶段 (Experimental Execution Stage):运行实验并返回结构化分析。这三个阶段形成一个迭代的工作流程,研究人员可以在每个阶段进行干预和调整,从而实现人机协作。

关键创新:AgentEconomist的关键创新在于其端到端的集成性和领域知识的嵌入。与传统的实验设计方法相比,AgentEconomist能够自动地生成实验方案,并提供结构化的分析结果,从而大大提高了实验设计的效率。此外,AgentEconomist还利用领域知识库来指导实验设计过程,从而保证了实验方案的合理性和可靠性。与通用LLM相比,AgentEconomist在经济学领域的知识储备和推理能力更强,能够生成更具创新性和洞察力的实验方案。

关键设计:AgentEconomist的关键设计包括:1) 领域知识库的构建:收集并整理了超过13000篇高质量的经济学学术论文,构建了一个领域特定的知识库。2) 模块化的智能体设计:为每个阶段设计了专门的智能体,并采用不同的技术来实现其功能。例如,在构思阶段,可以使用基于Transformer的模型来生成假设;在实验设计阶段,可以使用基于规则的系统来配置实验参数。3) 人机协作接口的设计:设计了友好的用户界面,方便研究人员在每个阶段进行干预和调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,AgentEconomist生成的科研想法比最先进的通用LLM具有更强的文献基础、更高的创新性和洞察力。通过人类专家评估和大型语言模型(LLM)作为评判,验证了AgentEconomist在生成高质量科研想法方面的有效性。具体性能数据未知。

🎯 应用场景

AgentEconomist可应用于经济学、社会科学等领域的研究,帮助研究人员快速验证其经济学直觉,加速科研进程。该系统能够降低实验设计的门槛,使更多研究者能够参与到计算实验中来。未来,AgentEconomist有望成为经济学研究的重要工具,推动经济学理论的发展和应用。

📄 摘要(原文)

A long-standing challenge in economics lies not in the lack of intuition, but in the difficulty of translating intuitive insights into verifiable research. To address this challenge, we introduce AgentEconomist, an end-to-end interactive system designed to translate abstract intuitions into executable computational experiments. Grounded in a domain-specific knowledge base covering over 13,000 high-quality academic papers, the system employs a modular multi-stage architecture. Specifically, the Idea Development Stage generates literature-grounded hypotheses, the Experimental Design Stage configures simulator-aligned experimental parameters and protocols, and the Experimental Execution Stage runs experiments and returns structured analyses. Together, these stages form a human-in-the-loop, iterative workflow that translates economic intuitions into executable computational experiments. Through extensive experiments involving human expert evaluation and large language models (LLMs) as judges, we show that the system generates research ideas with stronger literature grounding and higher novelty and insight than state-of-the-art generic LLMs. Overall, AgentEconomist adopts a human-AI collaboration paradigm that enables researchers to focus on high-level intuitions, while delegating the labor-intensive processes of translation and computational execution to agents.