Scaling Laws for Economic Productivity: Experimental Evidence in LLM-Assisted Consulting, Data Analyst, and Management Tasks

作者: Ali Merali

分类: econ.GN, cs.AI, cs.HC

发布日期: 2025-12-24

💡 一句话要点

量化LLM算力与经济生产力关系，揭示AI模型进步对专业任务效率的提升

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 经济生产力 缩放定律 实验研究 算力 算法进步 专业任务 生产力提升

📋 核心要点

现有研究缺乏对LLM算力投入与实际经济生产力之间量化关系的深入分析。
该研究通过实验方法，量化了LLM的训练算力、算法进步与专业人员生产力之间的关系。
实验结果表明，LLM的进步显著提升了专业人员的生产力，尤其是在非代理分析任务中。

📝 摘要（中文）

本文推导了“经济影响的缩放定律”，即大型语言模型（LLM）的训练算力与专业生产力之间的经验关系。在一项预注册实验中，超过500名顾问、数据分析师和管理人员使用13个LLM完成了专业任务。研究发现，AI模型每进步一年，任务时间缩短8%，其中56%的收益来自算力增加，44%来自算法进步。然而，对于非代理分析任务，生产力提升显著高于需要工具使用的代理工作流程。这些发现表明，持续的模型扩展可能在未来十年内将美国生产力提高约20%。

🔬 方法详解

问题定义：论文旨在解决的问题是量化大型语言模型（LLM）的训练算力投入与实际经济生产力之间的关系。现有方法缺乏对这种关系的系统性研究，难以评估LLM进步对经济的影响。现有方法难以区分算力提升和算法进步对生产力提升的各自贡献，也缺乏对不同类型任务（如分析任务和代理任务）的差异化分析。

核心思路：论文的核心思路是通过设计一个大规模的实验，让专业人员使用不同算力水平的LLM完成实际工作任务，从而收集数据并建立LLM算力、算法进步与生产力之间的经验关系。通过控制实验变量，可以区分算力提升和算法进步的贡献，并分析不同类型任务的生产力提升差异。

技术框架：该研究的技术框架主要包括以下几个阶段：1) 选择不同算力水平的LLM；2) 设计具有代表性的专业任务，包括咨询、数据分析和管理任务；3) 招募专业人员参与实验，并随机分配他们使用不同的LLM；4) 记录参与者完成任务的时间和质量；5) 使用回归分析等统计方法，建立LLM算力、算法进步与生产力之间的经验关系。

关键创新：该研究的关键创新在于：1) 首次通过实验方法量化了LLM算力与经济生产力之间的关系，填补了该领域的空白；2) 区分了算力提升和算法进步对生产力提升的各自贡献，为理解LLM进步的驱动力提供了新的视角；3) 分析了不同类型任务的生产力提升差异，为LLM的应用提供了指导。

关键设计：实验设计的关键在于：1) 选择具有代表性的专业任务，确保实验结果具有实际意义；2) 控制实验变量，例如参与者的专业水平和任务难度，以减少干扰因素；3) 使用预注册实验，提高研究结果的可信度；4) 使用回归分析等统计方法，建立LLM算力、算法进步与生产力之间的经验关系，并进行显著性检验。

🖼️ 关键图片

📊 实验亮点

实验结果表明，AI模型每进步一年，任务时间缩短8%，其中56%的收益来自算力增加，44%来自算法进步。对于非代理分析任务，生产力提升显著高于需要工具使用的代理工作流程。研究预测，持续的模型扩展可能在未来十年内将美国生产力提高约20%。

🎯 应用场景

该研究成果可应用于预测LLM进步对经济的影响，指导企业和政府的AI投资决策。例如，企业可以根据该研究结果，评估购买更强大LLM的潜在回报。政府可以利用该研究结果，制定更有效的AI发展战略。此外，该研究还可以帮助优化LLM的应用，例如针对不同类型的任务选择合适的LLM。

📄 摘要（原文）

This paper derives `Scaling Laws for Economic Impacts' -- empirical relationships between the training compute of Large Language Models (LLMs) and professional productivity. In a preregistered experiment, over 500 consultants, data analysts, and managers completed professional tasks using one of 13 LLMs. We find that each year of AI model progress reduced task time by 8%, with 56% of gains driven by increased compute and 44% by algorithmic progress. However, productivity gains were significantly larger for non-agentic analytical tasks compared to agentic workflows requiring tool use. These findings suggest continued model scaling could boost U.S. productivity by approximately 20% over the next decade.

Scaling Laws for Economic Productivity: Experimental Evidence in LLM-Assisted Consulting, Data Analyst, and Management Tasks

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理