Generative AI and the Productivity Divide: Human-AI Complementarities in Education

📄 arXiv: 2605.18143v1 📥 PDF

作者: Lihi Idan, Bharat Anand

分类: cs.AI

发布日期: 2026-05-18


💡 一句话要点

研究表明,生成式AI在教育中生产力提升存在差异,AI交互能力是关键。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 生成式AI 生产力 人机协作 AI交互能力 教育 大型语言模型 随机对照实验 能力不平等

📋 核心要点

  1. 现有研究对生成式AI在不同用户间的生产力差异了解不足,尤其是在教育场景下。
  2. 该研究通过实验评估了不同AI交互能力(AIC)的用户在使用GenAI时的表现差异。
  3. 实验结果表明,GenAI显著提升了任务表现,但收益分布不均,AIC是关键预测指标。

📝 摘要(中文)

生成式人工智能(GenAI)正在改变公司创建、处理和应用知识的方式,但人们对其生产力效应在用户间的异质性知之甚少。我们报告了一项随机对照实验的结果,其中参与者(类似于早期职业知识工作者)被分配使用传统资源或大型语言模型(LLM)辅助自学一个技术领域。平均而言,GenAI的使用显著提高了任务表现,但收益的分布非常不均匀。GPA或先验知识并不能预测改进,而AI交互能力(AIC)——即引出、过滤和验证模型输出的能力——可以预测。高AIC参与者获得了超额收益;低AIC参与者获得的边际收益有限,甚至为负。一项支架干预(概念图)降低了结果方差,表明标准化的工作流程可以减轻AI介导的表现中的不平等。我们通过人机互补的视角来解读这些发现:GenAI提高了平均生产力,同时也引入了能力不平等的新维度。在管理上,公司应将GenAI的使用与简短的AIC微培训和简单的标准操作程序相结合,以持续获取价值,避免采用结果不均。

🔬 方法详解

问题定义:论文旨在研究生成式AI(GenAI)对知识工作者生产力的影响,特别关注不同用户在使用GenAI时的表现差异。现有方法未能充分解释GenAI带来的生产力提升在用户间的异质性,以及如何缓解由此产生的不平等现象。

核心思路:论文的核心思路是识别并量化“AI交互能力(AIC)”这一关键因素,即用户与GenAI有效互动、筛选和验证模型输出的能力。通过实验验证AIC与GenAI使用效果之间的关系,并探索标准化工作流程(如概念图)对缓解不平等的影响。

技术框架:该研究采用随机对照实验设计。参与者被随机分配到两个组:一组使用传统资源自学技术领域知识,另一组使用大型语言模型(LLM)辅助学习。实验过程中,研究人员收集参与者的任务表现数据,并评估他们的AIC。此外,研究还引入了支架干预(概念图)来观察其对结果的影响。

关键创新:该研究的关键创新在于提出了“AI交互能力(AIC)”这一概念,并证明了其对GenAI使用效果的显著影响。与以往关注GPA或先验知识的研究不同,该研究强调了用户与AI互动技能的重要性,为理解和优化人机协作提供了新的视角。

关键设计:实验中,AIC的评估方法未知,但推测可能包括对用户提问质量、信息筛选能力和结果验证能力的评估。支架干预采用概念图,旨在提供标准化的学习框架,降低不同AIC水平用户之间的表现差异。具体的LLM选择和技术领域知识未知。

🖼️ 关键图片

fig_0

📊 实验亮点

实验结果表明,平均而言,GenAI的使用显著提高了任务表现。然而,收益分布高度不均,高AIC参与者获得了超额收益,而低AIC参与者的收益有限甚至为负。概念图干预降低了结果方差,表明标准化工作流程可以减轻AI介导的表现中的不平等。

🎯 应用场景

该研究成果可应用于企业培训、教育教学等领域,帮助企业和教育机构更有效地利用生成式AI提升员工和学生的学习效率。通过提升用户的AI交互能力,并提供标准化的工作流程,可以最大限度地发挥GenAI的潜力,同时避免因能力差异导致的不平等现象。

📄 摘要(原文)

Generative Artificial Intelligence (GenAI) is transforming how firms create, process, and apply knowledge, yet little is known about the heterogeneity of its productivity effects across users. We report results from a randomized controlled experiment in which participants-analogs of early-career knowledge workers-were assigned to self-study a technical domain using either traditional resources or large-language-model (LLM) assistance. On average, GenAI access significantly increased task performance, but the distribution of gains was highly uneven. Improvements were not predicted by GPA or prior knowledge, but by \textit{AI Interaction Competence (AIC)} -- the ability to elicit, filter, and verify model outputs. High-AIC participants realized outsized gains; low-AIC participants saw limited or even negative marginal returns. A scaffolding intervention (conceptual maps) reduced outcome variance, indicating that standardized workflows can mitigate inequality in AI-mediated performance. We interpret these findings through the lens of human-AI complementarities: GenAI raises mean productivity while introducing a new axis of capability inequality. Managerially, firms should pair GenAI access with short AIC micro-training and simple standard operating procedures to capture value consistently and avoid uneven adoption outcomes.