Scaling Laws for Educational AI Agents

📄 arXiv: 2603.11709v1 📥 PDF

作者: Mengsong Wu, Hao Hao, Shuzhen Bi, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou

分类: cs.AI

发布日期: 2026-03-12

备注: 19 pages, 6 figures, 3 tables, 1 algorithm


💡 一句话要点

提出Agent Scaling Law,通过结构化AgentProfile提升教育AI Agent能力

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 教育AI Agent Agent Scaling Law AgentProfile 结构化能力系统 EduClaw平台

📋 核心要点

  1. 现有研究主要关注LLM本身的模型缩放,忽略了教育Agent能力提升的特殊性,缺乏针对教育场景的scaling law。
  2. 论文提出Agent Scaling Law,通过结构化的AgentProfile规范角色定义、技能深度等维度,实现教育Agent能力的可控增长。
  3. 构建EduClaw平台验证Agent Scaling Law,实验表明教育Agent性能与profile结构丰富度呈正相关,为未来研究指明方向。

📝 摘要(中文)

尽管大型语言模型(LLMs)的缩放定律已在模型参数、训练数据和计算等方面进行了广泛研究,但基于LLM的教育Agent的缩放行为仍未被探索。我们提出,教育Agent的能力提升不仅取决于底层模型的大小,还取决于我们统称为Agent Scaling Law的结构化维度:角色定义清晰度、技能深度、工具完整性、运行时能力和教育者专业知识注入。该框架的核心是AgentProfile,一种基于JSON的结构化规范,作为实现教育Agent系统性能力增长的机制。我们提出了EduClaw,一个profile驱动的多Agent平台,用于实施该缩放定律,并通过构建和部署包含K-12学科的330多个教育Agent profile(包含1100+技能模块)来证明其有效性。我们的经验观察表明,教育Agent的性能随着profile结构丰富度的增加而可预测地扩展。我们将工具缩放和技能缩放这两个互补的缩放轴确定为未来的方向,认为通往更强大的教育AI的道路不仅在于更大的模型,还在于更强大的结构化能力系统。

🔬 方法详解

问题定义:现有的大型语言模型(LLM)缩放定律主要关注模型参数、训练数据和计算资源,而忽略了教育AI Agent的特殊性。教育Agent的能力不仅依赖于底层LLM的大小,还受到角色定义、技能深度、工具使用等因素的影响。现有方法缺乏对这些结构化因素的系统性研究和控制,导致教育Agent的能力提升难以预测和优化。

核心思路:论文的核心思路是提出Agent Scaling Law,将教育Agent的能力增长分解为多个结构化维度,包括角色定义清晰度、技能深度、工具完整性、运行时能力和教育者专业知识注入。通过结构化的AgentProfile来规范和控制这些维度,从而实现教育Agent能力的可控增长。这种方法强调了结构化能力系统的重要性,认为其与模型大小同等重要。

技术框架:论文构建了一个名为EduClaw的profile驱动的多Agent平台,用于实施Agent Scaling Law。该平台的核心是AgentProfile,它是一个基于JSON的结构化规范,用于定义教育Agent的各个方面。EduClaw平台允许研究人员创建和部署具有不同AgentProfile的教育Agent,并评估其性能。该平台包含多个模块,用于管理AgentProfile、调度Agent任务、收集Agent交互数据等。

关键创新:论文最重要的技术创新点在于提出了Agent Scaling Law,并将其形式化为AgentProfile。与传统的模型缩放方法不同,Agent Scaling Law关注的是如何通过结构化方式来提升教育Agent的能力。AgentProfile提供了一种标准化的方式来定义和控制教育Agent的各个方面,从而使得Agent能力的增长更加可预测和可控。

关键设计:AgentProfile是基于JSON的结构化规范,包含多个字段,用于定义教育Agent的角色、技能、工具、运行时行为和教育者专业知识。例如,角色定义字段可以指定Agent的角色(如数学老师、历史学家),技能字段可以指定Agent掌握的技能(如解方程、分析历史事件),工具字段可以指定Agent可以使用的工具(如计算器、搜索引擎)。论文还提出了工具缩放和技能缩放这两个互补的缩放轴,用于指导AgentProfile的设计和优化。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文构建了包含330多个教育Agent profile(包含1100+技能模块)的EduClaw平台,并通过实验验证了Agent Scaling Law的有效性。实验结果表明,教育Agent的性能随着profile结构丰富度的增加而可预测地扩展,证明了结构化能力系统在教育AI中的重要性。

🎯 应用场景

该研究成果可应用于构建更智能、更个性化的教育AI Agent,例如智能辅导系统、在线学习平台等。通过Agent Scaling Law和AgentProfile,可以系统地提升教育Agent的教学质量和学习效果。未来,该研究还可以扩展到其他领域,例如医疗、金融等,构建更强大的领域专家Agent。

📄 摘要(原文)

While scaling laws for Large Language Models (LLMs) have been extensively studied along dimensions of model parameters, training data, and compute, the scaling behavior of LLM-based educational agents remains unexplored. We propose that educational agent capability scales not merely with the underlying model size, but through structured dimensions that we collectively term the Agent Scaling Law: role definition clarity, skill depth, tool completeness, runtime capability, and educator expertise injection. Central to this framework is AgentProfile, a structured JSON-based specification that serves as the mechanism enabling systematic capability growth of educational agents. We present EduClaw, a profile-driven multi-agent platform that operationalizes this scaling law, demonstrating its effectiveness through the construction and deployment of 330+ educational agent profiles encompassing 1,100+ skill modules across K-12 subjects. Our empirical observations suggest that educational agent performance scales predictably with profile structural richness. We identify two complementary scaling axes -- Tool Scaling and Skill Scaling -- as future directions, arguing that the path to more capable educational AI lies not solely in larger models, but in stronger structured capability systems.