CASCADE: Cumulative Agentic Skill Creation through Autonomous Development and Evolution
作者: Xu Huang, Junwu Chen, Yuxing Fei, Zhuohan Li, Philippe Schwaller, Gerbrand Ceder
分类: cs.AI, cond-mat.mtrl-sci
发布日期: 2025-12-29 (更新: 2026-01-28)
💡 一句话要点
CASCADE:通过自主开发和演化实现累积式智能体技能创造
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 智能体 自主学习 自我演化 科学研究 技能获取 人机协作
📋 核心要点
- 现有LLM智能体依赖预定义工具,限制了其在复杂科学任务中的适应性和扩展性。
- CASCADE框架通过持续学习和自我反思两种元技能,使智能体掌握工具并积累知识。
- 在SciSkillBench测试中,CASCADE使用GPT-5的成功率达到93.3%,显著优于无演化机制的35.4%。
📝 摘要(中文)
大型语言模型(LLM)智能体目前依赖于预定义的工具或早期阶段的工具生成,这限制了它们在复杂科学任务中的适应性和可扩展性。我们提出了CASCADE,一个自我演化的智能体框架,代表了从“LLM + 工具使用”到“LLM + 技能获取”的早期过渡。CASCADE使智能体能够掌握复杂的外部工具,并通过两种元技能来编纂知识:通过网络搜索、代码提取和记忆利用进行持续学习;通过内省、知识图谱探索等进行自我反思。我们在SciSkillBench(一个包含116个材料科学和化学研究任务的基准)上评估了CASCADE。使用GPT-5时,CASCADE的成功率达到93.3%,而没有演化机制时为35.4%。我们进一步展示了在计算分析、自主实验室实验和选择性复现已发表论文中的实际应用。通过人机协作和记忆巩固,CASCADE积累了可执行的技能,这些技能可以在智能体和科学家之间共享,从而朝着可扩展的AI辅助科学研究迈进。
🔬 方法详解
问题定义:现有的大型语言模型智能体在执行复杂科学任务时,严重依赖预定义的工具或早期生成的工具,这限制了它们在面对不断变化的任务需求时的适应性和可扩展性。现有的方法难以实现技能的持续积累和泛化,阻碍了AI在科学研究中的更广泛应用。
核心思路:CASCADE的核心思路是赋予LLM智能体自主学习和演化的能力,使其能够通过持续学习和自我反思来掌握新的技能,并将这些技能进行编码和共享。通过这种方式,智能体可以逐步积累知识和能力,从而更好地完成复杂的科学任务。这种设计旨在模拟人类科学家的学习和研究过程,实现更高效和可扩展的AI辅助科学研究。
技术框架:CASCADE框架包含两个关键的元技能:持续学习和自我反思。持续学习模块通过网络搜索、代码提取和记忆利用来获取新的知识和技能。自我反思模块则通过内省、知识图谱探索等方式来评估自身的表现,并指导后续的学习方向。整个框架通过迭代的方式不断提升智能体的能力。具体流程包括:任务分解、工具选择/学习、执行、结果评估和反思、知识更新等环节。
关键创新:CASCADE最重要的创新点在于其自我演化的能力,即智能体能够自主地学习和改进自身的技能,而无需人工干预。这种能力使得智能体能够适应不断变化的任务需求,并逐步积累知识和能力。与现有方法相比,CASCADE不再仅仅依赖于预定义的工具,而是能够自主地发现和掌握新的工具和技能。
关键设计:CASCADE的关键设计包括:(1) 使用LLM作为智能体的核心控制器,负责任务分解、工具选择和结果评估;(2) 设计了专门的记忆模块,用于存储和检索已学习的知识和技能;(3) 采用了基于知识图谱的自我反思机制,用于评估智能体的表现并指导后续的学习方向;(4) 实现了人机协作接口,允许科学家参与到智能体的学习和研究过程中。
🖼️ 关键图片
📊 实验亮点
CASCADE在SciSkillBench基准测试中取得了显著的成果。使用GPT-5时,CASCADE的成功率达到93.3%,相比之下,没有演化机制的智能体的成功率仅为35.4%。此外,CASCADE还在计算分析、自主实验室实验和选择性复现已发表论文等实际应用中展现了强大的能力。
🎯 应用场景
CASCADE框架具有广泛的应用前景,可用于自动化科学研究、材料发现、药物研发等领域。通过人机协作,CASCADE可以加速科学研究的进程,降低研究成本,并发现新的科学知识。未来,CASCADE有望成为科学家们的重要助手,推动科学研究的进步。
📄 摘要(原文)
Large language model (LLM) agents currently depend on predefined tools or early-stage tool generation, limiting their adaptability and scalability to complex scientific tasks. We introduce CASCADE, a self-evolving agentic framework representing an early instantiation of the transition from "LLM + tool use" to "LLM + skill acquisition". CASCADE enables agents to master complex external tools and codify knowledge through two meta-skills: continuous learning via web search, code extraction, and memory utilization; self-reflection via introspection, knowledge graph exploration, and others. We evaluate CASCADE on SciSkillBench, a benchmark of 116 materials science and chemistry research tasks. CASCADE achieves a 93.3% success rate using GPT-5, compared to 35.4% without evolution mechanisms. We further demonstrate real-world applications in computational analysis, autonomous laboratory experiments, and selective reproduction of published papers. Along with human-agent collaboration and memory consolidation, CASCADE accumulates executable skills that can be shared across agents and scientists, moving toward scalable AI-assisted scientific research.