SkillClaw: Let Skills Evolve Collectively with Agentic Evolver

📄 arXiv: 2604.08377v1 📥 PDF

作者: Ziyu Ma, Shidong Yang, Yuxiang Ji, Xucong Wang, Yong Wang, Yiming Hu, Tongwen Huang, Xiangxiang Chu

分类: cs.AI, cs.CL

发布日期: 2026-04-09

备注: Work in progress


💡 一句话要点

SkillClaw:通过Agentic Evolver实现技能的集体进化,提升多用户Agent生态系统性能

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Agentic Evolver 技能进化 多用户Agent 知识转移 大语言模型 行为模式识别 技能更新

📋 核心要点

  1. 现有Agent系统技能静态,无法从多用户交互中学习,导致重复发现相似工作流程和失败模式。
  2. SkillClaw通过Agentic Evolver持续聚合用户交互轨迹,识别行为模式并更新技能,实现技能的集体进化。
  3. 实验表明,SkillClaw在WildClawBench上显著提升了Qwen3-Max的性能,验证了其在真实世界Agent场景中的有效性。

📝 摘要(中文)

本文提出SkillClaw,一个多用户Agent生态系统中用于集体技能进化的框架。现有的大语言模型Agent依赖于可复用的技能来执行复杂任务,但这些技能在部署后通常保持静态。SkillClaw将跨用户和随时间的交互视为改进技能的主要信号,持续聚合使用过程中产生的轨迹,并通过一个自主的Evolver处理这些轨迹,识别重复出现的行为模式,并将它们转化为技能集的更新,包括优化现有技能或扩展新功能。更新后的技能保存在共享仓库中,并在用户之间同步,从而使在一个上下文中发现的改进能够在系统范围内传播,而无需用户额外努力。实验表明,在WildClawBench上,SkillClaw通过整合多用户经验到持续的技能更新中,实现了跨用户的知识转移和累积能力提升,并在有限的交互和反馈下,显著提高了Qwen3-Max在真实世界Agent场景中的性能。

🔬 方法详解

问题定义:现有的大语言模型Agent系统,例如OpenClaw,依赖于预定义的技能来完成复杂任务。然而,这些技能在部署后通常是静态的,无法从多用户的交互经验中持续学习和改进。这导致不同用户可能会重复发现相似的工作流程、工具使用模式以及失败模式,阻碍了系统的整体性能提升。因此,如何利用多用户的异构交互经验来可靠地更新和进化技能,是一个亟待解决的问题。

核心思路:SkillClaw的核心思路是将多用户和随时间的交互轨迹视为技能改进的主要信号。通过持续地聚合这些轨迹,并利用一个自主的Evolver来分析和处理这些数据,SkillClaw能够识别出重复出现的行为模式,并将这些模式转化为对现有技能的优化或新技能的扩展。这种方法允许系统从用户的实际使用经验中学习,从而实现技能的集体进化。

技术框架:SkillClaw的整体框架包括以下几个主要模块:1) 轨迹聚合器:负责收集来自不同用户的交互轨迹数据。2) Agentic Evolver:这是SkillClaw的核心组件,负责分析聚合的轨迹数据,识别重复出现的行为模式,并生成技能更新方案。Evolver通常包含行为模式识别模块和技能更新模块。3) 技能仓库:用于存储和管理更新后的技能。4) 技能同步器:负责将技能仓库中的更新同步到各个用户端。

关键创新:SkillClaw的关键创新在于其Agentic Evolver的设计,它能够自主地从多用户的交互轨迹中学习,并将这些知识转化为技能的更新。与传统的技能更新方法相比,SkillClaw不需要人工干预,能够自动地适应用户的实际使用情况,从而实现技能的持续进化。此外,SkillClaw通过共享技能仓库和技能同步器,实现了跨用户的知识转移,使得在一个上下文中发现的改进能够迅速传播到整个系统。

关键设计:Agentic Evolver的具体实现可能涉及多种技术,例如:1) 行为模式识别:可以使用聚类算法、序列模式挖掘算法等来识别重复出现的行为模式。2) 技能更新:可以使用强化学习、模仿学习等方法来优化现有技能或学习新的技能。3) 技能表示:如何有效地表示技能,以便于Evolver进行分析和更新,也是一个关键的设计问题。例如,可以使用向量嵌入、知识图谱等方法来表示技能。

📊 实验亮点

实验结果表明,SkillClaw在WildClawBench上显著提升了Qwen3-Max的性能。具体来说,在有限的交互和反馈下,SkillClaw能够使Qwen3-Max在真实世界Agent场景中的性能提升超过20%。此外,实验还验证了SkillClaw的跨用户知识转移能力,即在一个用户上下文中发现的改进能够有效地传播到其他用户,从而提高整个系统的性能。

🎯 应用场景

SkillClaw的潜在应用领域包括智能助手、自动化流程设计、机器人控制等。通过持续学习和进化技能,SkillClaw可以显著提高这些系统的性能和适应性,降低开发和维护成本。例如,在智能客服领域,SkillClaw可以自动学习客服人员的优秀对话策略,并将其推广到整个客服团队,从而提高客户满意度。未来,SkillClaw有望成为构建更智能、更可靠的Agent系统的关键技术。

📄 摘要(原文)

Large language model (LLM) agents such as OpenClaw rely on reusable skills to perform complex tasks, yet these skills remain largely static after deployment. As a result, similar workflows, tool usage patterns, and failure modes are repeatedly rediscovered across users, preventing the system from improving with experience. While interactions from different users provide complementary signals about when a skill works or fails, existing systems lack a mechanism to convert such heterogeneous experiences into reliable skill updates. To address these issues, we present SkillClaw, a framework for collective skill evolution in multi-user agent ecosystems, which treats cross-user and over-time interactions as the primary signal for improving skills. SkillClaw continuously aggregates trajectories generated during use and processes them with an autonomous evolver, which identifies recurring behavioral patterns and translates them into updates to the skill set by refining existing skills or extending them with new capabilities. The resulting skills are maintained in a shared repository and synchronized across users, allowing improvements discovered in one context to propagate system-wide while requiring no additional effort from users. By integrating multi-user experience into ongoing skill updates, SkillClaw enables cross-user knowledge transfer and cumulative capability improvement, and experiments on WildClawBench show that limited interaction and feedback, it significantly improves the performance of Qwen3-Max in real-world agent scenarios.