WebClipper: Efficient Evolution of Web Agents with Graph-based Trajectory Pruning

📄 arXiv: 2602.12852v1 📥 PDF

作者: Junjie Wang, Zequn Xie, Dan Yang, Jie Feng, Yue Shen, Duolin Sun, Meixiu Long, Yihan Jiao, Zhehao Tan, Jian Wang, Peng Wei, Jinjie Gu

分类: cs.AI

发布日期: 2026-02-13

备注: Work in Progress


💡 一句话要点

WebClipper:基于图剪枝的高效Web Agent进化框架

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: Web Agent 轨迹剪枝 图优化 有向无环图 信息搜索

📋 核心要点

  1. 现有Web Agent存在搜索效率低下的问题,表现为冗长的工具调用轨迹和循环推理。
  2. WebClipper将Agent搜索过程建模为状态图,通过DAG挖掘进行轨迹剪枝,去除冗余步骤。
  3. 实验表明,WebClipper能显著减少工具调用轮次,同时提升准确率,并引入F-AE Score评估效率。

📝 摘要(中文)

基于Web Agent的深度研究系统在解决复杂信息搜索任务方面展现出巨大潜力,但其搜索效率仍有待探索。我们观察到,许多最先进的开源Web Agent依赖于冗长的工具调用轨迹,其中包含循环推理和对非生产性分支的探索。为了解决这个问题,我们提出了WebClipper,一个通过基于图的剪枝来压缩Web Agent轨迹的框架。具体来说,我们将Agent的搜索过程建模为一个状态图,并将轨迹优化问题转化为最小必要有向无环图(DAG)挖掘问题,从而产生精简的轨迹,在保留必要推理的同时消除冗余步骤。在这些精简轨迹上持续训练,使Agent能够进化出更高效的搜索模式,并在提高准确率的同时,将工具调用轮次减少约20%。此外,我们引入了一种名为F-AE Score的新指标,用于衡量模型在平衡准确率和效率方面的整体性能。实验表明,WebClipper在保证出色性能的前提下压缩了工具调用轮次,为Web Agent设计中平衡有效性和效率提供了实践性的见解。

🔬 方法详解

问题定义:现有Web Agent在复杂信息搜索任务中,常常产生冗长的工具调用轨迹,包含大量的循环推理和对无用分支的探索,导致搜索效率低下。这不仅浪费计算资源,也影响了Agent的实用性。因此,如何提升Web Agent的搜索效率,在保证准确性的前提下减少不必要的步骤,是一个亟待解决的问题。

核心思路:WebClipper的核心思路是将Web Agent的搜索过程建模成一个状态图,其中节点代表Agent所处的状态,边代表Agent采取的动作(工具调用)。然后,通过图剪枝算法,从原始的搜索轨迹图中提取出一个最小必要的有向无环图(DAG),该DAG保留了Agent进行有效推理的关键步骤,同时去除了冗余的循环和无效分支。通过在精简后的轨迹上进行训练,Agent可以学习到更高效的搜索策略。

技术框架:WebClipper框架主要包含以下几个阶段:1) 轨迹收集:收集Web Agent在执行任务时的原始工具调用轨迹。2) 状态图构建:将轨迹转换为状态图,节点表示Agent的状态,边表示工具调用。3) DAG剪枝:使用图剪枝算法,从状态图中提取最小必要的DAG。4) 重训练:使用剪枝后的DAG轨迹对Agent进行重训练,使其学习更高效的搜索策略。5) 评估:使用F-AE Score等指标评估Agent的性能,包括准确率和效率。

关键创新:WebClipper的关键创新在于将轨迹优化问题转化为图剪枝问题,并提出了一种基于DAG挖掘的轨迹压缩方法。与传统的轨迹优化方法相比,WebClipper能够更有效地去除冗余步骤,并保留关键的推理路径。此外,F-AE Score的引入,为评估Web Agent的整体性能提供了一个综合性的指标,能够同时考虑准确率和效率。

关键设计:在DAG剪枝阶段,论文采用了一种基于最小成本流的算法,旨在找到一个能够覆盖所有必要状态转移的最小DAG。具体来说,该算法将状态图中的边赋予不同的权重,权重的大小取决于该边在原始轨迹中出现的频率以及该边所连接的两个状态之间的相似度。然后,通过求解最小成本流问题,找到一个能够以最小成本覆盖所有必要状态转移的DAG。此外,论文还设计了一种新的损失函数,用于在重训练阶段指导Agent学习更高效的搜索策略。该损失函数不仅考虑了Agent的准确率,还考虑了Agent的工具调用次数。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,WebClipper能够在保证甚至提高准确率的前提下,将Web Agent的工具调用轮次减少约20%。此外,WebClipper在多个benchmark数据集上都取得了显著的性能提升,证明了其有效性和泛化能力。F-AE Score的引入,为评估Web Agent的整体性能提供了一个综合性的指标。

🎯 应用场景

WebClipper可应用于各种需要Web Agent进行信息搜索和任务完成的场景,例如智能客服、自动化报告生成、金融分析等。通过提高Web Agent的搜索效率,可以降低计算成本,提升用户体验,并促进Web Agent在实际应用中的普及。未来,该技术有望与其他Agent技术结合,实现更复杂、更智能的任务自动化。

📄 摘要(原文)

Deep Research systems based on web agents have shown strong potential in solving complex information-seeking tasks, yet their search efficiency remains underexplored. We observe that many state-of-the-art open-source web agents rely on long tool-call trajectories with cyclic reasoning loops and exploration of unproductive branches. To address this, we propose WebClipper, a framework that compresses web agent trajectories via graph-based pruning. Concretely, we model the agent's search process as a state graph and cast trajectory optimization as a minimum-necessary Directed Acyclic Graph (DAG) mining problem, yielding pruned trajectories that preserve essential reasoning while eliminating redundant steps. Continued training on these refined trajectories enables the agent to evolve toward more efficient search patterns and reduces tool-call rounds by about 20% while improving accuracy. Furthermore, we introduce a new metric called F-AE Score to measure the model's overall performance in balancing accuracy and efficiency. Experiments demonstrate that WebClipper compresses tool-call rounds under excellent performance, providing practical insight into balancing effectiveness and efficiency in web agent design.