The Evolution of Tool Use in LLM Agents: From Single-Tool Call to Multi-Tool Orchestration
作者: Haoyuan Xu, Chang Li, Xinyan Ma, Xianhao Ou, Zihan Zhang, Tao He, Xiangyu Liu, Zixiang Wang, Jiafeng Liang, Zheng Chu, Runxuan Liu, Rongchuan Mu, Ming Liu, Bing Qin
分类: cs.SE, cs.CL
发布日期: 2026-03-24
💡 一句话要点
综述LLM Agent工具使用演进:从单工具调用到多工具编排
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: LLM Agent 多工具编排 工具使用 长程规划 人工智能 自动化 软件工程 企业工作流程
📋 核心要点
- 早期研究侧重于LLM选择和执行单个工具的能力,但现实应用需要多工具协同完成复杂任务。
- 本文对多工具LLM Agent进行全面综述,从任务形式、核心维度、应用场景和未来方向等方面进行深入分析。
- 研究总结了软件工程、企业工作流程等领域的代表性应用,并指出了多工具Agent在可靠性、可扩展性等方面的挑战。
📝 摘要(中文)
本文全面回顾了多工具LLM Agent的最新进展,并分析了这一快速发展领域的技术现状。研究统一了任务形式,区分了单次工具调用和长程编排。围绕六个核心维度组织文献:推理时规划与执行、训练与轨迹构建、安全与控制、资源约束下的效率、开放环境中的能力完整性以及基准设计与评估。进一步总结了在软件工程、企业工作流程、图形用户界面和移动系统中的代表性应用。最后,讨论了构建可靠、可扩展和可验证的多工具Agent的主要挑战,并概述了未来方向。
🔬 方法详解
问题定义:现有的大语言模型Agent研究主要集中在单个工具的调用上,而实际应用场景往往需要Agent能够灵活地编排多个工具,以完成复杂的任务。现有的方法难以处理长程任务中的状态变化、执行反馈、环境变化以及安全、成本和可验证性等实际约束。
核心思路:本文的核心思路是对多工具LLM Agent进行全面的综述和分析,从任务形式、核心维度、应用场景和未来方向等方面进行深入研究。通过对现有文献的整理和分析,为未来的研究提供指导。
技术框架:本文的框架围绕六个核心维度展开:1) 推理时规划与执行:研究Agent如何在推理过程中进行规划并执行多个工具;2) 训练与轨迹构建:研究如何训练Agent并构建有效的训练轨迹;3) 安全与控制:研究如何保证Agent的安全性和可控性;4) 资源约束下的效率:研究如何在资源有限的情况下提高Agent的效率;5) 开放环境中的能力完整性:研究Agent在开放环境中需要具备哪些能力;6) 基准设计与评估:研究如何设计有效的基准来评估Agent的性能。
关键创新:本文最重要的创新在于对多工具LLM Agent进行了全面的综述和分析,并提出了六个核心维度,为未来的研究提供了新的视角和方向。与现有方法相比,本文更加关注Agent在复杂环境下的多工具编排能力,以及安全、成本和可验证性等实际约束。
关键设计:本文没有提出具体的算法或模型,而是在综述的基础上,对多工具LLM Agent的研究方向进行了梳理和展望。关键设计体现在对六个核心维度的划分,以及对未来研究方向的建议。
🖼️ 关键图片
📊 实验亮点
本文对多工具LLM Agent的最新进展进行了全面回顾,并分析了这一快速发展领域的技术现状。研究总结了在软件工程、企业工作流程、图形用户界面和移动系统中的代表性应用,并指出了构建可靠、可扩展和可验证的多工具Agent的主要挑战,为未来的研究提供了重要的参考。
🎯 应用场景
该研究成果对LLM Agent在软件工程、企业工作流程、图形用户界面和移动系统等领域的应用具有重要意义。通过提升Agent的多工具编排能力,可以实现更智能、更高效的自动化任务处理,例如自动化代码生成、智能客户服务、自动化办公等,从而提高生产效率和降低成本。
📄 摘要(原文)
Tool use enables large language models (LLMs) to access external information, invoke software systems, and act in digital environments beyond what can be solved from model parameters alone. Early research mainly studied whether a model could select and execute a correct single tool call. As agent systems evolve, however, the central problem has shifted from isolated invocation to multi-tool orchestration over long trajectories with intermediate state, execution feedback, changing environments, and practical constraints such as safety, cost, and verifiability. We comprehensively review recent progress in multi-tool LLM agents and analyzes the state of the art in this rapidly developing area. First, we unify task formulations and distinguish single-call tool use from long-horizon orchestration. Then, we organize the literature around six core dimensions: inference-time planning and execution, training and trajectory construction, safety and control, efficiency under resource constraints, capability completeness in open environments, and benchmark design and evaluation. We further summarize representative applications in software engineering, enterprise workflows, graphical user interfaces, and mobile systems. Finally, we discuss major challenges and outline future directions for building reliable, scalable, and verifiable multi-tool agents.