HTAA: Enhancing LLM Planning via Hybrid Toolset Agentization & Adaptation

📄 arXiv: 2604.10917v1 📥 PDF

作者: Chengrui Huang, Junshuo Zhang, Zhiyuan Ma, Xikun Wang, Ximeng Wang, Menghua Jiang, Gang Zeng, Zhaobing Han, Shen Gao, Shuo Shang

分类: cs.CL

发布日期: 2026-04-13

备注: 22 pages, 3 figures


💡 一句话要点

HTAA:通过混合工具集代理化与自适应增强LLM规划能力

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 工具调用 分层规划 代理化 自适应学习

📋 核心要点

  1. 现有扁平工具调用架构效率低下且容易累积误差,难以支持LLM可靠使用大量工具。
  2. HTAA通过将常用工具封装为专用代理工具,并采用非对称规划器自适应方法,实现高效的工具使用规划。
  3. 实验表明,HTAA在任务成功率、工具调用轨迹长度和上下文开销方面均优于现有方法,并已成功部署。

📝 摘要(中文)

为了使大型语言模型能够扩展并可靠地使用数百种工具,本文提出了混合工具集代理化与自适应(HTAA)框架,这是一种用于可扩展工具使用规划的分层框架。该框架采用工具集代理化范式,将频繁共同使用的工具封装到专门的代理工具中,从而减少规划器的动作空间并减轻冗余。为了确保有效的协调,设计了非对称规划器自适应,这是一种基于轨迹的训练范式,通过后向重构和前向细化使高层规划器与代理工具对齐。在真实世界的内部数据集InfoVerify以及广泛使用的基准测试中进行的实验表明,HTAA始终如一地实现了更高的任务成功率,需要更短的工具调用轨迹,并显著减少了上下文开销。在生产部署中,HTAA大幅减少了人工验证工作和运营成本,证明了其在实际应用中的有效性。

🔬 方法详解

问题定义:现有的大型语言模型在处理需要调用大量工具的复杂任务时,面临着效率和可靠性的挑战。扁平化的工具调用架构导致动作空间庞大,规划过程冗余,容易出错,并且上下文开销巨大。因此,如何有效地组织和利用大量工具,成为提升LLM在实际应用中能力的关键问题。

核心思路:HTAA的核心思路是将频繁共同使用的工具封装成专门的代理工具(Toolset Agents),从而在高层规划器看来,动作空间大大缩小,降低了规划的复杂性。同时,通过非对称规划器自适应(Asymmetric Planner Adaptation)方法,使高层规划器能够更好地理解和利用这些代理工具,从而实现更有效的工具使用规划。

技术框架:HTAA框架包含两个主要层次:高层规划器和工具集代理。高层规划器负责制定整体的任务执行计划,并决定调用哪个工具集代理。每个工具集代理则负责执行具体的子任务,并调用其内部的工具。框架的训练过程采用非对称规划器自适应方法,包括后向重构(Backward Reconstruction)和前向细化(Forward Refinement)两个阶段。后向重构旨在使高层规划器能够理解工具集代理的行为,而前向细化则旨在优化高层规划器的规划能力。

关键创新:HTAA的关键创新在于混合工具集代理化(Hybrid Toolset Agentization)和非对称规划器自适应(Asymmetric Planner Adaptation)。工具集代理化通过封装常用工具,降低了规划器的动作空间,减少了冗余。非对称规划器自适应则通过后向重构和前向细化,使高层规划器能够更好地与工具集代理协同工作。与现有方法相比,HTAA能够更有效地利用大量工具,实现更高的任务成功率和更低的上下文开销。

关键设计:在工具集代理化方面,需要仔细选择哪些工具应该被封装在一起,以最大程度地提高效率。在非对称规划器自适应方面,后向重构和前向细化的具体实现方式,例如损失函数的设计和训练数据的选择,都会影响最终的性能。论文中可能包含关于这些方面的具体技术细节,但摘要中未明确提及。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,HTAA在InfoVerify数据集和常用基准测试中均取得了显著的性能提升。与强基线相比,HTAA实现了更高的任务成功率,需要更短的工具调用轨迹,并显著减少了上下文开销。此外,在生产部署中,HTAA大幅减少了人工验证工作和运营成本,验证了其在实际应用中的有效性。具体的性能提升幅度未知,需要在论文正文中查找。

🎯 应用场景

HTAA框架可应用于各种需要LLM调用大量工具的场景,例如智能客服、自动化报告生成、复杂问题求解等。通过降低工具使用的复杂性和提高任务成功率,HTAA能够显著提升LLM在实际应用中的价值,并降低人工干预的需求。该研究对于推动LLM在各行业的广泛应用具有重要意义。

📄 摘要(原文)

Enabling large language models to scale and reliably use hundreds of tools is critical for real-world applications, yet challenging due to the inefficiency and error accumulation inherent in flat tool-calling architectures. To address this, we propose Hybrid Toolset Agentization & Adaptation (HTAA), a hierarchical framework for scalable tool-use planning. We propose a novel toolset agentization paradigm, which encapsulates frequently co-used tools into specialized agent tools, thereby reducing the planner's action space and mitigating redundancy. To ensure effective coordination, we design Asymmetric Planner Adaptation, a trajectory-based training paradigm that aligns the high-level planner with agent tools via backward reconstruction and forward refinement. To validate the performance of HTAA, we conduct experiments on a real-world internal dataset, InfoVerify, based on the POI validation workflow of China's largest online large-scale ride-hailing platform, featuring long-horizon executable tool trajectories. Experiments on InfoVerify and widely-used benchmarks show that HTAA consistently achieves higher task success rates, requires short tool calling trajectories, and significantly reduces context overhead compared to strong baselines. Furthermore, in a production deployment, HTAA substantially reduces manual validation effort and operational cost, demonstrating its practical efficacy.