HTAA: Enhancing LLM Planning via Hybrid Toolset Agentization & Adaptation

作者: Chengrui Huang, Junshuo Zhang, Zhiyuan Ma, Xikun Wang, Ximeng Wang, Menghua Jiang, Gang Zeng, Zhaobing Han, Shen Gao, Shuo Shang

分类: cs.CL

发布日期: 2026-04-13

备注: 22 pages, 3 figures

💡 一句话要点

HTAA：通过混合工具集代理化与自适应增强LLM规划能力

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 工具调用 分层规划 代理化 自适应学习

📋 核心要点

现有扁平工具调用架构效率低下且容易累积误差，难以支持LLM可靠使用大量工具。
HTAA通过将常用工具封装为专用代理工具，并采用非对称规划器自适应方法，实现高效的工具使用规划。
实验表明，HTAA在任务成功率、工具调用轨迹长度和上下文开销方面均优于现有方法，并已成功部署。

📝 摘要（中文）

为了使大型语言模型能够扩展并可靠地使用数百种工具，本文提出了混合工具集代理化与自适应（HTAA）框架，这是一种用于可扩展工具使用规划的分层框架。该框架采用工具集代理化范式，将频繁共同使用的工具封装到专门的代理工具中，从而减少规划器的动作空间并减轻冗余。为了确保有效的协调，设计了非对称规划器自适应，这是一种基于轨迹的训练范式，通过后向重构和前向细化使高层规划器与代理工具对齐。在真实世界的内部数据集InfoVerify以及广泛使用的基准测试中进行的实验表明，HTAA始终如一地实现了更高的任务成功率，需要更短的工具调用轨迹，并显著减少了上下文开销。在生产部署中，HTAA大幅减少了人工验证工作和运营成本，证明了其在实际应用中的有效性。

🔬 方法详解

问题定义：现有的大型语言模型在处理需要调用大量工具的复杂任务时，面临着效率和可靠性的挑战。扁平化的工具调用架构导致动作空间庞大，规划过程冗余，容易出错，并且上下文开销巨大。因此，如何有效地组织和利用大量工具，成为提升LLM在实际应用中能力的关键问题。

核心思路：HTAA的核心思路是将频繁共同使用的工具封装成专门的代理工具（Toolset Agents），从而在高层规划器看来，动作空间大大缩小，降低了规划的复杂性。同时，通过非对称规划器自适应（Asymmetric Planner Adaptation）方法，使高层规划器能够更好地理解和利用这些代理工具，从而实现更有效的工具使用规划。

技术框架：HTAA框架包含两个主要层次：高层规划器和工具集代理。高层规划器负责制定整体的任务执行计划，并决定调用哪个工具集代理。每个工具集代理则负责执行具体的子任务，并调用其内部的工具。框架的训练过程采用非对称规划器自适应方法，包括后向重构（Backward Reconstruction）和前向细化（Forward Refinement）两个阶段。后向重构旨在使高层规划器能够理解工具集代理的行为，而前向细化则旨在优化高层规划器的规划能力。

关键创新：HTAA的关键创新在于混合工具集代理化（Hybrid Toolset Agentization）和非对称规划器自适应（Asymmetric Planner Adaptation）。工具集代理化通过封装常用工具，降低了规划器的动作空间，减少了冗余。非对称规划器自适应则通过后向重构和前向细化，使高层规划器能够更好地与工具集代理协同工作。与现有方法相比，HTAA能够更有效地利用大量工具，实现更高的任务成功率和更低的上下文开销。

关键设计：在工具集代理化方面，需要仔细选择哪些工具应该被封装在一起，以最大程度地提高效率。在非对称规划器自适应方面，后向重构和前向细化的具体实现方式，例如损失函数的设计和训练数据的选择，都会影响最终的性能。论文中可能包含关于这些方面的具体技术细节，但摘要中未明确提及。

🖼️ 关键图片

📊 实验亮点

实验结果表明，HTAA在InfoVerify数据集和常用基准测试中均取得了显著的性能提升。与强基线相比，HTAA实现了更高的任务成功率，需要更短的工具调用轨迹，并显著减少了上下文开销。此外，在生产部署中，HTAA大幅减少了人工验证工作和运营成本，验证了其在实际应用中的有效性。具体的性能提升幅度未知，需要在论文正文中查找。

🎯 应用场景

HTAA框架可应用于各种需要LLM调用大量工具的场景，例如智能客服、自动化报告生成、复杂问题求解等。通过降低工具使用的复杂性和提高任务成功率，HTAA能够显著提升LLM在实际应用中的价值，并降低人工干预的需求。该研究对于推动LLM在各行业的广泛应用具有重要意义。

📄 摘要（原文）

Enabling large language models to scale and reliably use hundreds of tools is critical for real-world applications, yet challenging due to the inefficiency and error accumulation inherent in flat tool-calling architectures. To address this, we propose Hybrid Toolset Agentization & Adaptation (HTAA), a hierarchical framework for scalable tool-use planning. We propose a novel toolset agentization paradigm, which encapsulates frequently co-used tools into specialized agent tools, thereby reducing the planner's action space and mitigating redundancy. To ensure effective coordination, we design Asymmetric Planner Adaptation, a trajectory-based training paradigm that aligns the high-level planner with agent tools via backward reconstruction and forward refinement. To validate the performance of HTAA, we conduct experiments on a real-world internal dataset, InfoVerify, based on the POI validation workflow of China's largest online large-scale ride-hailing platform, featuring long-horizon executable tool trajectories. Experiments on InfoVerify and widely-used benchmarks show that HTAA consistently achieves higher task success rates, requires short tool calling trajectories, and significantly reduces context overhead compared to strong baselines. Furthermore, in a production deployment, HTAA substantially reduces manual validation effort and operational cost, demonstrating its practical efficacy.

HTAA: Enhancing LLM Planning via Hybrid Toolset Agentization & Adaptation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理