Tool Graph Retriever: Exploring Dependency Graph-based Tool Retrieval for Large Language Models
作者: Linfeng Gao, Yaoxiang Wang, Minlong Peng, Jialong Tang, Yuzhe Shang, Mingming Sun, Jinsong Su
分类: cs.IR, cs.AI
发布日期: 2025-08-07
💡 一句话要点
提出Tool Graph Retriever(TGR),利用工具依赖图提升大语言模型工具检索性能
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大语言模型 工具检索 工具依赖图 图卷积网络 AI Agent 工具调用 知识图谱 信息检索
📋 核心要点
- 现有工具检索方法忽略了工具间的依赖关系,可能导致遗漏任务执行所需的前提工具。
- TGR构建工具依赖图,利用图卷积将工具依赖关系融入工具表示,提升检索性能。
- 实验表明,TGR能提升现有方法的性能,并在常用数据集上达到SOTA,验证了工具依赖的重要性。
📝 摘要(中文)
随着AI agent的快速发展,其配备的工具数量也在迅速增加。然而,将所有工具信息整合到有限的模型上下文中变得不切实际,因此需要高效的工具检索方法。目前主流方法主要依赖工具描述和用户查询之间的语义相似性来检索相关工具。但是,它们通常独立地考虑每个工具,忽略了工具之间的依赖关系,这可能导致遗漏成功执行任务所需的前提工具。为了解决这个问题,本文提出了Tool Graph Retriever(TGR),它利用工具之间的依赖关系来学习更好的工具表示以进行检索。首先,我们构建了一个名为TDI300K的数据集,用于训练识别工具依赖关系的判别器。然后,我们将所有候选工具表示为工具依赖图,并使用图卷积将依赖关系集成到它们的表示中。最后,这些更新后的工具表示用于在线检索。在几个常用数据集上的实验结果表明,我们的TGR可以为现有的主流方法带来性能提升,实现SOTA性能。此外,深入分析也验证了工具依赖关系的重要性以及我们的TGR的有效性。
🔬 方法详解
问题定义:论文旨在解决大语言模型在工具数量快速增长的情况下,如何高效准确地检索所需工具的问题。现有方法主要基于语义相似度,忽略了工具之间的依赖关系,导致可能遗漏执行任务所必需的先决工具,影响任务完成的成功率。
核心思路:论文的核心思路是构建工具依赖图,利用图神经网络学习包含工具依赖信息的工具表示,从而在检索时不仅考虑工具与查询的语义相关性,还考虑工具之间的依赖关系。这样可以更准确地检索到完成任务所需的完整工具链。
技术框架:TGR的整体框架包括以下几个主要阶段:1) 工具依赖关系判别器训练:构建TDI300K数据集,训练一个判别器来识别工具之间的依赖关系。2) 工具依赖图构建:将所有候选工具表示为一个图,节点代表工具,边代表工具之间的依赖关系,边的权重由依赖关系判别器给出。3) 图卷积网络学习:使用图卷积网络(GCN)在工具依赖图上进行学习,将工具的依赖关系信息融入到工具的表示中。4) 在线检索:使用学习到的工具表示进行在线检索,根据查询和工具表示的相似度以及工具依赖关系,选择最相关的工具。
关键创新:最重要的创新点在于显式地建模了工具之间的依赖关系,并将其融入到工具的表示学习中。与现有方法只关注工具与查询之间的语义相似度不同,TGR考虑了工具之间的协作关系,从而可以更准确地检索到完成任务所需的工具集合。
关键设计:TDI300K数据集用于训练工具依赖关系判别器,该判别器用于确定工具之间是否存在依赖关系以及依赖关系的强度。图卷积网络(GCN)用于在工具依赖图上进行信息传播,将邻居节点的依赖关系信息聚合到中心节点,从而更新工具的表示。损失函数的设计需要考虑工具与查询的相似度以及工具依赖关系的准确性。具体的GCN层数、卷积核大小等超参数需要根据实验进行调整。
🖼️ 关键图片
📊 实验亮点
实验结果表明,TGR能够显著提升现有工具检索方法的性能,在多个常用数据集上取得了SOTA结果。具体而言,TGR能够更准确地检索到完成任务所需的工具集合,从而提高AI agent的任务完成率。深入分析验证了工具依赖关系的重要性,以及TGR在建模工具依赖关系方面的有效性。
🎯 应用场景
该研究成果可广泛应用于各种需要AI agent进行工具调用的场景,例如智能助手、自动化流程、机器人控制等。通过更准确地检索到所需的工具,可以提高AI agent完成任务的效率和成功率,降低人工干预的需求,具有重要的实际应用价值和广阔的未来发展前景。
📄 摘要(原文)
With the remarkable advancement of AI agents, the number of their equipped tools is increasing rapidly. However, integrating all tool information into the limited model context becomes impractical, highlighting the need for efficient tool retrieval methods. In this regard, dominant methods primarily rely on semantic similarities between tool descriptions and user queries to retrieve relevant tools. However, they often consider each tool independently, overlooking dependencies between tools, which may lead to the omission of prerequisite tools for successful task execution. To deal with this defect, in this paper, we propose Tool Graph Retriever (TGR), which exploits the dependencies among tools to learn better tool representations for retrieval. First, we construct a dataset termed TDI300K to train a discriminator for identifying tool dependencies. Then, we represent all candidate tools as a tool dependency graph and use graph convolution to integrate the dependencies into their representations. Finally, these updated tool representations are employed for online retrieval. Experimental results on several commonly used datasets show that our TGR can bring a performance improvement to existing dominant methods, achieving SOTA performance. Moreover, in-depth analyses also verify the importance of tool dependencies and the effectiveness of our TGR.