GraphTeam: Facilitating Large Language Model-based Graph Analysis via Multi-Agent Collaboration

📄 arXiv: 2410.18032v5 📥 PDF

作者: Xin Li, Qizhi Chu, Yubin Chen, Yang Liu, Yaoqi Liu, Zekai Yu, Weize Chen, Chen Qian, Chuan Shi, Cheng Yang

分类: cs.AI, cs.CL, cs.MA

发布日期: 2024-10-23 (更新: 2025-11-03)

🔗 代码/项目: GITHUB


💡 一句话要点

GraphTeam:通过多智能体协作促进基于大语言模型的图分析

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 图分析 大语言模型 多智能体系统 知识检索 智能体协作

📋 核心要点

  1. 现有基于LLM的图分析方法存在局限性,如依赖GNN导致可迁移性差,或仅依赖LLM内部推理能力导致性能不佳。
  2. GraphTeam利用多智能体系统,模拟人类协作解决问题的策略,通过智能体间的协同工作提升图分析能力。
  3. 实验结果表明,GraphTeam在多个图分析基准测试中取得了显著的性能提升,平均准确率提升达25.85%。

📝 摘要(中文)

图被广泛用于建模现实场景中的关系数据,例如社交网络和城市计算。现有的基于大语言模型(LLM)的图分析方法要么集成图神经网络(GNN)用于特定的机器学习任务,限制了其可迁移性,要么仅仅依赖于LLM的内部推理能力,导致次优的性能。为了解决这些限制,我们利用了基于LLM的智能体的最新进展,这些智能体已经展示了利用外部知识或工具解决问题的能力。通过模拟人类的问题解决策略,例如类比和协作,我们提出了一个基于LLM的多智能体系统GraphTeam,用于图分析。GraphTeam由来自三个模块的五个基于LLM的智能体组成,具有不同专业知识的智能体可以相互协作以解决复杂问题。具体来说,(1)输入-输出归一化模块:问题智能体从原始问题中提取和提炼四个关键参数,促进问题理解,答案智能体组织结果以满足输出要求;(2)外部知识检索模块:我们首先构建一个包含相关文档和经验信息的知识库,然后搜索智能体为每个问题检索最相关的条目。(3)问题解决模块:给定来自搜索智能体的信息,编码智能体通过编程使用已建立的算法来生成解决方案,如果编码智能体不起作用,推理智能体将直接计算结果而无需编程。在六个图分析基准上的大量实验表明,GraphTeam在准确率方面实现了最先进的性能,与最佳基线相比平均提高了25.85%。代码和数据可在https://github.com/BUPT-GAMMA/GraphTeam获取。

🔬 方法详解

问题定义:论文旨在解决现有基于大语言模型的图分析方法的局限性。现有方法要么依赖于图神经网络(GNN),限制了其在不同图分析任务中的泛化能力;要么过度依赖大语言模型自身的推理能力,导致在复杂图分析任务中表现不佳。因此,需要一种更灵活、更强大的方法来充分利用大语言模型在图分析中的潜力。

核心思路:论文的核心思路是借鉴人类解决问题的协作模式,构建一个基于大语言模型的多智能体系统。通过将复杂的图分析任务分解为多个子任务,并分配给具有不同专业知识的智能体,实现智能体之间的协同工作,从而提高整体的图分析性能。这种方法能够更好地利用外部知识和工具,克服了现有方法的局限性。

技术框架:GraphTeam包含三个主要模块,共五个智能体: 1. 输入-输出归一化模块:包含问题智能体和答案智能体。问题智能体负责从原始问题中提取关键参数,进行问题理解;答案智能体负责组织结果,满足输出要求。 2. 外部知识检索模块:包含搜索智能体。该智能体负责从预先构建的知识库中检索与问题相关的文档和经验信息。 3. 问题解决模块:包含编码智能体和推理智能体。编码智能体尝试通过编程实现已有的图算法来解决问题;如果编码智能体失败,推理智能体则直接利用大语言模型的推理能力进行计算。

关键创新:GraphTeam的关键创新在于其多智能体协作的架构设计。不同于以往单一依赖GNN或LLM的方法,GraphTeam通过模拟人类团队协作,将问题分解并分配给不同的智能体,充分利用了每个智能体的优势。这种架构使得系统能够更灵活地处理复杂的图分析任务,并能够有效地利用外部知识和工具。

关键设计: 1. 知识库构建:构建包含相关文档和经验信息的知识库,为搜索智能体提供外部知识来源。 2. 智能体角色定义:明确定义每个智能体的角色和职责,确保智能体之间的有效协作。 3. 问题分解策略:设计合理的问题分解策略,将复杂的图分析任务分解为多个可管理的子任务。 4. 智能体通信机制:建立智能体之间的通信机制,实现信息共享和协同工作。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,GraphTeam在六个图分析基准测试中均取得了显著的性能提升。与最佳基线相比,GraphTeam在准确率方面平均提高了25.85%。这些结果验证了GraphTeam多智能体协作架构的有效性,证明了其在复杂图分析任务中的优越性。此外,实验还分析了不同智能体在解决问题中的作用,进一步验证了各个模块设计的合理性。

🎯 应用场景

GraphTeam具有广泛的应用前景,可应用于社交网络分析、城市计算、生物信息学、金融风险管理等领域。例如,在社交网络分析中,可以利用GraphTeam进行用户关系挖掘、社区发现和影响力分析;在城市计算中,可以用于交通流量预测、城市规划和公共安全管理。该研究的实际价值在于提升图分析的准确性和效率,为相关领域的决策提供更可靠的依据。未来,GraphTeam可以进一步扩展到其他类型的图数据和分析任务中。

📄 摘要(原文)

Graphs are widely used for modeling relational data in real-world scenarios, such as social networks and urban computing. Existing LLM-based graph analysis approaches either integrate graph neural networks (GNNs) for specific machine learning tasks, limiting their transferability, or rely solely on LLMs' internal reasoning ability, resulting in suboptimal performance. To address these limitations, we take advantage of recent advances in LLM-based agents, which have shown capabilities of utilizing external knowledge or tools for problem solving. By simulating human problem-solving strategies such as analogy and collaboration, we propose a multi-agent system based on LLMs named GraphTeam, for graph analysis. GraphTeam consists of five LLM-based agents from three modules, and the agents with different specialities can collaborate with each other to address complex problems. Specifically, (1) input-output normalization module: the question agent extracts and refines four key arguments from the original question, facilitating the problem understanding, and the answer agent organizes the results to meet the output requirement; (2) external knowledge retrieval module: we first build a knowledge base consisting of relevant documentation and experience information, and then the search agent retrieves the most relevant entries for each question. (3) problem-solving module: given the retrieved information from search agent, the coding agent uses established algorithms via programming to generate solutions, and in case the coding agent does not work, the reasoning agent will directly compute the results without programming. Extensive experiments on six graph analysis benchmarks demonstrate that GraphTeam achieves state-of-the-art performance with an average 25.85% improvement over the best baseline in terms of accuracy. The code and data are available at https://github.com/BUPT-GAMMA/GraphTeam.