Integrating Graphs, Large Language Models, and Agents: Reasoning and Retrieval

📄 arXiv: 2604.15951v1 📥 PDF

作者: Hamed Jelodar, Samita Bai, Mohammad Meymani, Parisa Hamedi, Roozbeh Razavi-Far, Ali Ghorbani

分类: cs.AI

发布日期: 2026-04-17


💡 一句话要点

综述图与大语言模型及Agent的集成方法,提升推理与检索能力。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 图神经网络 大型语言模型 知识图谱 推理 检索 Agent 综述 图学习

📋 核心要点

  1. 现有图与大语言模型集成方法在应用场景选择上缺乏明确指导,导致效果不佳。
  2. 论文对现有图-LLM集成方法进行分类,并分析其在不同任务和图模态下的适用性。
  3. 通过案例分析,论文总结了各种集成策略的优缺点,为研究人员提供实用参考。

📝 摘要(中文)

生成式人工智能,特别是大型语言模型(LLM),越来越多地集成基于图的表示,以增强推理、检索和结构化决策能力。尽管进展迅速,但关于何时、为何、何地以及何种类型的图-LLM集成最适合各种应用,仍然缺乏清晰的认识。本综述提供了一个简洁、结构化的概述,介绍了图与LLM集成背后的设计选择。我们根据其目的(推理、检索、生成、推荐)、图模态(知识图谱、场景图、交互图、因果图、依赖图)和集成策略(提示、增强、训练或基于Agent的使用)对现有方法进行分类。通过映射网络安全、医疗保健、材料科学、金融、机器人和多模态环境等领域的代表性工作,我们强调了每种技术的优势、局限性和最佳适用场景。本综述旨在为研究人员提供一个实用指南,以便根据任务要求、数据特征和推理复杂性选择最合适的图-LLM方法。

🔬 方法详解

问题定义:现有方法在集成图和大型语言模型时,缺乏对不同任务和数据特征的针对性指导。这导致研究人员难以选择合适的集成策略,从而影响了推理、检索等任务的性能。现有方法在不同领域的适用性分析不足,限制了其应用范围。

核心思路:论文的核心思路是对现有的图-LLM集成方法进行系统性的分类和分析,从目的、图模态和集成策略三个维度进行划分。通过分析不同方法的优缺点和适用场景,为研究人员提供选择合适集成策略的指导。

技术框架:论文采用综述的形式,对现有文献进行整理和归纳。首先,根据集成目的(推理、检索、生成、推荐)对方法进行分类;其次,根据图的模态(知识图谱、场景图等)进行分类;最后,根据集成策略(提示、增强、训练、Agent)进行分类。然后,论文分析了不同类别的方法在不同领域的应用情况。

关键创新:论文的主要创新在于其系统性的分类框架,该框架能够帮助研究人员更好地理解各种图-LLM集成方法的特点和适用场景。此外,论文还对不同集成策略的优缺点进行了深入分析,为研究人员提供了选择合适策略的依据。

关键设计:论文的关键设计在于其分类维度和分析方法。选择目的、图模态和集成策略作为分类维度,能够全面地反映不同方法的特点。通过案例分析和对比,论文深入分析了不同方法的优缺点和适用场景。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该论文是一篇综述性文章,没有具体的实验结果。其亮点在于对现有图-LLM集成方法进行了系统的分类和分析,并总结了各种集成策略的优缺点。通过对不同领域案例的分析,为研究人员提供了选择合适集成策略的指导。

🎯 应用场景

该研究成果可应用于多个领域,包括网络安全(分析网络拓扑结构)、医疗保健(构建疾病知识图谱)、材料科学(发现新材料)、金融(风险评估)、机器人(场景理解)和多模态环境(跨模态推理)。该综述为相关领域的研究人员提供了有价值的参考,有助于推动图与大语言模型集成技术的进一步发展。

📄 摘要(原文)

Generative AI, particularly Large Language Models, increasingly integrates graph-based representations to enhance reasoning, retrieval, and structured decision-making. Despite rapid advances, there remains limited clarity regarding when, why, where, and what types of graph-LLM integrations are most appropriate across applications. This survey provides a concise, structured overview of the design choices underlying the integration of graphs with LLMs. We categorize existing methods based on their purpose (reasoning, retrieval, generation, recommendation), graph modality (knowledge graphs, scene graphs, interaction graphs, causal graphs, dependency graphs), and integration strategies (prompting, augmentation, training, or agent-based use). By mapping representative works across domains such as cybersecurity, healthcare, materials science, finance, robotics, and multimodal environments, we highlight the strengths, limitations, and best-fit scenarios for each technique. This survey aims to offer researchers a practical guide for selecting the most suitable graph-LLM approach depending on task requirements, data characteristics, and reasoning complexity.