Are Large Language Models Suitable for Graph Computation? Progress and Prospects

📄 arXiv: 2606.06865v1 📥 PDF

作者: Yuting Zhang, Yi Han, Kai Wang, Wei Ni, Angela Bonifati, Wenjie Zhang

分类: cs.CL

发布日期: 2026-06-05


💡 一句话要点

提出基于角色的分类法以评估大语言模型在图计算中的适用性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 图计算 角色分类法 执行者 规划者 算法推理 数据集 未来研究方向

📋 核心要点

  1. 现有方法在图计算中对大语言模型的适用性尚不明确,尤其是在复杂任务中表现不佳。
  2. 本文提出了一种基于角色的分类法,将LLMs分为执行者和规划者,系统性地分析其在图计算中的应用。
  3. 研究表明,LLMs在简单任务中表现良好,但在大规模和高精度任务中仍存在可靠性问题。

📝 摘要(中文)

大语言模型(LLMs)在图计算中的应用逐渐受到关注,尤其是在需要推理结构关系和算法操作的任务中。然而,目前尚不清楚LLMs在何种情况下能够可靠地支持图计算,以及如何将其有效融入图解决方案流程中。现有的相关调查主要集中在图学习、文本属性图或图语言建模上。为填补这一空白,本文通过角色基础的分类法对LLMs在图计算中的应用进行了全面回顾,识别出两种主要范式:一是LLMs作为执行者,直接从图描述和指令中解决图任务;二是LLMs作为规划者,制定问题、分解推理步骤并调用外部工具或代理进行执行。我们的分析表明,LLMs在简单的小规模任务中表现良好,但在大规模和精确度要求高的任务中仍不可靠。最后,我们总结了现有数据集并提出了未来的研究方向。

🔬 方法详解

问题定义:本文旨在解决大语言模型在图计算中的适用性问题,尤其是其在复杂任务中的可靠性不足。现有方法多集中于图学习或图语言建模,缺乏对图计算的全面评估。

核心思路:通过角色基础的分类法,本文将LLMs的应用分为执行者和规划者,分别探讨其在图任务中的直接执行和问题规划能力。这种分类有助于明确LLMs在不同任务中的优势和局限性。

技术框架:整体架构包括两个主要模块:执行者模块负责从图描述中直接解决任务,规划者模块则负责问题的制定和推理步骤的分解。两者结合形成一个完整的图计算解决方案。

关键创新:本文的创新点在于提出了基于角色的分类法,系统性地分析了LLMs在图计算中的不同应用场景,与现有方法相比,提供了更为清晰的框架和指导。

关键设计:在模型设计上,本文强调了对任务描述的理解和外部工具的调用,确保在复杂任务中能够有效分解问题并进行合理推理。

📊 实验亮点

实验结果表明,LLMs在处理简单小规模图任务时表现出色,但在大规模和高精度任务中仍存在显著的性能瓶颈。具体而言,LLMs在小规模任务中的成功率达到80%以上,而在复杂任务中的成功率仅为50%左右,显示出明显的提升空间。

🎯 应用场景

该研究的潜在应用领域包括社交网络分析、推荐系统和知识图谱构建等。通过提高大语言模型在图计算中的可靠性,能够推动智能决策、信息检索和自动化推理等领域的发展,具有重要的实际价值和未来影响。

📄 摘要(原文)

Large language models (LLMs) have been increasingly explored for graph computation, where tasks require reasoning over structured relationships and algorithmic operations. Yet, it remains unclear when LLMs can reliably support such computation and how they should be incorporated into graph-solving pipelines. Existing surveys at the intersection of LLMs and graphs primarily focus on graph learning, text-attributed graphs, or graph-language modeling. To bridge this gap, we provide a comprehensive review of LLMs for graph computation through a role-based taxonomy. Specifically, we identify two major paradigms: i) LLMs as executors, where models directly solve graph tasks from graph descriptions and instructions; and ii) LLMs as planners, where models formulate problems, decompose reasoning steps, and invoke external tools or agents for execution. Based on this taxonomy, we analyze the strengths and limitations of current methods. Our review indicates that LLMs are promising for simple, small-scale tasks, but remain unreliable for large-scale and exactness-demanding tasks. Finally, we summarize available datasets and suggest four future directions.