GraphFlow: A Graph-Based Workflow Management for Efficient LLM-Agent Serving

作者: Ao Li, Shangpeng Yang, Fahao Chen, Tianheng Xu, Peng Li, Zhou Su

分类: cs.LG

发布日期: 2026-05-21

备注: Accepted to ICML 2026

💡 一句话要点

GraphFlow：基于图的工作流管理，提升LLM-Agent服务效率

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: LLM-Agent 工作流管理 图神经网络 知识图谱 智能体 Agent服务 动态工作流

📋 核心要点

现有工作流辅助的Agent服务系统依赖预定义模板和浅层匹配，限制了其语义理解和泛化能力。
GraphFlow通过统一的图结构wGraph表示工作流，并动态实例化任务特定的工作流，提升灵活性。
实验表明，GraphFlow在性能上优于现有方法，并显著降低了内存占用，提升了效率。

📝 摘要（中文）

本文提出了一种新的工作流管理范式，旨在解决现有基于LLM的Agent服务系统中，工作流依赖于预定义模板和浅层匹配机制，导致无法捕捉深层语义关系和泛化到未见任务的问题。该范式使用统一的图结构（wGraph）表示工作流，其中每个节点对应一个原子操作。wGraph作为共享基础，从中动态实例化特定于任务的工作流。基于wGraph，本文提出了GraphFlow系统，通过自适应工作流生成和工作流状态管理，高效地将工作流集成到Agent服务中。实验结果表明，GraphFlow在五个基准数据集上始终优于现有方法，平均性能提升约4.95个百分点，同时内存占用减少约4倍。

🔬 方法详解

问题定义：现有基于LLM的Agent服务系统在处理复杂任务时，依赖于预定义的工作流模板。这些模板通常采用浅层的匹配机制，无法充分捕捉任务的深层语义关系，导致泛化能力不足，难以适应新的、未见过的任务。此外，冗余计算和高内存占用也是现有方法的痛点。

核心思路：GraphFlow的核心思路是将工作流表示为一个统一的图结构（wGraph），其中每个节点代表一个原子操作。通过这种方式，可以将不同的工作流抽象成共享的图结构，从而实现工作流的动态生成和高效管理。这种基于图的表示方法能够更好地捕捉任务的语义信息，并支持更灵活的工作流组合。

技术框架：GraphFlow系统主要包含两个关键模块：自适应工作流生成和工作流状态管理。自适应工作流生成模块负责根据任务的语义和约束条件，从wGraph中动态构建特定的工作流。工作流状态管理模块则利用wGraph的结构，高效地管理Key-Value (KV) 缓存，从而减少Agent服务过程中的冗余计算。整体流程是，给定一个任务，首先通过自适应工作流生成模块构建工作流，然后利用该工作流指导Agent执行任务，并在执行过程中通过工作流状态管理模块优化计算效率。

关键创新：GraphFlow的关键创新在于使用图结构（wGraph）来统一表示和管理工作流。与传统的基于模板的工作流管理方法相比，wGraph能够更好地捕捉任务的语义信息，并支持更灵活的工作流组合和动态生成。此外，GraphFlow还通过利用wGraph的结构来优化KV缓存管理，进一步提升了Agent服务的效率。

关键设计：关于关键设计，论文中主要体现在wGraph的构建方式和工作流状态管理策略上。wGraph的节点表示原子操作，边表示操作之间的依赖关系。具体如何构建wGraph，以及如何根据任务语义和约束条件进行图搜索和工作流生成，是关键的技术细节。此外，工作流状态管理模块如何利用wGraph的结构来高效地管理KV缓存，减少冗余计算，也是一个重要的设计点。具体参数设置、损失函数和网络结构等细节在论文中未详细描述，属于未知信息。

🖼️ 关键图片

📊 实验亮点

实验结果表明，GraphFlow在五个基准数据集上 consistently 优于 state-of-the-art 方法，平均性能提升约 4.95 个百分点。更重要的是，GraphFlow 在提升性能的同时，还实现了约 4 倍的内存占用降低，这表明 GraphFlow 在效率和资源利用率方面都具有显著优势。

🎯 应用场景

GraphFlow具有广泛的应用前景，可应用于智能客服、自动化流程管理、智能家居控制等领域。通过提升LLM-Agent的推理和执行能力，GraphFlow能够帮助用户更高效地完成复杂任务，提高生产效率，并降低运营成本。未来，GraphFlow有望成为构建更智能、更灵活的Agent服务系统的关键技术。

📄 摘要（原文）

Large Language Model (LLM)-based agents demonstrate strong reasoning and execution capabilities on complex tasks when guided by structured instructions, commonly referred to as workflows. However, existing workflow-assisted agent serving systems typically rely on predefined templates and shallow matching mechanisms, which limit their ability to capture deep semantic relationships and generalize to previously unseen tasks. To address these limitations, we propose a new workflow management paradigm that represents workflows using a unified graph, termed wGraph, where each node corresponds to an atomic operation. wGraph serves as a shared substrate from which task-specific workflows are dynamically instantiated. Building on wGraph primitives, we introduce GraphFlow, a system that efficiently integrates workflows into agent serving through two key designs. First, adaptive workflow generation dynamically constructs workflows from wGraph based on task semantics and constraint requirements. Second, workflow state management exploits wGraph structure to efficiently manage Key-Value (KV) caches, reducing redundant computation during agent serving. Extensive experiments across five benchmark datasets show that GraphFlow consistently outperforms state-of-the-art methods, yielding an average performance improvement of approximately 4.95 percentage points, while achieving an approximately 4$\times$ reduction in memory footprint.

GraphFlow: A Graph-Based Workflow Management for Efficient LLM-Agent Serving

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理