MiroFlow: Towards High-Performance and Robust Open-Source Agent Framework for General Deep Research Tasks

📄 arXiv: 2602.22808 📥 PDF

作者: Shiqian Su, Sen Xing, Xuan Dong, Muyan Zhong, Bin Wang, Xizhou Zhu, Yuntao Chen, Wenhai Wang, Yue Deng, Pengxiang Zhu, Ziyuan Liu, Tiantong Li, Jiaheng Yu, Zhe Chen, Lidong Bing, Jifeng Dai

分类: cs.AI

发布日期: 2026-02-28


💡 一句话要点

MiroFlow:面向通用深度研究任务的高性能鲁棒开源Agent框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Agent框架 大语言模型 深度推理 任务编排 开源 基准测试 自动化研究

📋 核心要点

  1. 现有Agent框架在处理复杂任务时,存在工作流程简单、性能不稳定、对多样化任务支持有限等问题。
  2. MiroFlow通过引入Agent图实现灵活编排,并提供可选的深度推理模式来提升性能。
  3. 实验结果表明,MiroFlow在多个Agent基准测试中取得了领先的性能,证明了其有效性。

📝 摘要(中文)

本文提出了一种高性能且鲁棒的开源Agent框架MiroFlow,旨在解决现有Agent框架在处理复杂现实任务时存在的不足。这些不足包括工作流程简单、性能不稳定、对多样化基准和任务的支持有限,以及对昂贵商业API的过度依赖。MiroFlow集成了用于灵活编排的Agent图、用于增强性能的可选深度推理模式,以及用于确保稳定和可复现性能的鲁棒工作流程执行。大量实验表明,MiroFlow在多个Agent基准测试中始终如一地实现了最先进的性能,包括GAIA、BrowseComp-EN/ZH、HLE、xBench-DeepSearch,以及FutureX。希望它可以作为深度研究社区易于访问、可复现和可比较的基线。

🔬 方法详解

问题定义:现有的大语言模型(LLMs)在处理需要与外部工具和动态环境交互的复杂现实任务时,能力开始遇到瓶颈。现有的Agent框架虽然试图通过工具集成和外部交互来增强模型的自主性,但其工作流程较为简单,性能不稳定,对不同基准和任务的支持有限,并且严重依赖昂贵的商业API。

核心思路:MiroFlow的核心思路是通过构建一个灵活、可扩展且鲁棒的Agent框架,来克服现有Agent框架的局限性。它旨在提供一个易于访问、可复现和可比较的基线,以促进深度研究社区的发展。通过Agent图实现灵活的任务编排,并引入深度推理模式来提升性能。

技术框架:MiroFlow框架包含以下主要模块: 1. Agent图:用于灵活地编排不同的Agent,实现复杂任务的分解和协作。 2. 深度推理模式(可选):通过更深入的推理过程来提高Agent的性能。 3. 鲁棒的工作流程执行:确保Agent在执行任务时的稳定性和可复现性。

关键创新:MiroFlow的关键创新在于其Agent图的设计,它允许用户灵活地定义和组合不同的Agent,以适应不同的任务需求。此外,可选的深度推理模式可以进一步提升Agent的性能。框架的鲁棒性设计确保了任务执行的稳定性和可复现性,这对于研究和实验至关重要。

关键设计:论文中没有明确给出关键的参数设置、损失函数、网络结构等技术细节。深度推理模式的具体实现方式未知,Agent图的构建和优化策略也未详细描述。这些细节可能在后续的论文或代码实现中公开。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

MiroFlow在GAIA、BrowseComp-EN/ZH、HLE、xBench-DeepSearch和FutureX等多个Agent基准测试中取得了最先进的性能。具体的性能提升幅度在论文中没有给出详细的数据,但强调了MiroFlow在多个任务上的一致性和优越性。

🎯 应用场景

MiroFlow框架可应用于各种需要智能体与环境交互的复杂任务,例如自动化研究、智能决策、机器人控制等。它提供了一个通用的平台,可以方便地集成不同的工具和模型,从而加速相关领域的研究和开发。该框架的开源特性也有助于促进社区的合作和创新。

📄 摘要(原文)

Despite the remarkable progress of large language models (LLMs), the capabilities of standalone LLMs have begun to plateau when tackling real-world, complex tasks that require interaction with external tools and dynamic environments. Although recent agent frameworks aim to enhance model autonomy through tool integration and external interaction, they still suffer from naive workflows, unstable performance, limited support across diverse benchmarks and tasks, and heavy reliance on costly commercial APIs. In this work, we propose a high-performance and robust open-source agent framework, termed MiroFlow, which incorporates an agent graph for flexible orchestration, an optional deep reasoning mode to enhance performance, and a robust workflow execution to ensure stable and reproducible performance. Extensive experiments demonstrate that MiroFlow consistently achieves state-of-the-art performance across multiple agent benchmarks, including GAIA, BrowseComp-EN/ZH, HLE, xBench-DeepSearch, and notably FutureX. We hope it could serve as an easily accessible, reproducible, and comparable baseline for the deep research community.