MiroFlow: Towards High-Performance and Robust Open-Source Agent Framework for General Deep Research Tasks

📄 arXiv: 2602.22808v1 📥 PDF

作者: Shiqian Su, Sen Xing, Xuan Dong, Muyan Zhong, Bin Wang, Xizhou Zhu, Yuntao Chen, Wenhai Wang, Yue Deng, Pengxiang Zhu, Ziyuan Liu, Tiantong Li, Jiaheng Yu, Zhe Chen, Lidong Bing, Jifeng Dai

分类: cs.AI

发布日期: 2026-02-26


💡 一句话要点

MiroFlow:面向通用深度研究任务的高性能鲁棒开源Agent框架

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Agent框架 大语言模型 深度推理 任务编排 开源框架

📋 核心要点

  1. 现有Agent框架在处理复杂任务时,存在工作流程简单、性能不稳定、依赖商业API等问题。
  2. MiroFlow通过Agent图实现灵活编排,可选深度推理模式提升性能,鲁棒工作流程保证稳定性和可复现性。
  3. 实验表明,MiroFlow在多个Agent基准测试中取得了领先的性能,为研究社区提供了一个可靠的基线。

📝 摘要(中文)

本文提出了一种高性能且鲁棒的开源Agent框架MiroFlow,旨在解决现有Agent框架在处理复杂现实任务时存在的不足。这些不足包括工作流程简单、性能不稳定、对多样化基准和任务的支持有限,以及对昂贵商业API的过度依赖。MiroFlow集成了用于灵活编排的Agent图、用于增强性能的可选深度推理模式以及用于确保稳定和可复现性能的鲁棒工作流程执行。大量实验表明,MiroFlow在多个Agent基准测试(包括GAIA、BrowseComp-EN/ZH、HLE、xBench-DeepSearch以及FutureX)上始终如一地实现了最先进的性能。希望该框架能够为深度研究社区提供一个易于访问、可复现且可比较的基线。

🔬 方法详解

问题定义:现有的大语言模型(LLMs)在处理需要与外部工具和动态环境交互的复杂现实任务时,能力开始遇到瓶颈。现有的Agent框架虽然旨在通过工具集成和外部交互来增强模型的自主性,但仍然存在工作流程简单、性能不稳定、对多样化基准和任务的支持有限,以及严重依赖昂贵的商业API等问题。这些问题限制了Agent在实际深度研究中的应用。

核心思路:MiroFlow的核心思路是通过构建一个灵活、可扩展且鲁棒的Agent框架,来克服现有Agent框架的局限性。它通过引入Agent图来实现灵活的任务编排,利用深度推理模式来提升性能,并采用鲁棒的工作流程执行机制来保证稳定性和可复现性。这种设计旨在提供一个更通用、更可靠的Agent平台,以支持更广泛的深度研究任务。

技术框架:MiroFlow框架主要包含以下几个核心模块: 1. Agent图:用于灵活地编排不同的Agent,允许根据任务需求动态地调整Agent之间的交互方式。 2. 深度推理模式(可选):通过更深入的推理过程来增强Agent的决策能力,从而提高性能。 3. 鲁棒工作流程执行:确保Agent在执行任务时的稳定性和可复现性,减少因环境变化或随机因素带来的影响。

关键创新:MiroFlow的关键创新在于其Agent图的设计和鲁棒的工作流程执行机制。Agent图允许灵活地组合和编排不同的Agent,从而适应不同的任务需求。鲁棒的工作流程执行机制则通过错误处理、重试机制等手段,保证Agent在复杂环境下的稳定运行。

关键设计:MiroFlow的具体技术细节包括: * Agent图的构建方式,如何定义Agent之间的连接和交互。 * 深度推理模式的具体实现,例如使用的模型结构、训练方法等。 * 鲁棒工作流程执行机制的具体策略,例如错误检测、重试策略、资源管理等。这些细节共同保证了MiroFlow的性能和稳定性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

MiroFlow在多个Agent基准测试中取得了显著的性能提升,包括GAIA、BrowseComp-EN/ZH、HLE、xBench-DeepSearch以及FutureX。实验结果表明,MiroFlow能够 consistently 达到 state-of-the-art 的性能,证明了其有效性和优越性。具体的性能数据和对比基线可以在论文的实验部分找到。

🎯 应用场景

MiroFlow框架具有广泛的应用前景,可应用于自动化研究、智能决策、复杂问题求解等领域。例如,可以利用MiroFlow构建自动化科学研究平台,加速新材料发现、药物研发等过程。此外,MiroFlow还可以应用于智能客服、智能助手等领域,提升用户体验和工作效率。该框架的开源特性将促进Agent技术的发展和应用。

📄 摘要(原文)

Despite the remarkable progress of large language models (LLMs), the capabilities of standalone LLMs have begun to plateau when tackling real-world, complex tasks that require interaction with external tools and dynamic environments. Although recent agent frameworks aim to enhance model autonomy through tool integration and external interaction, they still suffer from naive workflows, unstable performance, limited support across diverse benchmarks and tasks, and heavy reliance on costly commercial APIs. In this work, we propose a high-performance and robust open-source agent framework, termed MiroFlow, which incorporates an agent graph for flexible orchestration, an optional deep reasoning mode to enhance performance, and a robust workflow execution to ensure stable and reproducible performance. Extensive experiments demonstrate that MiroFlow consistently achieves state-of-the-art performance across multiple agent benchmarks, including GAIA, BrowseComp-EN/ZH, HLE, xBench-DeepSearch, and notably FutureX. We hope it could serve as an easily accessible, reproducible, and comparable baseline for the deep research community.