Yunque DeepResearch Technical Report

作者: Yuxuan Cai, Xinyi Lai, Peng Yuan, Weiting Liu, Huajian Li, Mingda Li, Xinghua Wang, Shengxie Zheng, Yanchao Hao, Yuyang Yin, Zheng Wei

分类: cs.CL

发布日期: 2026-01-27

💡 一句话要点

Yunque DeepResearch：提出层级模块化深度研究框架，提升自主Agent复杂任务处理能力

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 深度研究 自主Agent 多Agent系统 上下文管理 异常检测

📋 核心要点

现有深度研究方法在长时程任务中面临上下文噪声大、易出错和缺乏模块化扩展等挑战。
Yunque DeepResearch采用分层模块化架构，通过多Agent编排、动态上下文管理和主动监督机制解决上述问题。
实验表明，Yunque DeepResearch在GAIA等多个基准测试中取得了领先性能，验证了其有效性。

📝 摘要（中文）

深度研究已成为自主Agent的一种变革性能力，使大型语言模型能够驾驭复杂的、开放式的任务。然而，实现其全部潜力受到关键限制的阻碍，包括长时程任务中不断升级的上下文噪声、导致级联错误的脆弱性以及缺乏模块化可扩展性。为了应对这些挑战，我们引入了Yunque DeepResearch，这是一个分层、模块化且鲁棒的框架。该架构的特点是三个关键组件：（1）一个集中的多Agent编排系统，将子任务路由到工具和专门子Agent的原子能力池；（2）一种动态上下文管理机制，将已完成的子目标构建为语义摘要，以减轻信息过载；（3）一个主动的监督器模块，通过主动异常检测和上下文修剪来确保弹性。Yunque DeepResearch在各种Agent深度研究基准测试中实现了最先进的性能，包括GAIA、BrowseComp、BrowseComp-ZH和Humanity's Last Exam。我们开源该框架、可复现的实现和应用案例，以赋能社区。

🔬 方法详解

问题定义：现有深度研究方法在处理复杂、开放式任务时，面临着三个主要痛点：一是长时程任务中上下文信息爆炸，导致噪声干扰；二是系统脆弱，容易出现级联错误；三是缺乏模块化设计，难以扩展和复用。

核心思路：Yunque DeepResearch的核心思路是将复杂的深度研究任务分解为多个子任务，并采用分层、模块化的架构进行管理和执行。通过多Agent协作、动态上下文管理和主动监督机制，提高系统的鲁棒性和可扩展性。

技术框架：Yunque DeepResearch包含三个主要模块：(1) 多Agent编排系统：负责将任务分解为子任务，并将子任务分配给不同的Agent或工具。(2) 动态上下文管理：负责维护和更新上下文信息，通过语义摘要减少信息过载。(3) 主动监督器模块：负责监控系统状态，检测异常，并进行上下文修剪，保证系统稳定运行。

关键创新：Yunque DeepResearch的关键创新在于其分层、模块化的架构设计，以及动态上下文管理和主动监督机制。这种设计使得系统能够更好地处理长时程任务，提高鲁棒性和可扩展性。与现有方法相比，Yunque DeepResearch更加灵活和高效。

关键设计：多Agent编排系统采用中心化的设计，便于统一管理和调度。动态上下文管理使用语义摘要技术，提取关键信息，减少冗余。主动监督器模块采用异常检测算法，及时发现并处理错误。具体参数设置和网络结构在论文中未详细说明，属于未知信息。

📊 实验亮点

Yunque DeepResearch在GAIA、BrowseComp、BrowseComp-ZH和Humanity's Last Exam等多个Agent深度研究基准测试中取得了state-of-the-art的性能。具体的性能提升数据在论文中未给出详细量化结果，属于未知信息。但整体结果表明，该框架在复杂任务处理方面具有显著优势。

🎯 应用场景

Yunque DeepResearch具有广泛的应用前景，可应用于智能客服、自动驾驶、科学研究等领域。通过赋予Agent更强的自主研究能力，可以提高工作效率，降低成本，并发现新的知识和规律。未来，该框架有望成为构建通用人工智能的重要基石。

📄 摘要（原文）

Deep research has emerged as a transformative capability for autonomous agents, empowering Large Language Models to navigate complex, open-ended tasks. However, realizing its full potential is hindered by critical limitations, including escalating contextual noise in long-horizon tasks, fragility leading to cascading errors, and a lack of modular extensibility. To address these challenges, we introduce Yunque DeepResearch, a hierarchical, modular, and robust framework. The architecture is characterized by three key components: (1) a centralized Multi-Agent Orchestration System that routes subtasks to an Atomic Capability Pool of tools and specialized sub-agents; (2) a Dynamic Context Management mechanism that structures completed sub-goals into semantic summaries to mitigate information overload; and (3) a proactive Supervisor Module that ensures resilience through active anomaly detection and context pruning. Yunque DeepResearch achieves state-of-the-art performance across a range of agentic deep research benchmarks, including GAIA, BrowseComp, BrowseComp-ZH, and Humanity's Last Exam. We open-source the framework, reproducible implementations, and application cases to empower the community.

Yunque DeepResearch Technical Report

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理