A Comprehensive Survey of Deep Research: Systems, Methodologies, and Applications

📄 arXiv: 2506.12594v1 📥 PDF

作者: Renjun Xu, Jingwen Peng

分类: cs.AI, cs.MA

发布日期: 2025-06-14

备注: 95 pages, 11 figures

🔗 代码/项目: GITHUB


💡 一句话要点

对基于AI的深度研究系统:系统、方法与应用的全面综述

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 深度研究系统 大型语言模型 信息检索 自主推理 AI自动化 知识综合 分层分类法

📋 核心要点

  1. 现有研究方法在处理复杂研究工作流程时效率较低,缺乏自动化能力,难以有效整合和利用海量信息。
  2. 该论文通过分析80多个深度研究系统,提出了一个新颖的分层分类法,从四个技术维度对这些系统进行分类。
  3. 该研究揭示了当前深度研究系统的能力和局限性,并指出了未来在推理架构、多模态集成等方向的研究机会。

📝 摘要(中文)

本综述考察了深度研究系统这一快速发展的领域,该系统是利用大型语言模型、高级信息检索和自主推理能力来自动化复杂研究工作流程的AI驱动应用。我们分析了自2023年以来涌现的80多个商业和非商业实现,包括OpenAI/Deep Research、Gemini/Deep Research、Perplexity/Deep Research以及许多开源替代方案。通过全面的考察,我们提出了一种新的分层分类法,该分类法根据四个基本技术维度对系统进行分类:基础模型和推理引擎、工具利用和环境交互、任务规划和执行控制以及知识综合和输出生成。我们探讨了这些系统在学术、科学、商业和教育应用中的架构模式、实现方法和特定领域的调整。我们的分析揭示了当前实现的显著能力,以及它们在信息准确性、隐私、知识产权和可访问性方面提出的技术和伦理挑战。本综述最后确定了高级推理架构、多模态集成、领域专业化、人机协作和生态系统标准化等有希望的研究方向,这些方向可能会影响这种变革性技术的未来发展。通过提供一个理解深度研究系统的全面框架,本综述有助于对AI增强知识工作的理论理解,以及对更强大、负责任和可访问的研究技术的实际发展。

🔬 方法详解

问题定义:论文旨在全面分析和理解新兴的“深度研究”系统,这些系统利用AI(特别是大型语言模型)来自动化复杂的研究工作流程。现有方法缺乏一个统一的框架来理解这些系统的架构、功能和局限性,也缺乏对未来发展方向的系统性展望。

核心思路:论文的核心思路是通过对大量已实现的深度研究系统进行分析,提炼出一个分层分类法,从而将这些系统分解为几个关键的技术维度。这种分类法能够帮助研究者和开发者更好地理解不同系统的设计选择和性能特点,并为未来的研究方向提供指导。

技术框架:论文的技术框架主要包括以下几个步骤:1) 收集和整理自2023年以来出现的80多个深度研究系统的实例;2) 分析这些系统的架构、功能和应用领域;3) 基于分析结果,提出一个包含四个技术维度的分层分类法;4) 探讨这些系统在信息准确性、隐私和知识产权等方面面临的挑战;5) 展望未来研究方向,包括高级推理架构、多模态集成等。

关键创新:论文的关键创新在于提出了一个用于深度研究系统的分层分类法,该分类法包含四个维度:基础模型和推理引擎、工具利用和环境交互、任务规划和执行控制、知识综合和输出生成。这个分类法提供了一个结构化的方式来理解和比较不同的深度研究系统,并为未来的研究提供了理论基础。

关键设计:论文没有涉及具体的参数设置或网络结构,而侧重于对现有系统的架构和功能的分析。关键设计在于分类法的四个维度,这些维度涵盖了深度研究系统的核心技术要素,并能够有效地对不同系统进行区分和比较。例如,在“工具利用和环境交互”维度,可以考察系统如何利用外部API或数据库来获取信息;在“任务规划和执行控制”维度,可以考察系统如何将复杂的研究任务分解为更小的子任务并进行调度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该综述分析了80多个深度研究系统的实例,揭示了当前系统在自动化研究工作流程方面的能力,并指出了在信息准确性、隐私和知识产权等方面存在的挑战。提出的分层分类法为理解和比较不同的深度研究系统提供了一个有用的框架。

🎯 应用场景

深度研究系统具有广泛的应用前景,包括学术研究、科学发现、商业决策和教育等领域。它们可以帮助研究人员更高效地进行文献综述、数据分析和实验设计,辅助企业进行市场调研和竞争情报分析,并为学生提供个性化的学习资源和辅导。未来,随着技术的不断发展,深度研究系统有望成为知识工作者不可或缺的工具。

📄 摘要(原文)

This survey examines the rapidly evolving field of Deep Research systems -- AI-powered applications that automate complex research workflows through the integration of large language models, advanced information retrieval, and autonomous reasoning capabilities. We analyze more than 80 commercial and non-commercial implementations that have emerged since 2023, including OpenAI/Deep Research, Gemini/Deep Research, Perplexity/Deep Research, and numerous open-source alternatives. Through comprehensive examination, we propose a novel hierarchical taxonomy that categorizes systems according to four fundamental technical dimensions: foundation models and reasoning engines, tool utilization and environmental interaction, task planning and execution control, and knowledge synthesis and output generation. We explore the architectural patterns, implementation approaches, and domain-specific adaptations that characterize these systems across academic, scientific, business, and educational applications. Our analysis reveals both the significant capabilities of current implementations and the technical and ethical challenges they present regarding information accuracy, privacy, intellectual property, and accessibility. The survey concludes by identifying promising research directions in advanced reasoning architectures, multimodal integration, domain specialization, human-AI collaboration, and ecosystem standardization that will likely shape the future evolution of this transformative technology. By providing a comprehensive framework for understanding Deep Research systems, this survey contributes to both the theoretical understanding of AI-augmented knowledge work and the practical development of more capable, responsible, and accessible research technologies. The paper resources can be viewed at https://github.com/scienceaix/deepresearch.