A Survey of Reasoning-Intensive Retrieval: Progress and Challenges

作者: Yiyang Wei, Tingyu Song, Siyue Zhang, Yilun Zhao

分类: cs.IR, cs.AI

发布日期: 2026-04-30

备注: Accepted to the ACL 2026 Main Conference; camera-ready version

💡 一句话要点

针对推理密集型检索的综述：系统性地分析现有方法，并展望未来研究方向

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 推理密集型检索 信息检索 大型语言模型 知识图谱 问答系统

📋 核心要点

现有检索方法在处理需要推理才能建立查询与文档相关性的场景中表现不足。
论文通过构建系统性框架，分析现有推理密集型检索方法，并进行分类。
该综述总结了现有方法的优缺点，并指出了未来研究方向，为领域发展提供指导。

📝 摘要（中文）

推理密集型检索（RIR）旨在解决检索场景中，查询和支持证据之间的相关性并非直接的语义相似性，而是由潜在的推理链接所决定的问题。受大型语言模型（LLM）涌现的推理能力的启发，最近的研究将这些能力整合到信息检索（IR）领域，涵盖了从基准测试到检索器和重排序器的整个流程。尽管取得了这些进展，但该领域缺乏一个系统的框架来组织当前的工作，并阐明清晰的发展方向。为了给这个快速增长但分散的领域提供一个清晰的路线图，本综述（1）通过知识领域和模态对现有的RIR基准进行系统化，并对当前的格局进行详细分析；（2）引入一个结构化的分类法，根据推理集成到检索流程的位置和方式对方法进行分类，同时分析它们的权衡和实际应用；（3）总结挑战和未来方向，以指导这个不断发展的领域的研究。

🔬 方法详解

问题定义：推理密集型检索（RIR）旨在解决传统检索方法无法有效处理的、需要通过推理才能确定查询与文档相关性的问题。现有方法在处理此类问题时，往往无法捕捉到查询和文档之间潜在的推理链，导致检索效果不佳。痛点在于缺乏对推理过程的建模和利用，以及缺乏统一的评估标准和方法分类。

核心思路：本综述的核心思路是对现有RIR方法进行系统性的梳理和分类，从而构建一个统一的框架，并为未来的研究提供指导。通过分析不同方法的推理方式、集成位置以及优缺点，揭示RIR领域的研究现状和发展趋势。

技术框架：该综述的技术框架主要包含三个部分：首先，对现有的RIR基准测试集进行分类，按照知识领域和模态进行划分，并分析各个基准测试集的特点。其次，构建了一个结构化的分类法，根据推理集成到检索流程的位置和方式对现有方法进行分类，例如，在检索前进行推理、在检索过程中进行推理、在重排序阶段进行推理等。最后，总结了RIR领域面临的挑战和未来的研究方向。

关键创新：本综述的关键创新在于构建了一个系统性的框架，对现有的RIR方法进行了全面的梳理和分类。该框架不仅可以帮助研究人员更好地理解RIR领域的研究现状，还可以为未来的研究提供指导。此外，该综述还指出了RIR领域面临的挑战和未来的研究方向，例如，如何更好地利用大型语言模型的推理能力、如何构建更加有效的推理模型、如何设计更加合理的评估指标等。

关键设计：该综述的关键设计在于其分类框架，该框架根据推理集成到检索流程的位置和方式对现有方法进行分类。这种分类方式可以帮助研究人员更好地理解不同方法的特点和适用场景。此外，该综述还对各个基准测试集进行了详细的分析，并指出了各个基准测试集的优缺点。

🖼️ 关键图片

📊 实验亮点

该综述系统性地分析了现有推理密集型检索基准，并根据知识领域和模态进行了详细分类。此外，论文还提出了一个结构化的分类法，根据推理集成到检索流程的位置和方式对现有方法进行了分类，为该领域的研究人员提供了一个清晰的参考框架。

🎯 应用场景

该研究成果可应用于问答系统、知识图谱推理、信息抽取等领域。通过提升检索系统在复杂推理场景下的性能，可以更准确地找到用户所需的信息，提高用户体验，并为决策提供更可靠的依据。未来可应用于智能客服、金融风控、医疗诊断等领域。

📄 摘要（原文）

Reasoning-Intensive Retrieval (RIR) targets retrieval settings where relevance is mediated by latent inferential links between a query and supporting evidence, rather than semantic similarity. Motivated by the emergent reasoning abilities of Large Language Models (LLMs), recent work integrates these capabilities into the IR field, spanning the entire pipeline from benchmarks to retrievers and rerankers. Despite this progress, the field lacks a systematic framework to organize current efforts and articulate a clear path forward. To provide a clear roadmap for this rapidly growing yet fragmented area, this survey (1) systematizes existing RIR benchmarks by knowledge domains and modalities, providing a detailed analysis of the current landscape; (2) introduces a structured taxonomy that categorizes methods based on where and how reasoning is integrated into the retrieval pipeline, alongside an analysis of their trade-offs and practical applications; and (3) summarizes challenges and future directions to guide research in this evolving field.

A Survey of Reasoning-Intensive Retrieval: Progress and Challenges

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理