Retrieval-Augmented Generation for Natural Language Processing: A Survey

作者: Shangyu Wu, Ying Xiong, Yufei Cui, Haolun Wu, Can Chen, Ye Yuan, Lianming Huang, Xue Liu, Tei-Wei Kuo, Nan Guan, Chun Jason Xue

分类: cs.CL

发布日期: 2024-07-18 (更新: 2025-03-01)

💡 一句话要点

综述检索增强生成（RAG）技术，解决大语言模型幻觉、知识更新和领域知识不足问题。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 检索增强生成 大型语言模型 自然语言处理 知识库 信息检索 文本生成 RAG综述

📋 核心要点

大语言模型存在幻觉、知识更新困难和缺乏领域知识等问题，限制了其应用。
检索增强生成（RAG）通过外部知识库增强LLM，弥补了LLM的不足，提升了性能。
论文综述了RAG的关键技术，包括检索器、检索融合、知识更新、评估基准和应用场景。

📝 摘要（中文）

大型语言模型（LLMs）受益于其海量的参数存储的知识，在各个领域都取得了巨大的成功。然而，LLMs仍然存在一些关键问题，例如幻觉问题、知识更新问题以及缺乏领域特定的专业知识。检索增强生成（RAG）的出现，利用外部知识库来增强LLMs，弥补了LLMs的这些缺点。本文回顾了RAG的所有重要技术，特别是在检索器和检索融合方面。此外，还提供了教程代码来实现RAG中的代表性技术。本文进一步讨论了RAG的更新，包括有/无知识更新的RAG。然后，我们介绍了RAG的评估和基准测试，以及RAG在代表性的NLP任务和工业场景中的应用。最后，本文讨论了RAG的未来方向和挑战，以促进该领域的发展。

🔬 方法详解

问题定义：大语言模型（LLMs）虽然参数量巨大，存储了大量知识，但在实际应用中仍然面临诸多挑战。主要痛点包括：一是幻觉问题，即生成不真实或不准确的内容；二是知识更新问题，LLMs的知识库是静态的，无法及时反映现实世界的变化；三是缺乏领域特定知识，通用LLMs在特定领域的表现往往不如人意。这些问题限制了LLMs在实际场景中的应用。

核心思路：检索增强生成（RAG）的核心思路是利用外部知识库来增强LLMs。具体来说，RAG首先从外部知识库中检索相关信息，然后将检索到的信息与原始输入一起输入到LLM中，LLM根据检索到的信息生成最终的输出。这样，LLM就可以利用外部知识库来弥补自身的不足，从而提高生成质量。

技术框架：RAG的整体框架通常包含以下几个主要模块：1) 检索器（Retriever）：负责从外部知识库中检索相关信息。常用的检索方法包括基于向量相似度的检索和基于关键词的检索。2) 知识库（Knowledge Base）：存储外部知识的数据库。知识库可以是结构化的数据库，也可以是非结构化的文本集合。3) 生成器（Generator）：即LLM，负责根据原始输入和检索到的信息生成最终的输出。4) 检索融合（Retrieval Fusion）：将检索到的多个文档或信息片段进行融合，以便更好地服务于生成器。

关键创新：RAG的关键创新在于将检索和生成两个过程结合起来，利用外部知识库来增强LLMs。与传统的LLMs相比，RAG可以更好地解决幻觉问题、知识更新问题和缺乏领域特定知识的问题。此外，RAG还可以通过调整检索策略和融合方法来优化生成效果。

关键设计：RAG的关键设计包括：1) 检索器的选择：需要根据具体的应用场景选择合适的检索器。例如，对于需要精确匹配的场景，可以选择基于关键词的检索器；对于需要语义理解的场景，可以选择基于向量相似度的检索器。2) 知识库的构建：需要根据具体的应用场景构建合适的知识库。知识库的内容应该与应用场景相关，并且应该及时更新。3) 检索融合策略：不同的检索融合策略会对生成效果产生不同的影响。需要根据具体的应用场景选择合适的检索融合策略。例如，可以将检索到的多个文档进行加权平均，或者可以使用LLM来对检索到的文档进行排序和筛选。

🖼️ 关键图片

📊 实验亮点

该论文是一篇综述，没有具体的实验结果。但文中提到提供了教程代码来实现RAG中的代表性技术，这对于RAG技术的学习和应用具有重要意义。此外，论文还讨论了RAG的评估和基准测试，为RAG的性能评估提供了参考。

🎯 应用场景

RAG技术可广泛应用于问答系统、文本摘要、机器翻译、代码生成等自然语言处理任务。其能够提升LLM在特定领域的表现，并解决知识更新问题，具有重要的实际应用价值。未来，RAG有望在智能客服、知识图谱构建、智能文档处理等领域发挥更大的作用。

📄 摘要（原文）

Large language models (LLMs) have demonstrated great success in various fields, benefiting from their huge amount of parameters that store knowledge. However, LLMs still suffer from several key issues, such as hallucination problems, knowledge update issues, and lacking domain-specific expertise. The appearance of retrieval-augmented generation (RAG), which leverages an external knowledge database to augment LLMs, makes up those drawbacks of LLMs. This paper reviews all significant techniques of RAG, especially in the retriever and the retrieval fusions. Besides, tutorial codes are provided for implementing the representative techniques in RAG. This paper further discusses the RAG update, including RAG with/without knowledge update. Then, we introduce RAG evaluation and benchmarking, as well as the application of RAG in representative NLP tasks and industrial scenarios. Finally, this paper discusses RAG's future directions and challenges for promoting this field's development.

Retrieval-Augmented Generation for Natural Language Processing: A Survey

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理