Beyond the Parameters: A Technical Survey of Contextual Enrichment in Large Language Models: From In-Context Prompting to Causal Retrieval-Augmented Generation

作者: Prakhar Bansal, Shivangi Agarwal

分类: cs.CL, cs.AI

发布日期: 2026-04-06

💡 一句话要点

综述LLM上下文增强技术：从上下文提示到因果检索增强生成

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 上下文学习 检索增强生成 知识图谱 因果推理

📋 核心要点

现有LLM受限于静态知识、有限上下文窗口和弱因果推理，难以处理复杂任务。
论文系统性地研究了LLM的上下文增强策略，从上下文提示到因果检索增强生成。
论文提供文献筛选协议、声明审计框架和跨论文证据综合，区分高置信度发现和新兴结果。

📝 摘要（中文）

大型语言模型（LLM）在其参数中编码了大量的世界知识，但它们仍然受到静态知识、有限的上下文窗口和弱结构化因果推理的根本限制。本综述沿着一个单一的轴线，即推理时提供的结构化上下文的程度，对增强策略提供了一个统一的描述。我们涵盖了上下文学习和提示工程、检索增强生成（RAG）、GraphRAG和CausalRAG。除了概念比较之外，我们还提供了一个透明的文献筛选协议、一个声明审计框架和一个结构化的跨论文证据综合，区分了高置信度的发现和新兴的结果。本文最后提出了一个面向部署的决策框架和可信的检索增强NLP的具体研究重点。

🔬 方法详解

问题定义：大型语言模型虽然参数量巨大，蕴含丰富的世界知识，但其知识是静态的，无法动态更新。同时，受限于有限的上下文窗口，LLM难以处理需要长程依赖的任务。此外，LLM在因果推理方面表现较弱，难以进行复杂的推理任务。现有方法在解决这些问题时存在局限性，例如简单的检索增强生成（RAG）可能引入噪声信息，影响生成质量。

核心思路：论文的核心思路是沿着结构化上下文的程度，对各种上下文增强策略进行统一的分析和比较。通过引入不同程度的结构化上下文，例如从简单的上下文提示到复杂的因果图，来增强LLM的知识和推理能力。这种思路旨在弥补LLM在静态知识、有限上下文和弱因果推理方面的不足。

技术框架：论文的整体框架围绕着LLM的上下文增强展开，主要包括以下几个阶段：1) 上下文学习和提示工程：利用精心设计的提示来引导LLM生成期望的输出。2) 检索增强生成（RAG）：从外部知识库检索相关信息，并将其融入到LLM的输入中。3) GraphRAG：利用图结构来组织和检索知识，从而更好地利用上下文信息。4) CausalRAG：在RAG的基础上，引入因果关系建模，从而增强LLM的因果推理能力。

关键创新：论文的关键创新在于对各种上下文增强策略进行了一个统一的、结构化的分析和比较。通过沿着结构化上下文的程度这一轴线，将不同的方法联系起来，从而揭示了它们之间的内在联系和优缺点。此外，论文还提出了一个透明的文献筛选协议、一个声明审计框架和一个结构化的跨论文证据综合，从而提高了研究的可靠性和可信度。

关键设计：论文并没有提出具体的模型或算法，而是对现有方法进行了一个综述和分析。因此，没有具体的参数设置、损失函数或网络结构需要描述。论文的重点在于对不同方法的概念比较、优缺点分析以及未来研究方向的展望。

📊 实验亮点

论文通过透明的文献筛选协议和声明审计框架，对现有研究进行了严格的评估，区分了高置信度的发现和新兴的结果。这种严谨的研究方法提高了研究的可信度。此外，论文还提供了一个面向部署的决策框架，为实际应用提供了指导。

🎯 应用场景

该研究成果可应用于问答系统、对话系统、知识图谱构建等领域。通过增强LLM的上下文理解和推理能力，可以提高这些应用系统的性能和用户体验。未来，该研究可以推动可信的检索增强NLP的发展，并促进LLM在更广泛领域的应用。

📄 摘要（原文）

Large language models (LLMs) encode vast world knowledge in their parameters, yet they remain fundamentally limited by static knowledge, finite context windows, and weakly structured causal reasoning. This survey provides a unified account of augmentation strategies along a single axis: the degree of structured context supplied at inference time. We cover in-context learning and prompt engineering, Retrieval-Augmented Generation (RAG), GraphRAG, and CausalRAG. Beyond conceptual comparison, we provide a transparent literature-screening protocol, a claim-audit framework, and a structured cross-paper evidence synthesis that distinguishes higher-confidence findings from emerging results. The paper concludes with a deployment-oriented decision framework and concrete research priorities for trustworthy retrieval-augmented NLP.

Beyond the Parameters: A Technical Survey of Contextual Enrichment in Large Language Models: From In-Context Prompting to Causal Retrieval-Augmented Generation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理