Agentic Large Language Models, a survey

作者: Aske Plaat, Max van Duijn, Niki van Stein, Mike Preuss, Peter van der Putten, Kees Joost Batenburg

分类: cs.AI, cs.CL, cs.LG

发布日期: 2025-03-29 (更新: 2025-11-22)

备注: Website: https://askeplaat.github.io/agentic-llm-survey-site/

期刊: JAIR volume 84, article 29, December 2025

DOI: 10.1613/jair.1.18675

💡 一句话要点

综述性论文：Agentic LLM，探索具身智能大语言模型的研究进展与未来方向

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: Agentic LLM 具身智能 大语言模型 智能体 推理 行动 交互 多智能体系统

📋 核心要点

现有LLM在复杂任务中缺乏自主性和行动能力，限制了其应用范围，Agentic LLM旨在赋予LLM智能体的能力。
本文将Agentic LLM定义为具备推理、行动和交互三种能力的LLM，并以此为框架组织和分析相关研究。
综述发现，检索增强工具使用，反思提升多智能体协作，推理能力对所有Agentic LLM应用均有促进作用。

📝 摘要（中文）

本文对Agentic LLM（即作为智能体的LLM）这一新兴领域的研究进行了综述，并提出了未来的研究方向。Agentic LLM具有三个关键特征：推理、行动和交互。本文根据这三个类别组织了相关文献。研究结果表明，第一类研究侧重于推理、反思和检索，旨在提高决策能力；第二类研究侧重于行动模型、机器人和工具，旨在开发有用的智能助手；第三类研究侧重于多智能体系统，旨在实现协同任务解决和模拟交互以研究涌现的社会行为。不同类别的研究成果可以相互促进：检索支持工具使用，反思改进多智能体协作，推理则对所有类别都有益。最后，本文讨论了Agentic LLM的应用，并提出了进一步的研究议程，重点关注医疗诊断、物流和金融市场分析等重要应用。此外，自反思智能体在角色扮演和相互交互中可以促进科学研究本身。Agentic LLM还为LLM面临的训练数据不足问题提供了一种解决方案：推理时行为生成新的训练状态，使LLM无需更大的数据集也能持续学习。同时，也指出了LLM助手在现实世界中采取行动所带来的风险，如安全、责任和保障等问题，但Agentic LLM也有可能造福社会。

🔬 方法详解

问题定义：现有的大语言模型（LLM）虽然在文本生成和理解方面表现出色，但在需要自主决策、执行动作和与环境交互的复杂任务中存在局限性。传统的LLM主要依赖于预训练数据，缺乏在推理过程中进行反思和适应的能力，也难以有效地利用外部工具和知识。因此，如何赋予LLM智能体的能力，使其能够像人类一样自主地解决问题，成为了一个重要的研究方向。

核心思路：本文的核心思路是将Agentic LLM定义为具备推理（Reasoning）、行动（Acting）和交互（Interacting）三种关键能力的LLM。通过对现有研究进行分类和分析，揭示了这三种能力之间的相互关系和促进作用。例如，推理能力可以帮助智能体更好地规划行动，行动能力可以使智能体与环境进行交互，而交互过程中的反馈又可以促进智能体的反思和学习。

技术框架：本文的综述框架围绕Agentic LLM的三个核心能力展开：推理、行动和交互。推理部分主要关注如何提高LLM的决策能力，包括利用检索增强生成、进行反思和自我评估等方法。行动部分主要关注如何将LLM与外部工具和环境连接起来，包括开发行动模型、控制机器人和使用各种工具。交互部分主要关注多智能体系统的研究，包括如何实现智能体之间的协同任务解决和模拟社会行为。

关键创新：本文的创新之处在于提出了一个清晰的Agentic LLM定义框架，并以此为基础对现有研究进行了系统性的综述和分类。通过分析不同研究方向之间的联系和相互作用，揭示了Agentic LLM的发展趋势和未来方向。此外，本文还强调了Agentic LLM在解决LLM训练数据不足问题方面的潜力，以及在实际应用中可能存在的风险。

关键设计：本文作为一篇综述性文章，并没有提出具体的模型或算法设计。但是，文章中讨论了各种提高Agentic LLM能力的策略，例如：使用检索增强生成来提高推理能力；设计行动模型来控制机器人和使用工具；以及开发多智能体协作机制来实现协同任务解决。这些策略都涉及到具体的参数设置、损失函数和网络结构设计，但具体细节需要参考相关的原始论文。

🖼️ 关键图片

📊 实验亮点

本文是一篇综述性论文，没有具体的实验结果。但文章强调了不同研究方向之间的相互促进作用，例如，检索增强可以提高工具使用的效率，反思可以改进多智能体协作的效果，而推理能力则对所有Agentic LLM应用都有益。此外，文章还指出，Agentic LLM可以通过推理时行为生成新的训练数据，从而解决LLM训练数据不足的问题。

🎯 应用场景

Agentic LLM在医疗诊断、物流优化和金融市场分析等领域具有广泛的应用前景。例如，在医疗诊断中，Agentic LLM可以辅助医生进行疾病诊断和治疗方案制定；在物流优化中，Agentic LLM可以优化运输路线和资源分配；在金融市场分析中，Agentic LLM可以预测市场趋势和风险。此外，Agentic LLM还可以用于科学研究，通过模拟智能体之间的交互来探索新的科学发现。

📄 摘要（原文）

Background: There is great interest in agentic LLMs, large language models that act as agents. Objectives: We review the growing body of work in this area and provide a research agenda. Methods: Agentic LLMs are LLMs that (1) reason, (2) act, and (3) interact. We organize the literature according to these three categories. Results: The research in the first category focuses on reasoning, reflection, and retrieval, aiming to improve decision making; the second category focuses on action models, robots, and tools, aiming for agents that act as useful assistants; the third category focuses on multi-agent systems, aiming for collaborative task solving and simulating interaction to study emergent social behavior. We find that works mutually benefit from results in other categories: retrieval enables tool use, reflection improves multi-agent collaboration, and reasoning benefits all categories. Conclusions: We discuss applications of agentic LLMs and provide an agenda for further research. Important applications are in medical diagnosis, logistics and financial market analysis. Meanwhile, self-reflective agents playing roles and interacting with one another augment the process of scientific research itself. Further, agentic LLMs provide a solution for the problem of LLMs running out of training data: inference-time behavior generates new training states, such that LLMs can keep learning without needing ever larger datasets. We note that there is risk associated with LLM assistants taking action in the real world-safety, liability and security are open problems-while agentic LLMs are also likely to benefit society.

Agentic Large Language Models, a survey

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理