AI Planning: A Primer and Survey (Preliminary Report)

📄 arXiv: 2412.05528v1 📥 PDF

作者: Dillon Z. Chen, Pulkit Verma, Siddharth Srivastava, Michael Katz, Sylvie Thiébaux

分类: cs.AI

发布日期: 2024-12-07


💡 一句话要点

AI规划入门与综述:弥合AI子领域差距,促进自动化决策。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 人工智能规划 自动化决策 强化学习 马尔可夫决策过程 问题结构 知识表示 跨领域研究

📋 核心要点

  1. 现有强化学习等AI子领域在自动化决策方面存在信息孤岛,缺乏对AI规划领域已有知识的充分利用。
  2. 本文旨在提供AI规划领域的入门知识,并综述其最新技术,以促进不同AI子领域之间的知识共享与融合。
  3. 论文重点关注AI规划中利用问题结构来提升决策效率的方法,并探讨了从数据中学习规划策略的最新进展。

📝 摘要(中文)

自动化决策是人工智能中一个基础性的课题,它横跨多个子领域,包括强化学习(RL)、人工智能规划(AP)、基础模型和运筹学等。尽管最近有一些工作致力于“弥合”这些社区之间的差距,但仍然有很多见解尚未跨越这些界限。本文旨在对AP中广为人知,但在其他子领域中不太为人所知的思想进行简要而非详尽的入门介绍。我们首先介绍经典的AP问题和表示,以及通过马尔可夫决策过程形式化处理不确定性和时间的扩展。接下来,我们综述了解决AP问题的最先进技术和思想,重点关注它们利用问题结构的能力。最后,我们涵盖了AP中的子领域,用于从非结构化输入中学习结构,以及学习泛化到未见过的场景和情况。

🔬 方法详解

问题定义:论文旨在解决人工智能领域中自动化决策问题,特别是弥合人工智能规划(AP)与其他子领域(如强化学习)之间的知识鸿沟。现有方法往往各自为政,缺乏对彼此领域已有知识的有效利用,导致重复研究和效率低下。AP领域积累了大量关于问题结构利用的经验,但这些经验在其他领域并未得到充分重视。

核心思路:论文的核心思路是提供一个AI规划领域的入门教程和综述,将AP领域中成熟的理论、方法和技术介绍给其他子领域的研究人员,从而促进跨领域合作和知识共享。通过展示AP如何利用问题结构来提升决策效率,激发其他领域的研究人员借鉴和应用这些思想。

技术框架:论文的技术框架主要包括三个部分:首先,介绍经典的AP问题和表示,以及如何使用马尔可夫决策过程(MDP)来处理不确定性和时间因素。其次,综述解决AP问题的最先进技术和思想,重点关注它们如何利用问题结构。最后,介绍AP中用于从非结构化输入中学习结构,以及学习泛化到未见过的场景和情况的子领域。

关键创新:论文的关键创新在于其定位和目标,即不是提出一种新的算法或技术,而是作为一个知识桥梁,连接AP和其他AI子领域。通过系统地整理和介绍AP领域的知识,论文旨在促进跨领域合作,避免重复研究,并加速自动化决策领域的发展。

关键设计:论文的关键设计在于其内容的组织方式,从基础概念到高级技术,由浅入深,循序渐进。论文还特别强调了问题结构在AP中的重要性,并通过具体的例子和案例来展示如何利用问题结构来提升决策效率。此外,论文还涵盖了AP中用于学习的子领域,为其他领域的研究人员提供了进一步研究的方向。

📊 实验亮点

由于该论文为综述性质,因此没有具体的实验结果。其亮点在于系统性地总结了AI规划领域的知识,并强调了问题结构在决策中的重要性。该综述为其他AI子领域的研究人员提供了一个快速了解AI规划的入口,并为未来的跨领域研究奠定了基础。

🎯 应用场景

该研究成果可应用于各种需要自动化决策的领域,例如机器人导航、游戏AI、任务调度、资源管理等。通过将AI规划的理论和技术引入这些领域,可以提高决策效率、降低成本,并实现更智能化的自动化系统。未来,该研究有望促进通用人工智能的发展,使机器能够像人类一样进行复杂的规划和决策。

📄 摘要(原文)

Automated decision-making is a fundamental topic that spans multiple sub-disciplines in AI: reinforcement learning (RL), AI planning (AP), foundation models, and operations research, among others. Despite recent efforts to ``bridge the gaps'' between these communities, there remain many insights that have not yet transcended the boundaries. Our goal in this paper is to provide a brief and non-exhaustive primer on ideas well-known in AP, but less so in other sub-disciplines. We do so by introducing the classical AP problem and representation, and extensions that handle uncertainty and time through the Markov Decision Process formalism. Next, we survey state-of-the-art techniques and ideas for solving AP problems, focusing on their ability to exploit problem structure. Lastly, we cover subfields within AP for learning structure from unstructured inputs and learning to generalise to unseen scenarios and situations.