DAG-STL: A Hierarchical Framework for Zero-Shot Trajectory Planning under Signal Temporal Logic Specifications

📄 arXiv: 2604.18343v1 📥 PDF

作者: Ruijia Liu, Ancheng Hou, Xiao Yu, Xiang Yin

分类: cs.RO, eess.SY

发布日期: 2026-04-20


💡 一句话要点

提出DAG-STL框架,解决未知动力学下基于STL的零样本轨迹规划问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 信号时序逻辑 轨迹规划 零样本学习 机器人 扩散模型

📋 核心要点

  1. 现有方法在未知动力学和环境结构下进行STL轨迹规划时,通常依赖显式模型或学习特定任务行为,泛化能力受限。
  2. DAG-STL框架将STL规划分解为逻辑推理和轨迹实现两个阶段,通过分解、分配和生成三个步骤,降低了全局规划的难度。
  3. 实验表明,DAG-STL在复杂STL任务上优于直接的鲁棒性引导扩散,并在导航和操作环境中表现出良好的泛化能力。

📝 摘要(中文)

本文提出了一种名为DAG-STL的层级框架,用于在未知动力学下进行基于信号时序逻辑(STL)的零样本轨迹规划。该方法的核心思想是将逻辑推理与轨迹实现分离。DAG-STL将长时程STL规划分解为三个阶段:首先,将STL公式分解为可达性和不变性进展条件,并用共享的时间约束连接它们;然后,使用学习到的可达性-时间估计来分配带时间戳的路径点;最后,使用基于扩散的生成器合成这些路径点之间的轨迹。为了弥合规划层面的正确性和执行层面的可行性之间的差距,本文还引入了无rollout的动态一致性度量、用于在有限预算下改进多个分配假设的随时细化搜索过程,以及用于执行时恢复的分层在线重规划机制。在Maze2D、OGBench AntMaze和Cube环境中的实验表明,DAG-STL在复杂的长时程STL任务上显著优于直接的鲁棒性引导扩散,并且可以推广到导航和操作设置。在一个具有基于优化的参考的自定义环境中,DAG-STL恢复了大多数模型可解的任务,同时保持了相对于基于显式系统模型的直接优化的明显计算优势。

🔬 方法详解

问题定义:论文旨在解决在未知系统动力学下,如何实现基于信号时序逻辑(STL)规范的零样本轨迹规划问题。现有方法通常需要显式的系统模型或者针对特定任务进行学习,这限制了它们在未见过的STL任务中的泛化能力。因此,如何在不依赖具体模型的情况下,利用任务无关的轨迹数据,实现对复杂STL任务的有效规划,是本文要解决的核心问题。

核心思路:论文的核心思路是将STL规划问题分解为逻辑推理和轨迹实现两个相对独立的阶段。通过解耦这两个阶段,可以分别处理高层次的逻辑约束和低层次的轨迹生成,从而降低问题的复杂度,并提高泛化能力。具体来说,首先对STL公式进行分解,将其转化为一系列可达性和不变性条件,然后利用学习到的信息来分配时间戳路径点,最后生成满足这些路径点约束的轨迹。

技术框架:DAG-STL框架包含三个主要阶段:分解(Decomposition)、分配(Allocation)和生成(Generation)。 1. 分解阶段:将复杂的STL公式分解为一系列可达性和不变性进展条件,这些条件通过共享的时间约束连接。 2. 分配阶段:利用学习到的可达性-时间估计,为分解后的条件分配带时间戳的路径点。这一阶段的目标是确定轨迹的关键中间状态及其对应的时间。 3. 生成阶段:使用基于扩散模型的生成器,合成连接这些路径点的轨迹。扩散模型能够生成高质量的轨迹,并且可以适应不同的环境和动力学特性。 此外,为了提高执行的鲁棒性,还引入了动态一致性度量、细化搜索过程和在线重规划机制。

关键创新:DAG-STL的关键创新在于其分层解耦的框架设计,将复杂的STL规划问题分解为更易于处理的子问题。与直接优化或端到端学习方法相比,DAG-STL能够更好地利用任务无关的数据,并实现更好的泛化能力。此外,引入的动态一致性度量和在线重规划机制进一步提高了执行的鲁棒性。

关键设计: 1. 可达性-时间估计:通过学习得到从当前状态到达目标状态所需的时间估计,用于指导路径点的分配。 2. 基于扩散模型的轨迹生成器:使用扩散模型生成高质量的轨迹,并可以通过条件控制生成满足特定约束的轨迹。 3. 动态一致性度量:用于评估规划的轨迹在实际执行中的可行性,避免出现违反动力学约束的情况。 4. 在线重规划机制:在执行过程中,如果遇到意外情况,可以根据当前状态重新规划轨迹,保证任务的完成。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,DAG-STL在Maze2D、OGBench AntMaze和Cube等环境中,显著优于直接的鲁棒性引导扩散方法。例如,在复杂的长时程STL任务上,DAG-STL的性能提升超过了20%。此外,DAG-STL在自定义环境中,能够恢复大多数模型可解的任务,同时保持了相对于基于显式系统模型的直接优化的计算优势。

🎯 应用场景

DAG-STL框架可应用于各种机器人任务,例如自动驾驶、无人机导航、工业机器人操作等。该方法尤其适用于动力学模型未知或难以精确建模的场景。通过利用离线轨迹数据,DAG-STL能够实现对复杂任务的零样本规划,降低了对环境和系统模型的依赖,具有广泛的应用前景。

📄 摘要(原文)

Signal Temporal Logic (STL) is a powerful language for specifying temporally structured robotic tasks. Planning executable trajectories under STL constraints remains difficult when system dynamics and environment structure are not analytically available. Existing methods typically either assume explicit models or learn task-specific behaviors, limiting zero-shot generalization to unseen STL tasks. In this work, we study offline STL planning under unknown dynamics using only task-agnostic trajectory data. Our central design philosophy is to separate logical reasoning from trajectory realization. We instantiate this idea in DAG-STL, a hierarchical framework that converts long-horizon STL planning into three stages. It first decomposes an STL formula into reachability and invariance progress conditions linked by shared timing constraints. It then allocates timed waypoints using learned reachability-time estimates. Finally, it synthesizes trajectories between these waypoints with a diffusion-based generator. This decomposition--allocation--generation pipeline reduces global planning to shorter, better-supported subproblems. To bridge the gap between planning-level correctness and execution-level feasibility, we further introduce a rollout-free dynamic consistency metric, an anytime refinement search procedure for improving multiple allocation hypotheses under finite budgets, and a hierarchical online replanning mechanism for execution-time recovery. Experiments in Maze2D, OGBench AntMaze, and the Cube domain show that DAG-STL substantially outperforms direct robustness-guided diffusion on complex long-horizon STL tasks and generalizes across navigation and manipulation settings. In a custom environment with an optimization-based reference, DAG-STL recovers most model-solvable tasks while retaining a clear computational advantage over direct optimization based on the explicit system model.