Learning Maximal Safe Sets Using Hypernetworks for MPC-based Local Trajectory Planning in Unknown Environments
作者: Bojan Derajić, Mohamed-Khalil Bouzidi, Sebastian Bernhard, Wolfgang Hönig
分类: cs.RO, cs.LG, eess.SY
发布日期: 2024-10-26 (更新: 2025-07-07)
💡 一句话要点
提出基于超网络的MPC局部轨迹规划方法,用于未知环境下的最大安全集学习。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 模型预测控制 安全集学习 超网络 轨迹规划 Hamilton-Jacobi可达性
📋 核心要点
- 现有方法在未知环境中进行局部轨迹规划时,难以保证安全性和实时性,尤其是在复杂动力学和约束条件下。
- 利用超网络学习最大安全集,并将其作为MPC的终端约束,从而提高规划的递归可行性和安全性。
- 实验结果表明,该方法在仿真和真实机器人上均表现出优越的性能,成功率显著提高,且保持了实时性。
📝 摘要(中文)
本文提出了一种基于学习的新方法,用于在线估计未知静态环境中局部轨迹规划的最大安全集。该方法使用神经网络表示集合,并将其作为模型预测控制(MPC)局部规划器的终端集约束,从而提高递归可行性和安全性。为了实现实时性能和期望的泛化性能,我们采用了超网络的概念。在训练过程中,我们使用Hamilton-Jacobi(HJ)可达性分析作为监督来源,从而能够考虑一般的非线性动力学和任意约束。通过在不同环境和机器人动力学的仿真中,将所提出的方法与相关的基线方法进行了广泛的评估。结果表明,与最佳基线相比,成功率提高了高达52%,同时保持了相当的执行速度。此外,我们将提出的方法NTC-MPC部署在物理机器人上,并展示了其在基线方法失败的情况下安全避开障碍物的能力。
🔬 方法详解
问题定义:在未知静态环境中,如何快速准确地估计机器人的最大安全集,并将其用于局部轨迹规划,以保证机器人的安全性和规划效率?现有方法通常依赖于保守的假设或计算复杂度高的算法,难以满足实时性和安全性的要求。
核心思路:利用神经网络学习最大安全集的表示,并将其作为MPC的终端约束。通过离线训练,神经网络可以学习到环境和机器人动力学的先验知识,从而实现快速在线估计。超网络的使用进一步提高了模型的泛化能力和实时性。
技术框架:该方法主要包含两个阶段:离线训练阶段和在线规划阶段。在离线训练阶段,使用Hamilton-Jacobi(HJ)可达性分析生成训练数据,并训练超网络。超网络输出目标网络的权重,目标网络用于预测给定状态是否属于安全集。在线规划阶段,使用训练好的超网络生成目标网络,并将目标网络预测的安全集作为MPC的终端约束进行轨迹规划。
关键创新:1. 使用神经网络表示安全集,实现了对复杂形状安全集的有效建模。2. 采用超网络结构,提高了模型的泛化能力和实时性。3. 使用Hamilton-Jacobi(HJ)可达性分析作为监督信号,能够处理一般的非线性动力学和任意约束。
关键设计:1. 超网络结构:超网络接收环境信息作为输入,输出目标网络的权重。目标网络接收机器人状态作为输入,输出该状态是否属于安全集的概率。2. 损失函数:损失函数包括两部分:一部分是基于HJ可达性分析的监督损失,另一部分是正则化项,用于防止过拟合。3. MPC设计:MPC使用神经网络预测的安全集作为终端约束,优化目标包括轨迹平滑性和与目标点的距离。
🖼️ 关键图片
📊 实验亮点
实验结果表明,与现有的基线方法相比,该方法在仿真环境中成功率提高了高达52%,同时保持了相当的执行速度。在真实机器人实验中,该方法也能够安全地避开障碍物,并在基线方法失败的情况下成功完成任务。这些结果验证了该方法在未知环境中进行安全轨迹规划的有效性和优越性。
🎯 应用场景
该方法可应用于各种需要在未知或动态环境中进行安全轨迹规划的机器人系统,例如无人机、自动驾驶汽车、移动机器人等。通过学习环境的先验知识,该方法可以提高机器人在复杂环境中的导航能力和安全性,降低碰撞风险,并提高任务完成效率。未来,该方法可以进一步扩展到动态环境和多智能体系统。
📄 摘要(原文)
This paper presents a novel learning-based approach for online estimation of maximal safe sets for local trajectory planning in unknown static environments. The neural representation of a set is used as the terminal set constraint for a model predictive control (MPC) local planner, resulting in improved recursive feasibility and safety. To achieve real-time performance and desired generalization properties, we employ the idea of hypernetworks. We use the Hamilton-Jacobi (HJ) reachability analysis as the source of supervision during the training process, allowing us to consider general nonlinear dynamics and arbitrary constraints. The proposed method is extensively evaluated against relevant baselines in simulations for different environments and robot dynamics. The results show an increase in success rate of up to 52% compared to the best baseline while maintaining comparable execution speed. Additionally, we deploy our proposed method, NTC-MPC, on a physical robot and demonstrate its ability to safely avoid obstacles in scenarios where the baselines fail.