Residual Neural Terminal Constraint for MPC-based Collision Avoidance in Dynamic Environments

作者: Bojan Derajić, Mohamed-Khalil Bouzidi, Sebastian Bernhard, Wolfgang Hönig

分类: cs.RO, cs.LG, eess.SY

发布日期: 2025-08-05 (更新: 2025-08-28)

💡 一句话要点

提出混合MPC局部规划器以解决动态环境中的碰撞避免问题

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 模型预测控制 碰撞避免 动态环境 神经网络 安全集 哈密顿-雅可比分析 实时规划

📋 核心要点

现有方法在动态环境中进行碰撞避免时，实时计算安全集的难度较大，限制了其应用效果。
本文提出了一种基于学习的近似方法，通过神经网络建模残差函数，结合SDF实现实时安全集估计。
实验结果表明，所提方法在成功率上比最佳基线高出30%，且计算开销与现有方法相当。

📝 摘要（中文）

本文提出了一种混合模型预测控制（MPC）局部规划器，该规划器利用基于学习的时间变化安全集近似，并将其作为MPC终端约束。该安全集可表示为通过哈密顿-雅可比（HJ）可达性分析计算的值函数的零超水平集，尽管实时计算该值函数是不可行的。我们利用HJ值函数可以表示为相应符号距离函数（SDF）与非负残差函数的差的特性。残差部分被建模为具有非负输出的神经网络，并从计算出的SDF中减去，从而得到实时值函数估计，设计上至少与SDF同样安全。此外，我们通过超网络对神经残差进行参数化，以提高实时性能和泛化能力。与三种最先进的方法进行比较，所提方法在仿真和硬件实验中实现了高达30%的成功率提升，同时计算开销相似，并产生高质量（低旅行时间）解决方案。

🔬 方法详解

问题定义：本文旨在解决动态环境中碰撞避免的实时规划问题。现有方法在计算安全集时面临实时性不足的挑战，导致无法有效应对环境变化。

核心思路：论文提出通过神经网络建模残差函数，结合符号距离函数（SDF）来近似安全集，从而实现实时的值函数估计。这种设计确保了安全性，同时提高了计算效率。

技术框架：整体架构包括三个主要模块：首先，通过局部观察获取环境信息；其次，利用神经网络对残差函数进行建模；最后，将残差从SDF中减去，得到实时的安全集近似。

关键创新：最重要的技术创新在于将神经网络与SDF结合，形成了一种新的安全集近似方法。这一方法在设计上确保了安全性，并且在实时性上优于传统的HJ分析方法。

关键设计：在网络结构上，残差函数被设计为非负输出，并通过超网络进行参数化，以提升模型的实时性能和泛化能力。损失函数的设计确保了输出的有效性与安全性。

📊 实验亮点

实验结果显示，所提方法在成功率上比最佳基线高出30%，同时在计算开销上与现有方法相当，且能够生成高质量的低旅行时间解决方案。这些结果表明该方法在动态环境中的有效性和优越性。

🎯 应用场景

该研究的潜在应用领域包括自动驾驶、机器人导航和无人机飞行等动态环境中的碰撞避免任务。通过提高实时规划的安全性和效率，能够显著提升这些系统在复杂环境中的表现，具有重要的实际价值和未来影响。

📄 摘要（原文）

In this paper, we propose a hybrid MPC local planner that uses a learning-based approximation of a time-varying safe set, derived from local observations and applied as the MPC terminal constraint. This set can be represented as a zero-superlevel set of the value function computed via Hamilton-Jacobi (HJ) reachability analysis, which is infeasible in real-time. We exploit the property that the HJ value function can be expressed as a difference of the corresponding signed distance function (SDF) and a non-negative residual function. The residual component is modeled as a neural network with non-negative output and subtracted from the computed SDF, resulting in a real-time value function estimate that is at least as safe as the SDF by design. Additionally, we parametrize the neural residual by a hypernetwork to improve real-time performance and generalization properties. The proposed method is compared with three state-of-the-art methods in simulations and hardware experiments, achieving up to 30\% higher success rates compared to the best baseline while requiring a similar computational effort and producing high-quality (low travel-time) solutions.

Residual Neural Terminal Constraint for MPC-based Collision Avoidance in Dynamic Environments

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册