Trajectory Optimization Under Stochastic Dynamics Leveraging Maximum Mean Discrepancy

📄 arXiv: 2501.19045v2 📥 PDF

作者: Basant Sharma, Arun Kumar Singh

分类: cs.RO

发布日期: 2025-01-31 (更新: 2025-04-10)

备注: https://github.com/Basant1861/MPC-MMD

DOI: 10.1109/LRA.2025.3565335


💡 一句话要点

提出基于最大均值差异的轨迹优化方法,解决随机动态下风险感知导航问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 轨迹优化 随机动态 风险感知导航 最大均值差异 碰撞风险估计

📋 核心要点

  1. 现有基于扰动轨迹的风险感知导航方法,在碰撞检查代价高昂时,计算效率显著降低。
  2. 论文提出一种基于最大均值差异(MMD)的轨迹优化方法,从大量轨迹中提取关键统计信息,降低计算成本。
  3. 实验表明,该方法在低样本情况下,相比于基于条件风险价值(CVaR)的方法,能生成更安全的轨迹。

📝 摘要(中文)

本文提出了一种基于采样的轨迹优化方法,用于随机动态下的风险感知导航。该方法通过计算标称动态周围的 $\tilde{N}$ 个扰动轨迹来估计与控制命令序列相关的碰撞风险。我们考虑这样一种场景:使用扰动轨迹估计风险的代价很高,例如,由于碰撞检查的计算成本很高。本文提出了两个关键贡献。首先,我们开发了一种算法,将来自较大轨迹集合的统计信息提炼成一个样本量为 $N<<\tilde{N}$ 的缩减集。因此,我们仅使用 $N$ 个轨迹而不是 $\tilde{N}$ 个轨迹来估计碰撞风险。其次,我们为碰撞风险制定了一种新的替代方案,该方案可以利用缩减集中包含的提炼统计信息。我们使用再生核希尔伯特空间 (RKHS) 和最大均值差异 (MMD) 对这两种算法贡献进行了形式化。我们进行了广泛的基准测试,以证明我们基于 MMD 的方法在低样本状态下比使用基于条件风险价值 (CVaR) 的碰撞风险估计的现有基线产生更安全的轨迹。

🔬 方法详解

问题定义:论文旨在解决随机动态环境下,机器人轨迹优化中的风险感知导航问题。现有方法通常依赖于大量的轨迹采样来估计碰撞风险,但在碰撞检查计算成本高昂的情况下,这些方法变得非常低效。因此,如何在计算资源有限的情况下,准确估计和降低碰撞风险,是本文要解决的核心问题。

核心思路:论文的核心思路是利用最大均值差异(MMD)来提取和压缩轨迹集合中的统计信息。通过将大量的轨迹信息提炼成一个更小的、具有代表性的轨迹集合,从而降低碰撞风险估计的计算复杂度。同时,设计一种新的碰撞风险替代函数,能够有效利用提炼后的统计信息。

技术框架:该方法主要包含两个阶段:1) 轨迹信息提炼:使用MMD从大量的扰动轨迹中选择一个具有代表性的子集,该子集能够尽可能地保留原始轨迹集合的统计特性。2) 风险评估与轨迹优化:基于提炼后的轨迹子集,构建一个新的碰撞风险替代函数,并将其用于轨迹优化过程中,以生成更安全的轨迹。

关键创新:论文的关键创新在于将MMD引入到轨迹优化中,用于轨迹信息的提炼和压缩。与传统的基于蒙特卡洛采样的方法相比,MMD能够更有效地利用有限的样本,从而在低样本情况下实现更准确的风险评估。此外,论文还提出了一种新的碰撞风险替代函数,能够更好地利用提炼后的统计信息。

关键设计:论文使用高斯核函数作为MMD的核函数,用于度量不同轨迹集合之间的差异。在轨迹信息提炼阶段,通过最小化提炼后的轨迹子集与原始轨迹集合之间的MMD,来选择最具代表性的轨迹。在风险评估阶段,论文设计了一种基于提炼轨迹子集的碰撞风险替代函数,该函数能够有效地估计轨迹的碰撞概率。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,在低样本情况下,基于MMD的轨迹优化方法能够显著优于基于CVaR的基线方法。具体来说,在相同的计算资源下,该方法能够生成更安全的轨迹,降低碰撞风险。此外,该方法在不同复杂度的环境中都表现出良好的鲁棒性。

🎯 应用场景

该研究成果可应用于自动驾驶、机器人导航、航空航天等领域,尤其是在环境感知不确定性较高或计算资源受限的场景下。例如,在自动驾驶中,可以利用该方法在复杂交通环境中规划出更安全的行驶轨迹;在机器人导航中,可以帮助机器人在未知环境中避免碰撞。

📄 摘要(原文)

This paper addresses sampling-based trajectory optimization for risk-aware navigation under stochastic dynamics. Typically such approaches operate by computing $\tilde{N}$ perturbed rollouts around the nominal dynamics to estimate the collision risk associated with a sequence of control commands. We consider a setting where it is expensive to estimate risk using perturbed rollouts, for example, due to expensive collision-checks. We put forward two key contributions. First, we develop an algorithm that distills the statistical information from a larger set of rollouts to a reduced-set with sample size $N<<\tilde{N}$. Consequently, we estimate collision risk using just $N$ rollouts instead of $\tilde{N}$. Second, we formulate a novel surrogate for the collision risk that can leverage the distilled statistical information contained in the reduced-set. We formalize both algorithmic contributions using distribution embedding in Reproducing Kernel Hilbert Space (RKHS) and Maximum Mean Discrepancy (MMD). We perform extensive benchmarking to demonstrate that our MMD-based approach leads to safer trajectories at low sample regime than existing baselines using Conditional Value-at Risk (CVaR) based collision risk estimate.