Trajectory Optimization Under Stochastic Dynamics Leveraging Maximum Mean Discrepancy

作者: Basant Sharma, Arun Kumar Singh

分类: cs.RO

发布日期: 2025-01-31 (更新: 2025-04-10)

备注: https://github.com/Basant1861/MPC-MMD

DOI: 10.1109/LRA.2025.3565335

💡 一句话要点

提出基于最大均值差异的轨迹优化方法，解决随机动态下风险感知导航问题

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 轨迹优化 随机动态 风险感知导航 最大均值差异 碰撞风险估计

📋 核心要点

现有基于扰动轨迹的风险感知导航方法，在碰撞检查代价高昂时，计算效率显著降低。
论文提出一种基于最大均值差异（MMD）的轨迹优化方法，从大量轨迹中提取关键统计信息，降低计算成本。
实验表明，该方法在低样本情况下，相比于基于条件风险价值（CVaR）的方法，能生成更安全的轨迹。

📝 摘要（中文）

本文提出了一种基于采样的轨迹优化方法，用于随机动态下的风险感知导航。该方法通过计算标称动态周围的 $\tilde{N}$ 个扰动轨迹来估计与控制命令序列相关的碰撞风险。我们考虑这样一种场景：使用扰动轨迹估计风险的代价很高，例如，由于碰撞检查的计算成本很高。本文提出了两个关键贡献。首先，我们开发了一种算法，将来自较大轨迹集合的统计信息提炼成一个样本量为 $N<<\tilde{N}$ 的缩减集。因此，我们仅使用 $N$ 个轨迹而不是 $\tilde{N}$ 个轨迹来估计碰撞风险。其次，我们为碰撞风险制定了一种新的替代方案，该方案可以利用缩减集中包含的提炼统计信息。我们使用再生核希尔伯特空间 (RKHS) 和最大均值差异 (MMD) 对这两种算法贡献进行了形式化。我们进行了广泛的基准测试，以证明我们基于 MMD 的方法在低样本状态下比使用基于条件风险价值 (CVaR) 的碰撞风险估计的现有基线产生更安全的轨迹。

🔬 方法详解

问题定义：论文旨在解决随机动态环境下，机器人轨迹优化中的风险感知导航问题。现有方法通常依赖于大量的轨迹采样来估计碰撞风险，但在碰撞检查计算成本高昂的情况下，这些方法变得非常低效。因此，如何在计算资源有限的情况下，准确估计和降低碰撞风险，是本文要解决的核心问题。

核心思路：论文的核心思路是利用最大均值差异（MMD）来提取和压缩轨迹集合中的统计信息。通过将大量的轨迹信息提炼成一个更小的、具有代表性的轨迹集合，从而降低碰撞风险估计的计算复杂度。同时，设计一种新的碰撞风险替代函数，能够有效利用提炼后的统计信息。

技术框架：该方法主要包含两个阶段：1) 轨迹信息提炼：使用MMD从大量的扰动轨迹中选择一个具有代表性的子集，该子集能够尽可能地保留原始轨迹集合的统计特性。2) 风险评估与轨迹优化：基于提炼后的轨迹子集，构建一个新的碰撞风险替代函数，并将其用于轨迹优化过程中，以生成更安全的轨迹。

关键创新：论文的关键创新在于将MMD引入到轨迹优化中，用于轨迹信息的提炼和压缩。与传统的基于蒙特卡洛采样的方法相比，MMD能够更有效地利用有限的样本，从而在低样本情况下实现更准确的风险评估。此外，论文还提出了一种新的碰撞风险替代函数，能够更好地利用提炼后的统计信息。

关键设计：论文使用高斯核函数作为MMD的核函数，用于度量不同轨迹集合之间的差异。在轨迹信息提炼阶段，通过最小化提炼后的轨迹子集与原始轨迹集合之间的MMD，来选择最具代表性的轨迹。在风险评估阶段，论文设计了一种基于提炼轨迹子集的碰撞风险替代函数，该函数能够有效地估计轨迹的碰撞概率。

🖼️ 关键图片

📊 实验亮点

实验结果表明，在低样本情况下，基于MMD的轨迹优化方法能够显著优于基于CVaR的基线方法。具体来说，在相同的计算资源下，该方法能够生成更安全的轨迹，降低碰撞风险。此外，该方法在不同复杂度的环境中都表现出良好的鲁棒性。

🎯 应用场景

该研究成果可应用于自动驾驶、机器人导航、航空航天等领域，尤其是在环境感知不确定性较高或计算资源受限的场景下。例如，在自动驾驶中，可以利用该方法在复杂交通环境中规划出更安全的行驶轨迹；在机器人导航中，可以帮助机器人在未知环境中避免碰撞。

📄 摘要（原文）

This paper addresses sampling-based trajectory optimization for risk-aware navigation under stochastic dynamics. Typically such approaches operate by computing $\tilde{N}$ perturbed rollouts around the nominal dynamics to estimate the collision risk associated with a sequence of control commands. We consider a setting where it is expensive to estimate risk using perturbed rollouts, for example, due to expensive collision-checks. We put forward two key contributions. First, we develop an algorithm that distills the statistical information from a larger set of rollouts to a reduced-set with sample size $N<<\tilde{N}$. Consequently, we estimate collision risk using just $N$ rollouts instead of $\tilde{N}$. Second, we formulate a novel surrogate for the collision risk that can leverage the distilled statistical information contained in the reduced-set. We formalize both algorithmic contributions using distribution embedding in Reproducing Kernel Hilbert Space (RKHS) and Maximum Mean Discrepancy (MMD). We perform extensive benchmarking to demonstrate that our MMD-based approach leads to safer trajectories at low sample regime than existing baselines using Conditional Value-at Risk (CVaR) based collision risk estimate.

Trajectory Optimization Under Stochastic Dynamics Leveraging Maximum Mean Discrepancy

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理