Cross-Entropy Optimization of Physically Grounded Task and Motion Plans

作者: Andreu Matoses Gimenez, Nils Wilde, Chris Pek, Javier Alonso-Mora

分类: cs.RO

发布日期: 2025-12-12

备注: Preprint

🔗 代码/项目: PROJECT_PAGE

💡 一句话要点

提出基于交叉熵优化的物理引擎驱动的任务与运动规划方法

🎯 匹配领域: 支柱一：机器人控制 (Robot Control) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 任务与运动规划 物理模拟 交叉熵优化 机器人控制 GPU并行计算

📋 核心要点

现有TAMP算法在处理复杂动力学和环境交互时存在不足，难以保证规划的可靠性和最优性。
该论文提出了一种基于GPU并行物理模拟和交叉熵优化的TAMP方法，显式考虑动力学和接触。
实验表明，该方法能够使机器人在复杂环境中利用环境几何形状完成物体操作任务。

📝 摘要（中文）

自主执行任务通常需要机器人规划高层离散动作和底层连续运动。以往的任务与运动规划（TAMP）算法主要关注计算性能、完备性或最优性，通过简化和抽象使问题易于处理。然而，这导致生成的计划可能无法考虑动力学或复杂接触，从而在需要物体操作时无法可靠地执行任务。此外，忽略底层控制器影响的方法可能无法为实际系统获得最优或可行的计划实现。本文研究了使用GPU并行化的物理模拟器来计算带有运动控制器的计划实现，显式地考虑动力学以及与环境的接触。使用交叉熵优化，我们对控制器的参数或动作进行采样，以获得低成本的解决方案。由于我们的方法使用与真实系统相同的控制器，因此机器人可以直接执行计算出的计划。我们在一系列任务中展示了我们的方法，在这些任务中，机器人能够利用环境的几何形状来移动物体。

🔬 方法详解

问题定义：现有的任务与运动规划（TAMP）算法通常为了计算效率而进行简化和抽象，忽略了动力学、复杂接触以及底层控制器的影响。这导致规划结果在实际机器人系统中难以可靠执行，或者无法达到最优性能。因此，需要一种能够显式考虑动力学和底层控制器的TAMP方法，以生成更可靠和高效的机器人运动规划。

核心思路：该论文的核心思路是利用物理引擎来模拟机器人与环境的交互，从而显式地考虑动力学和接触。通过GPU并行化物理引擎，可以快速评估大量候选计划的性能。然后，使用交叉熵优化算法来搜索最优的控制器参数，从而生成低成本的运动计划。这种方法能够保证生成的计划在实际机器人系统中可行，并且能够充分利用环境的几何形状。

技术框架：该方法的技术框架主要包括以下几个模块：1) 任务规划器：生成高层离散动作序列；2) 运动控制器：根据高层动作生成底层连续运动；3) 物理模拟器：使用GPU并行化物理引擎模拟机器人与环境的交互，评估计划的性能；4) 交叉熵优化器：根据物理模拟器的评估结果，优化运动控制器的参数。整个流程是：任务规划器生成候选计划，运动控制器生成对应的运动轨迹，物理模拟器评估轨迹的性能，交叉熵优化器根据评估结果更新控制器参数，重复迭代直到找到最优计划。

关键创新：该论文的关键创新在于将GPU并行化的物理模拟器与交叉熵优化算法相结合，用于任务与运动规划。这种方法能够显式地考虑动力学和接触，从而生成更可靠和高效的机器人运动计划。与传统的TAMP算法相比，该方法不需要进行过多的简化和抽象，能够更好地适应复杂的环境和任务。

关键设计：该方法的关键设计包括：1) 使用GPU并行化的物理引擎，例如Bullet或PhysX，以加速模拟过程；2) 设计合适的运动控制器，例如PID控制器或模型预测控制器，以实现精确的运动控制；3) 选择合适的交叉熵优化参数，例如采样数量、迭代次数和精英样本比例，以保证优化效果；4) 定义合适的成本函数，例如时间、能量或误差，以评估计划的性能。

🖼️ 关键图片

📊 实验亮点

论文通过实验验证了该方法在复杂环境中的有效性。实验结果表明，该方法能够使机器人在需要利用环境几何形状的物体操作任务中取得成功。具体而言，机器人能够通过与环境的接触来稳定物体，并完成复杂的运动规划。该方法生成的计划可以直接在真实机器人上执行，无需额外的调整。

🎯 应用场景

该研究成果可应用于各种需要复杂操作和环境交互的机器人任务，例如：工业自动化中的装配、搬运，家庭服务机器人中的物品整理、清洁，以及医疗机器人中的手术辅助等。通过显式考虑动力学和环境接触，可以提高机器人在复杂环境中的操作能力和可靠性，从而拓展机器人的应用范围。

📄 摘要（原文）

Autonomously performing tasks often requires robots to plan high-level discrete actions and continuous low-level motions to realize them. Previous TAMP algorithms have focused mainly on computational performance, completeness, or optimality by making the problem tractable through simplifications and abstractions. However, this comes at the cost of the resulting plans potentially failing to account for the dynamics or complex contacts necessary to reliably perform the task when object manipulation is required. Additionally, approaches that ignore effects of the low-level controllers may not obtain optimal or feasible plan realizations for the real system. We investigate the use of a GPU-parallelized physics simulator to compute realizations of plans with motion controllers, explicitly accounting for dynamics, and considering contacts with the environment. Using cross-entropy optimization, we sample the parameters of the controllers, or actions, to obtain low-cost solutions. Since our approach uses the same controllers as the real system, the robot can directly execute the computed plans. We demonstrate our approach for a set of tasks where the robot is able to exploit the environment's geometry to move an object. Website and code: https://andreumatoses.github.io/research/parallel-realization

Cross-Entropy Optimization of Physically Grounded Task and Motion Plans

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理