Push Anything: Single- and Multi-Object Pushing From First Sight with Contact-Implicit MPC

📄 arXiv: 2510.19974v1 📥 PDF

作者: Hien Bui, Yufeiyang Gao, Haoran Yang, Eric Cui, Siddhant Mody, Brian Acosta, Thomas Stephen Felix, Bibit Bianchini, Michael Posa

分类: cs.RO

发布日期: 2025-10-22

备注: Hien Bui, Yufeiyang Gao, and Haoran Yang contributed equally to this work

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

提出C3+算法,通过接触隐式MPC实现对多种物体的单/多目标精准推移操作。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 非抓取操作 接触隐式MPC 模型预测控制 多物体操作 机器人控制

📋 核心要点

  1. 现有非抓取操作方法难以应对物体属性未知和复杂接触交互,尤其是在多物体场景下。
  2. 提出C3+算法,增强接触隐式MPC,加速求解,实现对多种物体的精准推移控制。
  3. 实验结果表明,该系统在硬件上对33个物体实现了98%的成功率,显著提升了多物体操作效率。

📝 摘要(中文)

在机器人领域,对各种物体进行非抓取操作仍然是一个核心挑战,其难点在于物体物理属性的未知性和富含接触交互的复杂性。接触隐式模型预测控制(CI-MPC)通过将接触推理直接嵌入到轨迹优化中,在高效且稳健地解决该任务方面展现了潜力,但之前的演示仅限于精心策划的示例。本文通过精确的平面推移任务,展示了CI-MPC在各种物体几何形状上的广泛能力,包括多物体领域。这些场景需要对大量的物体间和物体-环境接触进行推理,以策略性地操纵和清理环境,这对于之前的CI-MPC方法来说是难以处理的挑战。为了实现这一点,我们引入了共识互补控制Plus(C3+),这是一种增强的CI-MPC算法,集成到一个完整的流程中,包括物体扫描、网格重建和硬件执行。与之前的C3相比,C3+实现了显著更快的求解时间,即使在多物体推移任务中也能实现实时性能。在硬件上,我们的系统在33个物体上实现了98%的总体成功率,并在严格的容差范围内达到了姿态目标。对于1、2、3和4个物体的任务,平均达到目标的时间分别约为0.5、1.6、3.2和5.3分钟。

🔬 方法详解

问题定义:论文旨在解决机器人非抓取操作中,由于物体物理属性未知和接触交互复杂性导致的,难以对多种物体进行精确推移操作的问题。现有接触隐式模型预测控制(CI-MPC)方法在处理少量、简单物体时表现良好,但在多物体、复杂几何形状的场景下,计算复杂度高,难以实现实时控制,并且对环境的适应性较差。

核心思路:论文的核心思路是改进CI-MPC算法,使其能够更高效地处理多物体间的复杂接触关系,从而实现对各种几何形状物体的精确推移控制。通过优化算法结构,降低计算复杂度,提高求解速度,使得CI-MPC能够应用于更复杂的场景。

技术框架:整体框架包含三个主要阶段:1) 物体扫描和网格重建,用于获取物体的几何信息;2) C3+算法,作为核心的轨迹优化器,根据物体信息和目标姿态生成推移轨迹;3) 硬件执行,将生成的轨迹发送给机器人进行实际的推移操作。C3+算法是整个流程的核心,负责在考虑物体间和物体与环境的接触约束下,优化机器人的运动轨迹。

关键创新:最重要的技术创新点在于C3+算法,它是对原有C3算法的改进。C3+通过改进互补松弛方法,显著降低了求解时间,使得CI-MPC能够应用于多物体推移任务。具体来说,C3+可能采用了更高效的线性求解器、更精确的接触模型或者更有效的优化策略,从而提高了算法的收敛速度和鲁棒性。

关键设计:论文中可能涉及的关键设计包括:接触模型的选择(例如,硬接触模型或软接触模型),互补松弛参数的设置,优化器的选择(例如,序列二次规划SQP),以及目标函数的构建(例如,最小化推移时间和控制力)。这些参数和设计直接影响着算法的性能和稳定性,需要根据具体的应用场景进行调整。

📊 实验亮点

实验结果表明,C3+算法在硬件上对33个不同几何形状的物体实现了98%的总体成功率,并在严格的容差范围内达到了姿态目标。对于1、2、3和4个物体的任务,平均达到目标的时间分别约为0.5、1.6、3.2和5.3分钟。与之前的C3算法相比,C3+显著降低了求解时间,实现了实时性能,尤其是在多物体推移任务中。

🎯 应用场景

该研究成果可应用于自动化仓库中的物体分拣、整理,以及家庭服务机器人中的物品清理、摆放等场景。通过提升机器人对未知物体的操作能力,可以降低人工成本,提高工作效率,并为机器人进入更广泛的应用领域奠定基础。未来,该技术有望应用于更复杂的环境,例如灾后救援、太空探索等。

📄 摘要(原文)

Non-prehensile manipulation of diverse objects remains a core challenge in robotics, driven by unknown physical properties and the complexity of contact-rich interactions. Recent advances in contact-implicit model predictive control (CI-MPC), with contact reasoning embedded directly in the trajectory optimization, have shown promise in tackling the task efficiently and robustly, yet demonstrations have been limited to narrowly curated examples. In this work, we showcase the broader capabilities of CI-MPC through precise planar pushing tasks over a wide range of object geometries, including multi-object domains. These scenarios demand reasoning over numerous inter-object and object-environment contacts to strategically manipulate and de-clutter the environment, challenges that were intractable for prior CI-MPC methods. To achieve this, we introduce Consensus Complementarity Control Plus (C3+), an enhanced CI-MPC algorithm integrated into a complete pipeline spanning object scanning, mesh reconstruction, and hardware execution. Compared to its predecessor C3, C3+ achieves substantially faster solve times, enabling real-time performance even in multi-object pushing tasks. On hardware, our system achieves overall 98% success rate across 33 objects, reaching pose goals within tight tolerances. The average time-to-goal is approximately 0.5, 1.6, 3.2, and 5.3 minutes for 1-, 2-, 3-, and 4-object tasks, respectively. Project page: https://dairlab.github.io/push-anything.