PushingBots: Collaborative Pushing via Neural Accelerated Combinatorial Hybrid Optimization

📄 arXiv: 2511.15995v1 📥 PDF

作者: Zili Tang, Ying Zhang, Meng Guo

分类: cs.RO

发布日期: 2025-11-20

备注: 20 pages, 24 figures. Accepted to IEEE Transactions on Robotics (T-RO), 2025


💡 一句话要点

提出基于神经加速组合混合优化的多机器人协同推箱方法,解决复杂环境下的物体搬运问题。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 多机器人系统 协同推动 组合优化 混合控制 神经加速 机器人规划 非抓取操作

📋 核心要点

  1. 现有方法通常假设预定义的推动模式和固定形状的物体,难以应对复杂环境和任意形状物体的协同推动任务。
  2. 提出一种基于神经加速组合混合优化的方法,通过分解任务、优化推动模式序列和混合控制来实现多机器人协同推动。
  3. 在模拟和硬件实验中验证了该方法的效率和有效性,并推广到异构机器人、平面组装和6D推动等场景。

📝 摘要(中文)

本文研究了控制机器人集群在复杂环境中协同推动多个任意形状物体到达各自目标位置的问题,这些物体周围存在杂乱且可移动的障碍物。该问题面临多机器人系统的挑战,如成本和持续时间存在较大不确定性下的在线任务协调;以及富接触任务的挑战,如不同接触模式之间的混合切换和受约束接触力导致的欠驱动。本文提出一种基于组合混合优化的方法,通过动态任务分配和基于一系列推动模式及相关力的混合执行来实现。该方法包含三个主要组成部分:(I)将推动子任务分解、排序和滚动分配给机器人子群;(II)通过关键帧引导的混合搜索,优化每个子任务的参数化推动模式序列;(III)混合控制,用于执行这些模式并在它们之间转换。最后,采用基于扩散的加速器来预测在混合搜索期间应优先考虑的关键帧和推动模式,从而进一步提高规划效率。在温和的假设下,该框架是完整的。在模拟和硬件实验中,以及推广到异构机器人、平面组装和6D推动中,验证了其在不同数量的机器人和通用形状物体下的效率和有效性。

🔬 方法详解

问题定义:论文旨在解决多机器人协同推动多个任意形状物体到目标位置的问题,尤其是在复杂、拥挤且存在可移动障碍物的环境中。现有方法的痛点在于通常依赖预定义的推动模式和固定形状的物体,无法很好地处理复杂环境和不规则物体的推动任务,同时缺乏对任务分配和混合控制的有效优化。

核心思路:论文的核心思路是将复杂的协同推动任务分解为一系列子任务,然后通过组合混合优化来寻找最优的推动模式序列。这种方法允许机器人根据环境和物体形状动态调整推动策略,并通过神经加速器来提高搜索效率。通过任务分解和优化,解决复杂环境下的协同推动问题。

技术框架:该方法包含三个主要模块:(1) 任务分解、排序和分配:将整体推动任务分解为子任务,并分配给不同的机器人子群。(2) 关键帧引导的混合搜索:利用关键帧引导,优化每个子任务的推动模式序列。(3) 混合控制:执行优化的推动模式,并在不同模式之间平滑过渡。此外,还使用基于扩散的加速器来预测关键帧和推动模式,以提高规划效率。

关键创新:该方法最重要的创新点在于将神经加速器与组合混合优化相结合,用于解决多机器人协同推动问题。传统的组合优化方法计算量大,难以实时应用。通过引入神经加速器,可以预测有希望的关键帧和推动模式,从而显著减少搜索空间,提高规划效率。这种神经加速的组合优化方法是与现有方法的本质区别。

关键设计:论文采用扩散模型作为神经加速器,用于预测关键帧和推动模式。具体来说,扩散模型学习了推动任务的潜在空间表示,并能够根据当前状态生成可能的下一步动作。在混合搜索过程中,优先考虑扩散模型预测的动作,从而加速搜索过程。此外,论文还设计了混合控制策略,以确保在不同推动模式之间平滑过渡,避免因突然切换而导致的不稳定。

📊 实验亮点

论文通过仿真和硬件实验验证了该方法的有效性。在仿真实验中,该方法在不同数量的机器人和通用形状物体下均表现出良好的性能。硬件实验表明,该方法能够成功地控制机器人集群协同推动物体到达目标位置。此外,该方法还推广到异构机器人、平面组装和6D推动等场景,进一步验证了其泛化能力。

🎯 应用场景

该研究成果可应用于自动化仓库、物流运输、建筑工地等场景,实现多机器人协同搬运大型或不规则形状的物体。例如,在自动化仓库中,多个机器人可以协同推动大型货物托盘,提高搬运效率和空间利用率。此外,该技术还可用于灾难救援,机器人协同清理障碍物,为救援人员开辟通道。

📄 摘要(原文)

Many robots are not equipped with a manipulator and many objects are not suitable for prehensile manipulation (such as large boxes and cylinders). In these cases, pushing is a simple yet effective non-prehensile skill for robots to interact with and further change the environment. Existing work often assumes a set of predefined pushing modes and fixed-shape objects. This work tackles the general problem of controlling a robotic fleet to push collaboratively numerous arbitrary objects to respective destinations, within complex environments of cluttered and movable obstacles. It incorporates several characteristic challenges for multi-robot systems such as online task coordination under large uncertainties of cost and duration, and for contact-rich tasks such as hybrid switching among different contact modes, and under-actuation due to constrained contact forces. The proposed method is based on combinatorial hybrid optimization over dynamic task assignments and hybrid execution via sequences of pushing modes and associated forces. It consists of three main components: (I) the decomposition, ordering and rolling assignment of pushing subtasks to robot subgroups; (II) the keyframe guided hybrid search to optimize the sequence of parameterized pushing modes for each subtask; (III) the hybrid control to execute these modes and transit among them. Last but not least, a diffusion-based accelerator is adopted to predict the keyframes and pushing modes that should be prioritized during hybrid search; and further improve planning efficiency. The framework is complete under mild assumptions. Its efficiency and effectiveness under different numbers of robots and general-shaped objects are validated extensively in simulations and hardware experiments, as well as generalizations to heterogeneous robots, planar assembly and 6D pushing.