ALORE: Autonomous Large-Object Rearrangement with a Legged Manipulator

📄 arXiv: 2602.04214v1 📥 PDF

作者: Zhihai Bi, Yushan Zhang, Kai Chen, Guoyang Zhao, Yulin Li, Jun Ma

分类: cs.RO

发布日期: 2026-02-04

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

ALORE:基于腿式机器人的自主大型物体重排系统,提升复杂环境下的操作效率。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 腿式机器人 物体重排 强化学习 分层控制 任务规划 运动规划 自主导航

📋 核心要点

  1. 现有方法难以应对复杂环境下多样化大型物体的重排任务,尤其是在保证无碰撞的 locomotion-manipulation 方面存在挑战。
  2. ALORE系统采用分层强化学习,结合统一交互配置表示和物体速度估计器,实现对多样物体的精确速度控制。
  3. 实验结果表明,ALORE在策略泛化、物体速度跟踪精度和多物体重排效率方面优于现有方法,并在真实环境中成功完成复杂重排任务。

📝 摘要(中文)

本文提出了一种名为ALORE的自主大型物体重排系统,该系统使用腿式机器人,旨在减轻人工搬运大型重物的负担。该系统具备以下特点:(i)一种用于多物体环境学习的分层强化学习训练流程,其中高级物体速度控制器在低级全身控制器的基础上进行训练,以实现跨多个物体的有效和稳定的联合学习;(ii)两个关键模块,即统一的交互配置表示和物体速度估计器,使单个策略能够精确地调节各种物体的平面速度;(iii)一个任务和运动规划框架,该框架联合优化物体访问顺序和物体到目标的分配,从而提高任务效率并支持在线重规划。与强大的基线相比,该系统在策略泛化、物体速度跟踪精度和多物体重排效率方面表现出持续的优越性。通过系统的模块评估、仿真和真实世界实验,验证了整个系统的鲁棒性和有效性。该系统成功完成了8个连续循环,在近40分钟内重排了32把椅子,且没有发生一次失败,并在大约40米的路线内执行了长距离自主重排。该开源软件包可在https://zhihaibi.github.io/Alore/ 获取。

🔬 方法详解

问题定义:论文旨在解决腿式机器人自主重排大型物体的问题,现有方法在处理多样化物体、复杂环境以及保证locomotion-manipulation过程中的无碰撞方面存在不足。痛点在于难以实现高效、稳定且泛化性强的控制策略,以及难以进行有效的任务和运动规划。

核心思路:论文的核心思路是采用分层强化学习框架,将复杂的重排任务分解为高级的物体速度控制和低级的全身运动控制。通过统一的交互配置表示和物体速度估计器,使机器人能够适应不同物体的操作。同时,结合任务和运动规划,优化物体访问顺序和目标分配,提高整体效率。

技术框架:ALORE系统的整体框架包括以下几个主要模块: 1. 分层强化学习训练流程:包括高级物体速度控制器和低级全身控制器。 2. 统一交互配置表示:用于描述机器人与不同物体之间的交互关系。 3. 物体速度估计器:用于估计物体的运动状态。 4. 任务和运动规划框架:用于优化物体访问顺序和目标分配。

关键创新:该论文的关键创新在于以下几点: 1. 分层强化学习:通过分层控制,降低了学习难度,提高了控制策略的稳定性和泛化性。 2. 统一交互配置表示:使得机器人能够处理多种不同形状和尺寸的物体。 3. 任务和运动规划的联合优化:提高了任务的整体效率。

关键设计: 1. 高级物体速度控制器:采用强化学习算法(具体算法未知)进行训练,目标是控制物体的平面速度。 2. 低级全身控制器:负责机器人的全身运动控制,保证机器人的稳定性和平衡性。 3. 损失函数设计:损失函数的设计需要考虑物体速度跟踪精度、机器人运动的平滑性以及避免碰撞等因素。(具体损失函数形式未知) 4. 网络结构设计:高级和低级控制器的网络结构需要根据具体任务进行设计。(具体网络结构未知)

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

ALORE系统在仿真和真实世界实验中表现出色。在真实世界实验中,该系统成功完成了8个连续循环,在近40分钟内重排了32把椅子,且没有发生一次失败。此外,该系统还在大约40米的路线内执行了长距离自主重排。实验结果表明,ALORE系统在策略泛化、物体速度跟踪精度和多物体重排效率方面优于现有方法。

🎯 应用场景

ALORE系统在仓储物流、家庭服务、建筑工地等领域具有广泛的应用前景。它可以用于自主搬运家具、货物等大型物体,减轻人工劳动强度,提高工作效率。此外,该系统还可以应用于灾难救援等特殊场景,帮助救援人员搬运障碍物,提高救援效率。未来,该技术有望进一步发展,实现更加智能和灵活的物体重排。

📄 摘要(原文)

Endowing robots with the ability to rearrange various large and heavy objects, such as furniture, can substantially alleviate human workload. However, this task is extremely challenging due to the need to interact with diverse objects and efficiently rearrange multiple objects in complex environments while ensuring collision-free loco-manipulation. In this work, we present ALORE, an autonomous large-object rearrangement system for a legged manipulator that can rearrange various large objects across diverse scenarios. The proposed system is characterized by three main features: (i) a hierarchical reinforcement learning training pipeline for multi-object environment learning, where a high-level object velocity controller is trained on top of a low-level whole-body controller to achieve efficient and stable joint learning across multiple objects; (ii) two key modules, a unified interaction configuration representation and an object velocity estimator, that allow a single policy to regulate planar velocity of diverse objects accurately; and (iii) a task-and-motion planning framework that jointly optimizes object visitation order and object-to-target assignment, improving task efficiency while enabling online replanning. Comparisons against strong baselines show consistent superiority in policy generalization, object-velocity tracking accuracy, and multi-object rearrangement efficiency. Key modules are systematically evaluated, and extensive simulations and real-world experiments are conducted to validate the robustness and effectiveness of the entire system, which successfully completes 8 continuous loops to rearrange 32 chairs over nearly 40 minutes without a single failure, and executes long-distance autonomous rearrangement over an approximately 40 m route. The open-source packages are available at https://zhihaibi.github.io/Alore/.