DART: Learning-Enhanced Model Predictive Control for Dual-Arm Non-Prehensile Manipulation

📄 arXiv: 2604.17833v1 📥 PDF

作者: Autrio Das, Shreya Bollimuntha, Madala Venkata Renu Jeevesh, Keshab Patra, Tashmoy Gosh, Nagamanikandan G, Arun Kumar, Madhava Krishna

分类: cs.RO

发布日期: 2026-04-20

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

DART:用于双臂非抓取操作的学习增强型模型预测控制

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 双臂机器人 非抓取操作 模型预测控制 强化学习 动力学建模

📋 核心要点

  1. 双臂非抓取操作物体在服务机器人领域具有重要意义,但精确控制动态托盘上的物体运动极具挑战。
  2. DART框架结合了非线性MPC和阻抗控制,并探索了三种建模策略来预测托盘-物体动力学。
  3. 实验表明,不同的建模策略在性能、泛化性和计算成本之间存在权衡,为实际应用提供了选择依据。

📝 摘要(中文)

本文提出DART,一个新颖的双臂框架,它集成了非线性模型预测控制(MPC)与基于优化的阻抗控制器,以实现物体相对于动态控制托盘的精确运动。该框架系统地评估了三种互补策略,用于建模托盘-物体动力学,作为MPC公式中的状态转移函数:(i)基于物理的解析模型,(ii)基于在线回归的辨识模型,可实时自适应,以及(iii)基于强化学习的动力学模型,可在物体属性之间进行泛化。我们的流程在模拟中针对具有不同质量、几何形状和摩擦系数的物体进行了验证。广泛的评估突出了三种建模策略在稳定时间、稳态误差、控制努力和物体泛化方面的权衡。据我们所知,DART是第一个用于在托盘上非抓取双臂操作物体的框架。

🔬 方法详解

问题定义:论文旨在解决双臂机器人非抓取操作中,在动态托盘上精确控制物体运动的问题。现有方法难以准确建模托盘-物体的复杂动力学,导致控制精度不足,泛化能力差。

核心思路:论文的核心思路是将模型预测控制(MPC)与学习方法相结合,利用MPC的优化能力和学习模型的泛化能力,实现对托盘-物体动力学的精确预测和控制。通过比较不同的动力学建模策略,找到在精度、效率和泛化性之间的最佳平衡。

技术框架:DART框架包含以下主要模块:1) 状态估计:估计托盘和物体的状态(位置、速度等)。2) 动力学建模:使用三种策略(解析模型、在线回归、强化学习)对托盘-物体动力学进行建模。3) 模型预测控制(MPC):基于动力学模型,预测未来状态,并优化控制输入(关节力矩)。4) 阻抗控制:将MPC输出的力矩转化为关节力矩,实现精确的运动控制。

关键创新:DART的关键创新在于:1) 提出了一个完整的双臂非抓取操作框架,集成了MPC和学习方法。2) 系统地比较了三种不同的动力学建模策略,并分析了它们的优缺点。3) 通过学习增强的MPC,提高了控制精度和泛化能力。

关键设计:1) 动力学模型:解析模型基于物理原理,在线回归模型使用高斯过程回归,强化学习模型使用神经网络。2) MPC:使用非线性MPC,目标函数包括跟踪误差和控制努力。3) 阻抗控制:使用基于优化的阻抗控制器,调节机器人的刚度和阻尼。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文在模拟环境中进行了大量实验,验证了DART框架的有效性。实验结果表明,基于强化学习的动力学模型在泛化能力方面表现最佳,而在线回归模型在精度方面表现最佳。通过对比三种建模策略,论文为实际应用提供了选择依据,并展示了DART框架在不同场景下的优越性能。

🎯 应用场景

DART框架在服务机器人领域具有广泛的应用前景,例如在酒店、餐厅和医院等场景中,机器人可以利用该框架安全、高效地搬运食物、饮料和医疗用品。此外,该框架还可以应用于工业自动化领域,例如在装配线上进行非抓取操作。

📄 摘要(原文)

What appears effortless to a human waiter remains a major challenge for robots. Manipulating objects nonprehensilely on a tray is inherently difficult, and the complexity is amplified in dual-arm settings. Such tasks are highly relevant to service robotics in domains such as hotels and hospitality, where robots must transport and reposition diverse objects with precision. We present DART, a novel dual-arm framework that integrates nonlinear Model Predictive Control (MPC) with an optimization-based impedance controller to achieve accurate object motion relative to a dynamically controlled tray. The framework systematically evaluates three complementary strategies for modeling tray-object dynamics as the state transition function within our MPC formulation: (i) a physics-based analytical model, (ii) an online regression based identification model that adapts in real-time, and (iii) a reinforcement learning-based dynamics model that generalizes across object properties. Our pipeline is validated in simulation with objects of varying mass, geometry, and friction coefficients. Extensive evaluations highlight the trade-offs among the three modeling strategies in terms of settling time, steady-state error, control effort, and generalization across objects. To the best of our knowledge, DART constitutes the first framework for non-prehensile dual-arm manipulation of objects on a tray. Project Link: https://dart-icra.github.io/dart/