DART: Learning-Enhanced Model Predictive Control for Dual-Arm Non-Prehensile Manipulation

作者: Autrio Das, Shreya Bollimuntha, Madala Venkata Renu Jeevesh, Keshab Patra, Tashmoy Gosh, Nagamanikandan G, Arun Kumar, Madhava Krishna

分类: cs.RO

发布日期: 2026-04-20

🔗 代码/项目: PROJECT_PAGE

💡 一句话要点

DART：用于双臂非抓取操作的学习增强型模型预测控制

🎯 匹配领域: 支柱一：机器人控制 (Robot Control) 支柱二：RL算法与架构 (RL & Architecture)

关键词: 双臂机器人 非抓取操作 模型预测控制 强化学习 动力学建模

📋 核心要点

双臂非抓取操作物体在服务机器人领域具有重要意义，但精确控制动态托盘上的物体运动极具挑战。
DART框架结合了非线性MPC和阻抗控制，并探索了三种建模策略来预测托盘-物体动力学。
实验表明，不同的建模策略在性能、泛化性和计算成本之间存在权衡，为实际应用提供了选择依据。

📝 摘要（中文）

本文提出DART，一个新颖的双臂框架，它集成了非线性模型预测控制（MPC）与基于优化的阻抗控制器，以实现物体相对于动态控制托盘的精确运动。该框架系统地评估了三种互补策略，用于建模托盘-物体动力学，作为MPC公式中的状态转移函数：（i）基于物理的解析模型，（ii）基于在线回归的辨识模型，可实时自适应，以及（iii）基于强化学习的动力学模型，可在物体属性之间进行泛化。我们的流程在模拟中针对具有不同质量、几何形状和摩擦系数的物体进行了验证。广泛的评估突出了三种建模策略在稳定时间、稳态误差、控制努力和物体泛化方面的权衡。据我们所知，DART是第一个用于在托盘上非抓取双臂操作物体的框架。

🔬 方法详解

问题定义：论文旨在解决双臂机器人非抓取操作中，在动态托盘上精确控制物体运动的问题。现有方法难以准确建模托盘-物体的复杂动力学，导致控制精度不足，泛化能力差。

核心思路：论文的核心思路是将模型预测控制（MPC）与学习方法相结合，利用MPC的优化能力和学习模型的泛化能力，实现对托盘-物体动力学的精确预测和控制。通过比较不同的动力学建模策略，找到在精度、效率和泛化性之间的最佳平衡。

技术框架：DART框架包含以下主要模块：1) 状态估计：估计托盘和物体的状态（位置、速度等）。2) 动力学建模：使用三种策略（解析模型、在线回归、强化学习）对托盘-物体动力学进行建模。3) 模型预测控制（MPC）：基于动力学模型，预测未来状态，并优化控制输入（关节力矩）。4) 阻抗控制：将MPC输出的力矩转化为关节力矩，实现精确的运动控制。

关键创新：DART的关键创新在于：1) 提出了一个完整的双臂非抓取操作框架，集成了MPC和学习方法。2) 系统地比较了三种不同的动力学建模策略，并分析了它们的优缺点。3) 通过学习增强的MPC，提高了控制精度和泛化能力。

关键设计：1) 动力学模型：解析模型基于物理原理，在线回归模型使用高斯过程回归，强化学习模型使用神经网络。2) MPC：使用非线性MPC，目标函数包括跟踪误差和控制努力。3) 阻抗控制：使用基于优化的阻抗控制器，调节机器人的刚度和阻尼。

🖼️ 关键图片

📊 实验亮点

论文在模拟环境中进行了大量实验，验证了DART框架的有效性。实验结果表明，基于强化学习的动力学模型在泛化能力方面表现最佳，而在线回归模型在精度方面表现最佳。通过对比三种建模策略，论文为实际应用提供了选择依据，并展示了DART框架在不同场景下的优越性能。

🎯 应用场景

DART框架在服务机器人领域具有广泛的应用前景，例如在酒店、餐厅和医院等场景中，机器人可以利用该框架安全、高效地搬运食物、饮料和医疗用品。此外，该框架还可以应用于工业自动化领域，例如在装配线上进行非抓取操作。

📄 摘要（原文）

What appears effortless to a human waiter remains a major challenge for robots. Manipulating objects nonprehensilely on a tray is inherently difficult, and the complexity is amplified in dual-arm settings. Such tasks are highly relevant to service robotics in domains such as hotels and hospitality, where robots must transport and reposition diverse objects with precision. We present DART, a novel dual-arm framework that integrates nonlinear Model Predictive Control (MPC) with an optimization-based impedance controller to achieve accurate object motion relative to a dynamically controlled tray. The framework systematically evaluates three complementary strategies for modeling tray-object dynamics as the state transition function within our MPC formulation: (i) a physics-based analytical model, (ii) an online regression based identification model that adapts in real-time, and (iii) a reinforcement learning-based dynamics model that generalizes across object properties. Our pipeline is validated in simulation with objects of varying mass, geometry, and friction coefficients. Extensive evaluations highlight the trade-offs among the three modeling strategies in terms of settling time, steady-state error, control effort, and generalization across objects. To the best of our knowledge, DART constitutes the first framework for non-prehensile dual-arm manipulation of objects on a tray. Project Link: https://dart-icra.github.io/dart/

DART: Learning-Enhanced Model Predictive Control for Dual-Arm Non-Prehensile Manipulation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理