Multi-Robot Vision-Based Task and Motion Planning for EV Battery Disassembly and Sorting

📄 arXiv: 2509.21020v1 📥 PDF

作者: Abdelaziz Shaarawy, Cansu Erdogan, Rustam Stolkin, Alireza Rastegarpanah

分类: cs.RO

发布日期: 2025-09-25


💡 一句话要点

提出基于视觉的多机器人任务与运动规划框架,用于电动汽车电池拆卸与分拣。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多机器人协同 任务与运动规划 电动汽车电池拆卸 TP-GMM 视觉感知 碰撞检测 机器人运动规划

📋 核心要点

  1. 电动汽车电池拆卸需要精确的多机器人协同、快速可靠的运动以及在复杂动态场景中的鲁棒碰撞安全性,现有方法难以兼顾。
  2. 该论文提出了一种四层TAMP框架,结合符号任务规划、成本与可达性分配以及TP-GMM引导的运动规划器,实现高效安全的拆卸。
  3. 实验表明,该方法在路径长度、完工时间和碰撞安全性方面显著优于RRTConnect基线,提升了多机器人电池拆卸的自主性和效率。

📝 摘要(中文)

本文提出了一种四层任务与运动规划(TAMP)框架,用于电动汽车(EV)电池拆卸,该框架将符号任务规划和考虑成本与可达性的分配策略,与从演示中学习的TP-GMM引导的运动规划器相结合。利用YOLOv8的立体视觉提供实时组件定位,基于OctoMap的3D地图构建和MoveIt中的FCL(Flexible Collision Library)检查,将预测性的数字孪生碰撞检测与反应式的、基于视觉的避障相结合。在两个UR10e机器人上,针对电缆、母线、服务插头和三个叶片电池的移除进行了验证,结果表明,在相同的感知和任务分配下,该方法比默认的RRTConnect基线产生了更紧凑、更安全的运动:平均末端执行器路径长度减少了-63.3%,完工时间减少了-8.1%;每个机械臂的扫掠体积缩小(R1:0.583→0.139 m³;R2:0.696→0.252 m³),相互重叠减少了47%(0.064→0.034 m³)。这些结果突出了在非结构化、动态环境中,多机器人电动汽车电池拆卸的自主性、精度和安全性得到了提高。

🔬 方法详解

问题定义:电动汽车电池拆卸是一个复杂的多机器人任务,需要在拥挤和动态的环境中进行精确操作。现有的方法通常难以在保证安全性的同时,实现高效的任务规划和运动控制,尤其是在处理不同类型的电池组件时,缺乏通用性和适应性。此外,传统方法在碰撞检测和避障方面也存在局限性,难以应对真实场景中的不确定性。

核心思路:该论文的核心思路是将任务规划和运动规划相结合,形成一个四层TAMP框架。通过符号任务规划器确定任务序列,然后利用成本和可达性感知的分配策略将任务分配给不同的机器人。运动规划器则基于从演示中学习的TP-GMM模型,生成高效且安全的运动轨迹。同时,结合视觉感知和碰撞检测技术,实现实时的环境感知和避障。

技术框架:该框架包含四个主要层次:1) 感知层:利用立体视觉和YOLOv8进行实时组件定位,并使用OctoMap构建3D环境地图。2) 任务规划层:使用符号任务规划器生成任务序列,例如移除电缆、母线等。3) 任务分配层:根据成本和可达性,将任务分配给不同的机器人。4) 运动规划层:使用TP-GMM引导的运动规划器,生成机器人运动轨迹,并使用MoveIt和FCL进行碰撞检测。

关键创新:该论文的关键创新在于将TP-GMM(Task-Parameterized Gaussian Mixture Model)引入到多机器人运动规划中。TP-GMM能够从演示数据中学习到任务相关的运动模式,从而生成更高效、更自然的运动轨迹。此外,该框架还结合了视觉感知和碰撞检测,实现了实时的环境感知和避障,提高了系统的鲁棒性。与传统的基于采样的运动规划方法(如RRTConnect)相比,该方法能够生成更紧凑、更安全的运动轨迹。

关键设计:TP-GMM模型通过高斯混合模型对演示数据进行建模,并使用期望最大化(EM)算法进行参数估计。运动规划器利用TP-GMM模型生成候选轨迹,并使用成本函数对轨迹进行评估,选择最优轨迹。成本函数考虑了路径长度、碰撞风险和关节运动范围等因素。此外,该框架还使用了FCL库进行快速碰撞检测,并结合视觉反馈进行实时的避障。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在两个UR10e机器人上,相较于RRTConnect基线,平均末端执行器路径长度减少了-63.3%,完工时间减少了-8.1%。每个机械臂的扫掠体积显著缩小(R1:0.583→0.139 m³;R2:0.696→0.252 m³),相互重叠减少了47%(0.064→0.034 m³)。这些数据表明,该方法能够生成更紧凑、更安全的运动轨迹,显著提高了多机器人电池拆卸的效率和安全性。

🎯 应用场景

该研究成果可应用于电动汽车电池回收、电子产品拆解、自动化装配等领域。通过多机器人协同和智能规划,可以提高拆卸效率、降低人工成本,并减少环境污染。此外,该方法还可以推广到其他复杂的多机器人任务中,例如灾后救援、太空探索等,具有广阔的应用前景。

📄 摘要(原文)

Electric-vehicle (EV) battery disassembly requires precise multi-robot coordination, short and reliable motions, and robust collision safety in cluttered, dynamic scenes. We propose a four-layer task-and-motion planning (TAMP) framework that couples symbolic task planning and cost- and accessibility-aware allocation with a TP-GMM-guided motion planner learned from demonstrations. Stereo vision with YOLOv8 provides real-time component localization, while OctoMap-based 3D mapping and FCL(Flexible Collision Library) checks in MoveIt unify predictive digital-twin collision checking with reactive, vision-based avoidance. Validated on two UR10e robots across cable, busbar, service plug, and three leaf-cell removals, the approach yields substantially more compact and safer motions than a default RRTConnect baseline under identical perception and task assignments: average end-effector path length drops by $-63.3\%$ and makespan by $-8.1\%$; per-arm swept volumes shrink (R1: $0.583\rightarrow0.139\,\mathrm{m}^3$; R2: $0.696\rightarrow0.252\,\mathrm{m}^3$), and mutual overlap decreases by $47\%$ ($0.064\rightarrow0.034\,\mathrm{m}^3$). These results highlight improved autonomy, precision, and safety for multi-robot EV battery disassembly in unstructured, dynamic environments.