Multi-Robot Vision-Based Task and Motion Planning for EV Battery Disassembly and Sorting
作者: Abdelaziz Shaarawy, Cansu Erdogan, Rustam Stolkin, Alireza Rastegarpanah
分类: cs.RO
发布日期: 2025-09-25
💡 一句话要点
提出多机器人视觉任务与运动规划框架,用于电动汽车电池拆卸与分拣
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 多机器人协同 任务与运动规划 电动汽车电池拆卸 视觉伺服 碰撞避免 运动规划 机器人学习
📋 核心要点
- 电动汽车电池拆卸需要多机器人协同,但现有方法难以在复杂动态环境中保证运动的安全性与效率。
- 提出一种四层TAMP框架,结合符号任务规划、成本可达性分配和TP-GMM引导的运动规划,实现高效避障。
- 实验表明,该方法显著缩短了路径长度和完工时间,并有效减小了机械臂的扫掠体积和重叠区域。
📝 摘要(中文)
电动汽车(EV)电池拆卸需要在复杂动态场景中实现精确的多机器人协调、快速可靠的运动以及强大的碰撞安全性。本文提出了一种四层任务与运动规划(TAMP)框架,该框架将符号任务规划和考虑成本与可达性的分配策略,与从演示中学习的TP-GMM引导的运动规划器相结合。基于YOLOv8的立体视觉提供实时组件定位,而基于OctoMap的3D地图构建和MoveIt中的FCL(Flexible Collision Library)检查将预测数字孪生碰撞检查与基于视觉的反应式避障统一起来。在两个UR10e机器人上,对电缆、母线、服务插头和三个叶片电池的移除进行了验证,结果表明,在相同的感知和任务分配下,该方法比默认的RRTConnect基线产生更紧凑、更安全的运动:平均末端执行器路径长度下降了-63.3%,完工时间下降了-8.1%;每个机械臂的扫掠体积缩小(R1: 0.583→0.139 m³; R2: 0.696→0.252 m³),相互重叠减少了47%(0.064→0.034 m³)。这些结果突出了在非结构化动态环境中,多机器人电动汽车电池拆卸的自主性、精度和安全性得到了提高。
🔬 方法详解
问题定义:论文旨在解决电动汽车电池拆卸过程中,多机器人协同作业面临的运动规划问题。现有方法在复杂、动态和非结构化的环境中,难以保证运动规划的安全性、效率和紧凑性,尤其是在考虑碰撞避免和任务分配时。
核心思路:论文的核心思路是将任务规划和运动规划相结合,利用符号任务规划进行高层次的任务分解和分配,然后使用学习到的运动规划器生成高效、安全的机器人运动轨迹。通过结合成本和可达性感知的分配策略,优化任务分配,进一步提升整体效率。
技术框架:该框架包含四个主要层次:1) 基于YOLOv8的立体视觉感知层,用于实时组件定位;2) 基于OctoMap的3D地图构建层,用于环境建模;3) 符号任务规划和成本可达性分配层,用于任务分解和机器人分配;4) TP-GMM引导的运动规划层,用于生成具体的机器人运动轨迹。MoveIt和FCL用于碰撞检测和避免。
关键创新:该方法最重要的创新点在于将学习到的运动规划器(TP-GMM)与传统的任务规划相结合,实现了高效的运动规划。此外,结合了预测性的数字孪生碰撞检查和反应式的视觉避障,提高了安全性。成本和可达性感知的任务分配策略也优化了多机器人协同。
关键设计:TP-GMM运动规划器通过从演示数据中学习得到,能够生成更自然、更高效的运动轨迹。成本函数的设计考虑了路径长度、执行时间和碰撞风险等因素。任务分配策略基于成本和可达性,旨在最小化整体执行时间并避免机器人之间的冲突。
📊 实验亮点
实验结果表明,该方法在多机器人电动汽车电池拆卸任务中,相比于RRTConnect基线,平均末端执行器路径长度减少了63.3%,完工时间减少了8.1%。同时,每个机械臂的扫掠体积显著缩小(R1: 0.583→0.139 m³; R2: 0.696→0.252 m³),机器人之间的重叠区域减少了47%(0.064→0.034 m³),验证了该方法在效率和安全性方面的显著提升。
🎯 应用场景
该研究成果可应用于电动汽车电池回收、自动化拆卸线、以及其他需要多机器人协同作业的复杂工业场景。通过提高拆卸效率和安全性,降低了电池回收成本,促进了可持续发展。未来可扩展到其他类型的复杂产品拆卸和装配任务。
📄 摘要(原文)
Electric-vehicle (EV) battery disassembly requires precise multi-robot coordination, short and reliable motions, and robust collision safety in cluttered, dynamic scenes. We propose a four-layer task-and-motion planning (TAMP) framework that couples symbolic task planning and cost- and accessibility-aware allocation with a TP-GMM-guided motion planner learned from demonstrations. Stereo vision with YOLOv8 provides real-time component localization, while OctoMap-based 3D mapping and FCL(Flexible Collision Library) checks in MoveIt unify predictive digital-twin collision checking with reactive, vision-based avoidance. Validated on two UR10e robots across cable, busbar, service plug, and three leaf-cell removals, the approach yields substantially more compact and safer motions than a default RRTConnect baseline under identical perception and task assignments: average end-effector path length drops by $-63.3\%$ and makespan by $-8.1\%$; per-arm swept volumes shrink (R1: $0.583\rightarrow0.139\,\mathrm{m}^3$; R2: $0.696\rightarrow0.252\,\mathrm{m}^3$), and mutual overlap decreases by $47\%$ ($0.064\rightarrow0.034\,\mathrm{m}^3$). These results highlight improved autonomy, precision, and safety for multi-robot EV battery disassembly in unstructured, dynamic environments.