Robotic Agentic Platform for Intelligent Electric Vehicle Disassembly
作者: Zachary Allen, Max Conway, Lyle Antieau, Allen Ponraj, Nikolaus Correll
分类: cs.RO
发布日期: 2026-03-19
💡 一句话要点
RAPID平台:用于智能电动汽车拆解的机器人代理平台
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 机器人拆卸 电动汽车电池回收 AI代理 视觉伺服 开放词汇目标检测
📋 核心要点
- 电动汽车电池回收面临设计多样性挑战,现有拆卸方法主要依赖人工,效率低且成本高。
- RAPID平台通过集成感知、操作和AI代理,实现了电动汽车电池的智能拆卸,提升自动化水平。
- 实验表明,视觉伺服策略在紧固件移除方面表现较好,同时验证了LLM代理在机器人控制中的潜力。
📝 摘要(中文)
电动汽车(EV)的普及对可扩展的电池回收提出了迫切需求,但由于设计的高度可变性,EV电池组的拆卸仍然主要依靠人工。我们提出了用于智能拆卸的机器人代理平台(RAPID),旨在研究在实际回收场景中,感知驱动的操纵、灵活的自动化和AI辅助的机器人编程。该系统集成了龙门式工业机械臂、RGB-D感知和一个自动拧螺母工具,用于拆卸完整EV电池组上的紧固件。一个开放词汇的目标检测流程实现了0.9757 mAP50,能够可靠地识别螺钉、螺母、汇流条和其他组件。我们实验评估了(n=204)三种一次性紧固件移除策略:示教姿态(97%成功率,24分钟持续时间)、一次性视觉执行(57%,29分钟)和视觉伺服(83%,36分钟),比较了电池顶盖紧固件的成功率和拆卸时间。为了支持灵活的交互,我们引入了用于机器人拆卸任务的代理AI规范,允许LLM代理通过结构化的工具接口和ROS服务将高级指令转换为机器人动作。我们评估了在边缘硬件上使用GPT-4o-mini和Qwen 3.5 9B/4B的SmolAgents。基于工具的接口实现了100%的任务完成率,而自动ROS服务发现显示了43.3%的失败率,突出了需要结构化的机器人API来实现可靠的LLM驱动控制。这个开源平台能够系统地研究人机协作、代理机器人编程和日益自主的拆卸工作流程,为研究可扩展的机器人电池回收提供了一个实践基础。
🔬 方法详解
问题定义:论文旨在解决电动汽车电池回收过程中,由于电池包设计多样性导致的拆卸自动化难题。现有方法主要依赖人工,效率低下且难以规模化。痛点在于缺乏能够适应不同电池包结构,并能灵活执行拆卸任务的机器人系统。
核心思路:论文的核心思路是构建一个集成了感知、操作和AI代理的机器人平台RAPID。通过视觉感知识别电池组件,利用机械臂和专用工具进行拆卸操作,并借助LLM代理实现高层指令到机器人动作的转换,从而实现智能化的电池拆卸。
技术框架:RAPID平台主要包含以下几个模块:1) 龙门式工业机械臂,负责执行拆卸动作;2) RGB-D感知系统,用于识别电池包上的组件,如螺钉、螺母等;3) 自动拧螺母工具,用于紧固件的移除;4) 基于LLM的代理,将高层指令转换为机器人控制指令;5) ROS服务,用于机器人控制和数据通信。整体流程为:感知系统识别组件 -> LLM代理生成拆卸指令 -> 机械臂执行拆卸动作 -> 反馈与调整。
关键创新:论文的关键创新在于将LLM代理引入到机器人拆卸任务中,实现了高层指令到机器人动作的自动转换。通过结构化的工具接口和ROS服务,LLM代理能够控制机械臂和工具,执行复杂的拆卸任务。此外,开放词汇的目标检测流程也提高了组件识别的准确性和鲁棒性。
关键设计:在视觉感知方面,采用了开放词汇的目标检测pipeline,实现了0.9757 mAP50的检测精度。在机器人控制方面,设计了结构化的工具接口和ROS服务,方便LLM代理进行控制。实验中,对比了示教姿态、一次性视觉执行和视觉伺服三种紧固件移除策略,并评估了GPT-4o-mini和Qwen 3.5 9B/4B在边缘硬件上的性能。
🖼️ 关键图片
📊 实验亮点
实验结果表明,RAPID平台在电动汽车电池拆卸方面具有显著优势。开放词汇目标检测pipeline实现了0.9757 mAP50的检测精度。在紧固件移除策略方面,示教姿态的成功率最高(97%),但视觉伺服策略在灵活性和适应性方面更具优势(83%成功率)。LLM代理通过工具接口实现了100%的任务完成率,验证了其在机器人控制中的潜力。然而,自动ROS服务发现的失败率较高(43.3%),表明需要进一步优化机器人API。
🎯 应用场景
该研究成果可应用于电动汽车电池回收行业,实现电池拆卸的自动化和智能化,提高回收效率,降低人工成本。此外,该平台也可扩展到其他产品的拆卸和回收领域,例如电子产品、家用电器等,具有广阔的应用前景和实际价值。未来,该研究有望推动循环经济的发展,减少环境污染。
📄 摘要(原文)
Electric vehicles (EV) create an urgent need for scalable battery recycling, yet disassembly of EV battery packs remains largely manual due to high design variability. We present our Robotic Agentic Platform for Intelligent Disassembly (RAPID), designed to investigate perception-driven manipulation, flexible automation, and AI-assisted robot programming in realistic recycling scenarios. The system integrates a gantry-mounted industrial manipulator, RGB-D perception, and an automated nut-running tool for fastener removal on a full-scale EV battery pack. An open-vocabulary object detection pipeline achieves 0.9757 mAP50, enabling reliable identification of screws, nuts, busbars, and other components. We experimentally evaluate (n=204) three one-shot fastener removal strategies: taught-in poses (97% success rate, 24 min duration), one-shot vision execution (57%, 29 min), and visual servoing (83%, 36 min), comparing success rate and disassembly time for the battery's top cover fasteners. To support flexible interaction, we introduce agentic AI specifications for robotic disassembly tasks, allowing LLM agents to translate high-level instructions into robot actions through structured tool interfaces and ROS services. We evaluate SmolAgents with GPT-4o-mini and Qwen 3.5 9B/4B on edge hardware. Tool-based interfaces achieve 100% task completion, while automatic ROS service discovery shows 43.3% failure rates, highlighting the need for structured robot APIs for reliable LLM-driven control. This open-source platform enables systematic investigation of human-robot collaboration, agentic robot programming, and increasingly autonomous disassembly workflows, providing a practical foundation for research toward scalable robotic battery recycling.