Can a Robot Walk the Robotic Dog: Triple-Zero Collaborative Navigation for Heterogeneous Multi-Agent Systems

作者: Yaxuan Wang, Yifan Xiang, Ke Li, Xun Zhang, BoWen Ye, Zhuochen Fan, Fei Wei, Tong Yang

分类: cs.RO, cs.MA

发布日期: 2026-03-23

备注: 8 pages, 2 figures

🔗 代码/项目: GITHUB

💡 一句话要点

提出Triple-Zero协同导航框架，实现异构多机器人零样本协同路径规划

🎯 匹配领域: 支柱一：机器人控制 (Robot Control) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 异构多机器人系统 协同导航 零样本学习 多模态大语言模型 路径规划

📋 核心要点

现有异构多机器人系统依赖大量训练数据和仿真环境，限制了其在真实未知环境中的部署。
TZPP框架利用人形机器人进行任务协调，四足机器人探索路径，并结合多模态大语言模型进行指导，实现零样本协同导航。
实验表明，TZPP在复杂环境中表现出与人类相当的效率和对新环境的适应性，无需训练或仿真。

📝 摘要（中文）

本文提出了一种名为Triple Zero路径规划（TZPP）的协同框架，用于异构多机器人系统，该框架无需训练、无需先验知识、无需仿真。TZPP采用协调者-探索者架构：人形机器人负责任务协调，而四足机器人则在多模态大型语言模型的指导下探索并识别可行的路径。我们在Unitree G1和Go2机器人上实现了TZPP，并在各种室内和室外环境中对其进行了评估，包括障碍物丰富和地标稀疏的环境。实验表明，TZPP实现了稳健的、与人类相当的效率，并且对未见过的场景具有很强的适应性。通过消除对训练和仿真的依赖，TZPP为异构机器人合作的实际部署提供了一条切实可行的途径。我们的代码和视频可在https://github.com/triple-zeropp/Triple-zero-robot-agent 获取。

🔬 方法详解

问题定义：现有异构多机器人协同导航方法通常需要大量的训练数据和仿真环境，这限制了它们在真实、未知的环境中的部署。此外，不同机器人之间的任务分配和路径规划也面临挑战，尤其是在缺乏先验知识的情况下。如何在零样本条件下，实现异构机器人之间高效、鲁棒的协同导航是本文要解决的核心问题。

核心思路：本文的核心思路是利用“协调者-探索者”架构，将任务分解为高层次的协调和低层次的探索。人形机器人作为协调者，负责任务分配和全局规划；四足机器人作为探索者，负责在局部环境中寻找可行路径。同时，引入多模态大语言模型（MLLM）为探索者提供指导，使其能够理解环境信息并生成合理的探索策略。这种分层架构和MLLM的引入，使得机器人能够在零样本条件下进行协同导航。

技术框架：TZPP框架包含以下几个主要模块：1) 任务协调模块：由人形机器人执行，负责接收用户指令，并将任务分解为子任务，分配给四足机器人。2) 环境感知模块：四足机器人利用传感器（如摄像头、激光雷达）获取环境信息，并将其输入到MLLM中。3) 路径探索模块：MLLM根据环境信息和任务目标，生成探索策略，指导四足机器人在局部环境中寻找可行路径。4) 路径融合模块：四足机器人将探索到的局部路径反馈给人形机器人，人形机器人将其与全局规划进行融合，生成最终的导航路径。

关键创新：本文最重要的技术创新点在于提出了一个完全不需要训练、不需要先验知识、不需要仿真的异构多机器人协同导航框架。与传统的基于学习的方法相比，TZPP具有更强的泛化能力和适应性，能够在未知的环境中快速部署。此外，将多模态大语言模型引入机器人导航，为机器人理解环境和生成策略提供了新的思路。

关键设计：在环境感知模块中，使用了视觉和激光雷达等多模态传感器融合，以提高环境感知的准确性和鲁棒性。在路径探索模块中，MLLM被用于生成探索策略，例如“沿着墙壁走”、“避开障碍物”等。这些策略被转化为具体的运动指令，指导四足机器人的运动。在路径融合模块中，使用了一种基于图搜索的算法，将局部路径与全局规划进行融合，生成最优的导航路径。具体的参数设置和损失函数等技术细节在论文中进行了详细描述。

🖼️ 关键图片

📊 实验亮点

实验结果表明，TZPP框架在各种室内和室外环境中均表现出良好的性能。在障碍物丰富的环境中，TZPP能够有效地避开障碍物，找到可行的路径。在地标稀疏的环境中，TZPP能够利用MLLM的知识，识别环境特征，实现自主导航。实验还表明，TZPP的效率与人类相当，并且对未见过的场景具有很强的适应性。例如，在一次实验中，TZPP在未知环境中成功地引导四足机器人完成了任务，其效率与人类操作员相当。

🎯 应用场景

TZPP框架具有广泛的应用前景，例如在灾难救援、物流配送、安防巡逻等领域，可以实现异构机器人之间的协同作业，提高任务效率和安全性。该框架还可以应用于智能家居、智能工厂等场景，实现人机协作，提升生产效率和生活质量。未来，该研究有望推动异构机器人系统的发展，使其能够更好地服务于人类社会。

📄 摘要（原文）

We present Triple Zero Path Planning (TZPP), a collaborative framework for heterogeneous multi-robot systems that requires zero training, zero prior knowledge, and zero simulation. TZPP employs a coordinator--explorer architecture: a humanoid robot handles task coordination, while a quadruped robot explores and identifies feasible paths using guidance from a multimodal large language model. We implement TZPP on Unitree G1 and Go2 robots and evaluate it across diverse indoor and outdoor environments, including obstacle-rich and landmark-sparse settings. Experiments show that TZPP achieves robust, human-comparable efficiency and strong adaptability to unseen scenarios. By eliminating reliance on training and simulation, TZPP offers a practical path toward real-world deployment of heterogeneous robot cooperation. Our code and video are provided at: https://github.com/triple-zeropp/Triple-zero-robot-agent

Can a Robot Walk the Robotic Dog: Triple-Zero Collaborative Navigation for Heterogeneous Multi-Agent Systems

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理