LACO: Adaptive Latent Communication for Collaborative Driving
作者: Tianhao Chen, Yuheng Wu, Dongman Lee
分类: cs.AI, cs.CV
发布日期: 2026-05-21
💡 一句话要点
LACO:一种自适应的潜在通信方法,用于提升协同驾驶性能
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 协同驾驶 潜在通信 多智能体系统 知识蒸馏 自动驾驶 CARLA 智能交通
📋 核心要点
- 现有协同驾驶方法依赖语言通信,但自回归解码导致高延迟,离散token压缩造成信息损失。
- LACO通过迭代潜在审议、跨水平显著性归因和结构化语义知识蒸馏实现高效潜在通信。
- CARLA实验表明,LACO在保持协同驾驶性能的同时,显著降低了通信和推理延迟。
📝 摘要(中文)
协同驾驶旨在通过使互联车辆在部分可观测条件下进行协调来提高安全性与效率。目前的方法已经从共享视觉特征进行感知发展到通过基础模型交换基于语言的推理来进行行为协调。虽然用语言进行通信提供了直观的信息,但它带来了两个挑战:由自回归解码引起的高延迟,以及由将丰富的内部表示压缩成离散token引起的信息损失。为了解决这些挑战,我们分析了多智能体设置固有局限性下的协同驾驶中的潜在通信。我们的分析揭示了智能体身份混淆,即直接融合潜在状态会纠缠车辆之间的决策表示。受此启发,我们提出了LACO,一种无需训练的潜在通信范式,可以无缝地将预训练的驾驶模型适应于协同设置。LACO引入了用于潜在推理的迭代潜在审议(ILD)、用于通信高效信息选择的跨水平显著性归因(CHSA)以及用于稳定以自我为中心的决策的结构化语义知识蒸馏(SSKD)。在CARLA中的闭环实验表明,LACO显著降低了通信和推理延迟,同时保持了强大的协同驾驶性能。
🔬 方法详解
问题定义:现有协同驾驶方法在通信方面存在瓶颈。基于语言的通信虽然直观,但自回归解码过程引入了显著的延迟,限制了实时性。此外,将丰富的内部状态压缩成离散的语言token会导致信息损失,影响协同决策的准确性。直接融合多个智能体的潜在状态可能导致智能体身份混淆,使得决策表示相互纠缠,降低了协同效果。
核心思路:LACO的核心在于利用潜在空间进行通信,避免了语言通信的延迟和信息损失。通过迭代潜在审议(ILD)实现智能体间的推理,利用跨水平显著性归因(CHSA)选择关键信息进行通信,并采用结构化语义知识蒸馏(SSKD)稳定自我中心的决策过程。这种设计旨在在保证协同性能的同时,降低通信开销和推理延迟。
技术框架:LACO主要包含三个模块:迭代潜在审议(ILD)、跨水平显著性归因(CHSA)和结构化语义知识蒸馏(SSKD)。首先,ILD允许智能体在潜在空间中迭代地进行推理和协商,以达成共识。然后,CHSA用于选择对协同驾驶至关重要的信息,减少通信量。最后,SSKD通过将协同知识提炼到单个智能体的模型中,稳定自我中心的决策过程。整体流程是,每个智能体首先进行局部感知和决策,然后通过ILD进行潜在通信,利用CHSA选择性地共享信息,最后通过SSKD进行知识更新。
关键创新:LACO的关键创新在于其完全在潜在空间中进行通信,避免了语言通信的瓶颈。ILD实现了高效的潜在推理,CHSA实现了通信效率,SSKD稳定了自我中心的决策。与现有方法相比,LACO无需训练即可适应协同驾驶场景,并且能够显著降低通信和推理延迟。
关键设计:ILD通过迭代更新潜在状态来实现智能体间的协商。CHSA使用注意力机制来选择重要的信息进行通信,注意力权重基于跨水平的显著性。SSKD使用结构化的语义知识来指导知识蒸馏过程,确保提炼的知识能够有效地稳定自我中心的决策。具体的参数设置和网络结构取决于所使用的预训练驾驶模型,LACO可以灵活地适应不同的模型。
🖼️ 关键图片
📊 实验亮点
实验结果表明,LACO在CARLA模拟器中显著降低了通信和推理延迟,同时保持了强大的协同驾驶性能。与基线方法相比,LACO在协同驾驶任务中取得了更高的成功率和更低的碰撞率。具体的数据指标(例如延迟降低百分比、成功率提升百分比)需要在论文中查找。
🎯 应用场景
LACO具有广泛的应用前景,可应用于自动驾驶车队管理、智能交通系统和机器人协同作业等领域。通过降低通信延迟和提高协同效率,LACO能够提升自动驾驶系统的安全性、效率和可靠性,并促进智能交通系统的发展。此外,该方法还可以应用于其他需要多智能体协同的场景,例如机器人编队、无人机协同搜索等。
📄 摘要(原文)
Collaborative driving aims to improve safety and efficiency by enabling connected vehicles to coordinate under partial observability. Recent approaches have evolved from sharing visual features for perception to exchanging language-based reasoning through foundation models for behavioral coordination. Though communicating in language provides intuitive information, it introduces two challenges: high latency caused by autoregressive decoding and information loss caused by compressing rich internal representations into discrete tokens. To address these challenges, we analyze latent communication in collaborative driving under inherent limitations of multi-agent settings. Our analysis reveals agent identity confusion, where direct fusion of latent states entangles decision representations across vehicles. Motivated by this, we propose LACO, a training-free \textbf{LA}tent \textbf{CO}mmunication paradigm that seamlessly adapts pretrained driving models to collaborative settings. LACO introduces Iterative Latent Deliberation (ILD) for latent reasoning, Cross-Horizon Saliency Attribution (CHSA) for communication-efficient information selection, and Structured Semantic Knowledge Distillation (SSKD) to stabilize ego-centric decision making. Closed-loop experiments in CARLA show that LACO notably reduces communication and inference latency while maintaining strong collaborative driving performance.