A Topology-Aware Spatiotemporal Handover Framework for Continuous Multi-UAV Tracking

📄 arXiv: 2605.15779v1 📥 PDF

作者: Jianlin Ye, Christos Kyrkou, Panayiotis Kolios

分类: cs.RO, cs.AI

发布日期: 2026-05-15

期刊: 2026 International Conference on Unmanned Aircraft Systems (ICUAS)

🔗 代码/项目: GITHUB


💡 一句话要点

提出拓扑感知的时空切换框架,用于连续多无人机车辆跟踪。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 多无人机跟踪 车辆跟踪 身份切换 智能交通系统 拓扑感知

📋 核心要点

  1. 现有无人机交通监控系统缺乏跨无人机视场的车辆身份持久性,导致轨迹碎片化,阻碍了网络级分析。
  2. 提出一种基于拓扑的时空切换机制,利用几何关系和虚拟车道预测车辆身份,实现跨无人机视场的身份关联。
  3. 实验结果表明,该方法在复杂城市环境中实现了99.8%的切换成功率,显著优于Re-ID方法,并验证了边缘部署可行性。

📝 摘要(中文)

本文提出了一种实时多相机多车辆跟踪(MCMT)系统,旨在处理全局身份持久性问题。针对车辆正射视图中基于外观的Re-ID存在的视觉模糊性和计算成本问题,我们引入了一种轻量级的基于拓扑的时空切换机制。我们实现了一个高吞吐量的并行流水线,利用YOLO11和ByteTrack处理并发的4K视频流。我们的核心贡献是一种确定性的基于队列的匹配算法,它利用几何重叠和虚拟车道离散化,通过FIFO队列预测性地管理身份切换。在复杂的城市环境(包括交叉路口和汇入交通)中的实验结果表明,在连续交通流中,切换成功率(HOSR)达到99.8%,显著优于Re-ID基线(74.1%),同时验证了边缘部署的可行性。源代码可在https://github.com/JYe9/multi-camera-multi-vehicle-tracking-system获取。

🔬 方法详解

问题定义:现有基于无人机的智能交通系统(ITS)在进行交通监控时,由于多个无人机视场(FOV)之间缺乏有效的车辆身份关联,导致轨迹碎片化。传统方法依赖于单无人机图像的局部轨迹提取和稳定,但忽略了全局的身份持久性,使得无法进行网络层面的分析,例如起点-终点(Origin-Destination)估计。基于外观的Re-ID方法在正射视图中面临视觉模糊性和计算成本高的挑战。

核心思路:本文的核心思路是利用交通环境的拓扑结构和车辆的时空信息,设计一种轻量级的切换机制,以实现跨无人机视场的车辆身份关联。通过预测车辆在不同无人机视场之间的转移,并利用FIFO队列管理身份切换,避免了复杂的Re-ID计算。

技术框架:该系统采用高吞吐量的并行流水线,首先使用YOLO11进行车辆检测,然后使用ByteTrack进行车辆跟踪。核心模块是拓扑感知的时空切换机制,该机制利用几何重叠和虚拟车道离散化来预测车辆的身份转移。系统使用确定性的基于队列的匹配算法,通过FIFO队列管理身份切换。

关键创新:最重要的技术创新点在于提出了一种基于拓扑结构的轻量级身份切换机制,避免了传统Re-ID方法中复杂的特征提取和匹配过程。该方法利用交通环境的先验知识,例如车道结构和车辆行驶方向,来预测车辆的身份转移,从而实现了高效的身份关联。

关键设计:系统使用虚拟车道离散化来表示车辆的位置信息,并利用几何重叠来判断无人机视场之间的连接关系。FIFO队列用于管理车辆的身份信息,并根据预测的转移概率进行身份切换。切换算法是确定性的,避免了不确定性匹配带来的误差累积。具体参数设置和损失函数信息在论文中未明确提及,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在复杂的城市环境中实现了99.8%的切换成功率(HOSR),显著优于Re-ID基线(74.1%)。该结果验证了该方法在实际交通场景中的有效性,并证明了其在边缘设备上部署的可行性。该方法能够有效地解决多无人机协同交通监控中的身份持久性问题。

🎯 应用场景

该研究成果可应用于智能交通系统中的多无人机协同交通监控,实现车辆轨迹的连续跟踪和分析,为交通流量估计、拥堵检测、路径规划等应用提供数据支持。该方法还可扩展到其他多摄像头场景,例如智能安防、智慧城市等领域,具有广阔的应用前景。

📄 摘要(原文)

The integration of Unmanned Aerial Vehicles(UAVs) into Intelligent Transportation Systems (ITS) offers synoptic visibility for traffic monitoring, yet scalable deployment is hindered by trajectory fragmentation, where vehicle identity persistence is lost across multi-UAV Fields of View (FOV). While state-of-the-art frameworks excel in optimizing local trajectory extraction and stability for single-drone imagery, they often function as isolated data silos that generate disjointed trajectories, thereby precluding network-level analysis such as Origin-Destination estimation. This paper presents a real-time Multi-Camera Multi-Vehicle Tracking (MCMT) system designed to handle global identity persistence. Addressing the visual ambiguity and computational cost of appearance-based Re-Identification (Re-ID) in nadir views, we introduce a lightweight Topology-Based Spatiotemporal Handover mechanism. We implement a high-throughput parallel pipeline leveraging YOLO11 and ByteTrack to process concurrent 4K streams. Our core contribution is a deterministic queue-based matching algorithm that utilizes geometric overlaps and virtual lane discretization to predictively manage identity handover via FIFO queues. Experimental results on complex urban environments, including intersections and merging traffic, demonstrate a Handover Success Rate (HOSR) of 99.8% in continuous traffic flows, significantly outperforming Re-ID baselines (74.1%) while validating edge deployment feasibility. The source code is available at https://github.com/JYe9/multi-camera-multi-vehicle-tracking-system.