InterLoc: LiDAR-based Intersection Localization using Road Segmentation with Automated Evaluation Method

📄 arXiv: 2505.00512v3 📥 PDF

作者: Nguyen Hoang Khoi Tran, Julie Stephany Berrio, Mao Shan, Zhenxing Ming, Stewart Worrall

分类: cs.CV, cs.RO

发布日期: 2025-05-01 (更新: 2025-07-16)


💡 一句话要点

InterLoc:基于LiDAR和道路分割的交叉口定位,并提出自动评估方法

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: LiDAR 交叉口定位 道路分割 自动驾驶 语义SLAM

📋 核心要点

  1. 现有交叉口定位方法忽略了车载计算的丰富语义信息,或依赖于稀缺的手动标注数据集,限制了其在自动驾驶中的应用。
  2. InterLoc方法通过融合连续语义道路扫描信息,在鸟瞰图下检测交叉口候选区域,并利用最小二乘法优化交叉口中心点。
  3. 在SemanticKITTI数据集上的实验表明,InterLoc方法在准确性和可靠性方面优于最新的学习基线,且对分割误差具有鲁棒性。

📝 摘要(中文)

本文提出了一种新颖的基于LiDAR的在线车辆中心交叉口定位方法,旨在解决自动驾驶车辆定位、建图和运动规划中交叉口定位问题。该方法利用连续语义道路扫描构建的鸟瞰图(BEV)表示来检测交叉口候选区域。然后,通过分析相交道路分支,并使用最小二乘法调整交叉口中心点来优化这些候选区域。为了评估,本文引入了一个自动化的评估流程,该流程使用精确的GNSS/INS真值位姿将定位的交叉口点与OpenStreetMap(OSM)交叉口节点进行配对。在SemanticKITTI数据集上的实验表明,该方法在准确性和可靠性方面优于最新的基于学习的基线方法。敏感性测试表明该方法对具有挑战性的分割误差具有鲁棒性,突出了其在现实世界中的适用性。

🔬 方法详解

问题定义:论文旨在解决自动驾驶车辆在道路网络中精确定位交叉口的问题。现有方法的痛点在于,要么没有充分利用车载传感器获取的语义信息,要么依赖于人工标注的大量数据,这在实际应用中成本很高且难以扩展。因此,需要一种能够高效、准确地利用现有车载传感器数据进行交叉口定位的方法。

核心思路:论文的核心思路是利用LiDAR点云数据进行道路分割,并基于分割结果在鸟瞰图(BEV)下检测交叉口。通过分析交叉口周围的道路分支结构,可以更精确地确定交叉口的位置。这种方法充分利用了LiDAR数据的几何和语义信息,避免了对大量人工标注数据的依赖。

技术框架:InterLoc方法的整体框架包括以下几个主要阶段:1) 利用LiDAR数据进行道路分割,得到语义道路扫描;2) 将连续的语义道路扫描拼接成鸟瞰图(BEV)表示;3) 在BEV图像中检测交叉口候选区域;4) 分析交叉口候选区域的道路分支结构,并使用最小二乘法优化交叉口中心点;5) 使用自动评估流程,将定位的交叉口点与OpenStreetMap(OSM)交叉口节点进行配对,评估定位精度。

关键创新:该方法最重要的技术创新点在于:1) 提出了一种基于LiDAR和道路分割的交叉口定位方法,无需大量人工标注数据;2) 利用最小二乘法优化交叉口中心点,提高了定位精度;3) 引入了自动评估流程,可以方便地评估定位算法的性能。与现有方法的本质区别在于,InterLoc方法更加注重利用车载传感器数据中的语义信息,并采用几何优化方法提高定位精度。

关键设计:在道路分割方面,可以使用现有的语义分割网络,如RangeNet++。在交叉口候选区域检测方面,可以使用简单的图像处理算法,如霍夫变换或轮廓检测。在最小二乘法优化方面,需要设计合适的损失函数,以最小化交叉口中心点与道路分支之间的距离。自动评估流程需要精确的GNSS/INS真值位姿,以及OpenStreetMap(OSM)的道路网络数据。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,InterLoc方法在SemanticKITTI数据集上优于最新的基于学习的基线方法。具体而言,InterLoc方法在准确性和可靠性方面均有显著提升,并且对具有挑战性的分割误差表现出良好的鲁棒性。这些结果表明,InterLoc方法在实际应用中具有很高的潜力。

🎯 应用场景

该研究成果可应用于自动驾驶车辆的定位、建图和运动规划。精确的交叉口定位可以帮助车辆更准确地确定自身位置,从而提高导航的可靠性。此外,该方法还可以用于构建高精度地图,为自动驾驶车辆提供更详细的环境信息。未来,该技术有望应用于智能交通系统,提高道路通行效率和安全性。

📄 摘要(原文)

Online localization of road intersections is beneficial for autonomous vehicle localization, mapping and motion planning. Intersections offer strong landmarks for correcting vehicle pose estimation, anchoring new sensor data in up-to-date maps, and guiding vehicle routing in road network graphs. Despite this importance, intersection localization has not been widely studied, with existing methods either ignoring the rich semantic information already computed onboard or relying on scarce, hand-labeled intersection datasets. To close this gap, we present a novel LiDAR-based method for online vehicle-centric intersection localization. We detect the intersection candidates in a bird's eye view (BEV) representation formed by concatenating a sequence of semantic road scans. We then refine these candidates by analyzing the intersecting road branches and adjusting the intersection center point in a least-squares formulation. For evaluation, we introduce an automated pipeline that pairs localized intersection points with OpenStreetMap (OSM) intersection nodes using precise GNSS/INS ground-truth poses. Experiments on the SemanticKITTI dataset show that our method outperforms the latest learning-based baseline in accuracy and reliability. Sensitivity tests demonstrate the method's robustness to challenging segmentation errors, highlighting its applicability in the real world.