Ghost-FWL: A Large-Scale Full-Waveform LiDAR Dataset for Ghost Detection and Removal

📄 arXiv: 2603.28224v1 📥 PDF

作者: Kazuma Ikeda, Ryosei Hara, Rokuto Nagata, Ozora Sako. Zihao Ding, Takahiro Kado, Ibuki Fujioka, Taro Beppu, Mariko Isogawa, Kentaro Yoshioka

分类: cs.CV

发布日期: 2026-03-30

备注: Accepted to CVPR 2026 (Main)

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

提出Ghost-FWL数据集和FWL-MAE模型,用于解决移动LiDAR中的鬼点检测与移除问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱七:动作重定向 (Motion Retargeting)

关键词: 全波形激光雷达 鬼点检测 鬼点移除 自监督学习 移动激光雷达 SLAM 3D目标检测

📋 核心要点

  1. 现有鬼点移除方法依赖稠密点云几何一致性,在移动LiDAR稀疏动态数据上失效,无法有效去除鬼点。
  2. 利用全波形LiDAR(FWL)捕获完整时域强度剖面,区分鬼点和真实反射,为移动场景鬼点移除提供新思路。
  3. 构建大规模Ghost-FWL数据集,提出FWL-MAE自监督学习方法,实验验证了鬼点移除在SLAM和3D目标检测中的有效性。

📝 摘要(中文)

激光雷达已成为自动驾驶、机器人和智慧城市应用中必不可少的传感方式。然而,由玻璃和反射表面多径激光返回引起的虚假反射,即鬼点,会严重降低3D地图构建和定位的准确性。以往的鬼点移除方法依赖于稠密点云中的几何一致性,在移动激光雷达的稀疏、动态数据上表现不佳。本文通过利用全波形激光雷达(FWL)解决这个问题,FWL捕获完整的时域强度剖面,而不仅仅是峰值距离,为区分移动场景中的鬼点和真实反射提供了关键线索。由于这是一个新的任务,我们提出了Ghost-FWL,这是第一个也是最大的用于鬼点检测和移除的带标注的移动FWL数据集。Ghost-FWL包含10个不同场景的24K帧,具有75亿个峰值级别的标注,比现有的带标注的FWL数据集大100倍。受益于这个大规模数据集,我们建立了一个基于FWL的鬼点检测基线模型,并提出了FWL-MAE,一种用于FWL数据上高效自监督表征学习的掩码自编码器。实验表明,我们的基线模型在鬼点移除精度上优于现有方法,并且我们的鬼点移除进一步增强了下游任务,例如基于激光雷达的SLAM(轨迹误差减少66%)和3D目标检测(假阳性减少50倍)。数据集和代码已公开,可通过项目页面访问:https://keio-csg.github.io/Ghost-FWL

🔬 方法详解

问题定义:论文旨在解决移动激光雷达数据中鬼点(由多径反射引起)的检测与移除问题。现有方法主要依赖于稠密点云的几何一致性,但在移动激光雷达产生的稀疏且动态的数据上表现不佳,无法有效区分鬼点和真实反射,导致3D地图构建和定位精度下降。

核心思路:论文的核心思路是利用全波形激光雷达(FWL)提供的丰富信息。与传统激光雷达仅记录距离信息不同,FWL记录完整的激光脉冲返回波形,包含强度、时间等信息,这些信息可以作为区分鬼点和真实反射的关键线索。通过分析波形特征,可以更准确地识别和移除鬼点。

技术框架:整体框架包含以下几个主要部分:1) 构建大规模带标注的Ghost-FWL数据集,用于训练和评估鬼点检测与移除模型。2) 建立基于FWL的鬼点检测基线模型,作为性能参考。3) 提出FWL-MAE,一种基于掩码自编码器的自监督学习方法,用于从FWL数据中学习有效的表征。4) 将鬼点移除应用于下游任务,如SLAM和3D目标检测,验证其有效性。

关键创新:论文的关键创新在于:1) 首次提出利用全波形激光雷达数据进行鬼点检测与移除。2) 构建了大规模的Ghost-FWL数据集,为该领域的研究提供了数据基础。3) 提出了FWL-MAE自监督学习方法,能够有效提取FWL数据的特征。与现有方法相比,该方法不依赖于稠密点云的几何信息,更适用于移动激光雷达的稀疏数据。

关键设计:FWL-MAE的关键设计包括:1) 使用掩码策略,随机遮蔽部分FWL数据,迫使模型学习从上下文信息中恢复被遮蔽的部分。2) 使用自编码器结构,将FWL数据编码为低维表征,然后解码重构原始数据。3) 损失函数包括重构损失和对比学习损失,鼓励模型学习具有区分性的表征。具体的网络结构和参数设置在论文中有详细描述,但此处未提供。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,提出的基于FWL的基线模型在鬼点移除精度上优于现有方法。更重要的是,鬼点移除显著提升了下游任务的性能:在LiDAR-based SLAM中,轨迹误差减少了66%;在3D目标检测中,假阳性减少了50倍。这些结果充分证明了该方法在实际应用中的有效性。

🎯 应用场景

该研究成果可广泛应用于自动驾驶、机器人导航、智慧城市等领域。通过有效去除鬼点,可以提高3D地图构建和定位的精度,从而提升自动驾驶系统的安全性和可靠性。此外,该技术还可以应用于机器人导航,使其能够在复杂环境中更准确地感知周围环境。在智慧城市领域,该技术可以用于构建更精确的城市三维模型,为城市规划和管理提供支持。

📄 摘要(原文)

LiDAR has become an essential sensing modality in autonomous driving, robotics, and smart-city applications. However, ghost points (or ghosts), which are false reflections caused by multi-path laser returns from glass and reflective surfaces, severely degrade 3D mapping and localization accuracy. Prior ghost removal relies on geometric consistency in dense point clouds, failing on mobile LiDAR's sparse, dynamic data. We address this by exploiting full-waveform LiDAR (FWL), which captures complete temporal intensity profiles rather than just peak distances, providing crucial cues for distinguishing ghosts from genuine reflections in mobile scenarios. As this is a new task, we present Ghost-FWL, the first and largest annotated mobile FWL dataset for ghost detection and removal. Ghost-FWL comprises 24K frames across 10 diverse scenes with 7.5 billion peak-level annotations, which is 100x larger than existing annotated FWL datasets. Benefiting from this large-scale dataset, we establish a FWL-based baseline model for ghost detection and propose FWL-MAE, a masked autoencoder for efficient self-supervised representation learning on FWL data. Experiments show that our baseline outperforms existing methods in ghost removal accuracy, and our ghost removal further enhances downstream tasks such as LiDAR-based SLAM (66% trajectory error reduction) and 3D object detection (50x false positive reduction). The dataset and code is publicly available and can be accessed via the project page: https://keio-csg.github.io/Ghost-FWL