Accurate Training Data for Occupancy Map Prediction in Automated Driving Using Evidence Theory
作者: Jonas Kälble, Sascha Wirges, Maxim Tatarchenko, Eddy Ilg
分类: cs.CV
发布日期: 2024-05-17
💡 一句话要点
提出基于证据理论的LiDAR点云重建方法,提升自动驾驶场景 occupancy map 预测精度。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 自动驾驶 Occupancy Map LiDAR 证据理论 环境感知 深度学习 点云处理
📋 核心要点
- 现有方法将 LiDAR 数据转换为 occupancy map 的质量不高,限制了自动驾驶场景几何结构预测的精度。
- 利用证据理论融合 LiDAR 数据,提出一种新的 occupancy map 重建方法,提高重建精度并提供不确定性估计。
- 实验表明,该方法显著提升了 occupancy map 的质量,并能有效提升下游 occupancy 预测任务的性能。
📝 摘要(中文)
自动驾驶需要对周围环境几何结构的精确感知。目前的方法通常仅使用图像来预测 occupancy map 以表示几何结构。训练这些方法需要精确的数据,这可以通过 LiDAR 扫描仪获得。本文指出,当前基准和训练数据集将 LiDAR 扫描转换为 occupancy grid map 的技术质量低下。因此,本文提出了一种使用证据理论的新方法,可以产生更精确的重建结果。实验表明,该方法在质量和数量上都优于现有方法,并且可以获得有意义的不确定性估计。将 occupancy map 转换回深度估计并与原始 LiDAR 测量值进行比较时,该方法在 nuScenes 和 Waymo 数据集上分别实现了 30% 到 52% 和 53% 的 MAE 改进。最后,使用改进的 occupancy map 训练最先进的 occupancy 预测方法,在 nuScenes 上将 MAE 提高了 25%。
🔬 方法详解
问题定义:论文旨在解决自动驾驶中 occupancy map 预测训练数据质量不高的问题。现有的将 LiDAR 数据转换为 occupancy map 的方法存在精度低、噪声敏感等问题,导致训练出的模型泛化能力差,影响自动驾驶系统的安全性和可靠性。
核心思路:论文的核心思路是利用证据理论来融合 LiDAR 数据,从而更准确地重建 occupancy map。证据理论能够处理不确定性和冲突信息,可以有效地融合来自不同 LiDAR 点的信息,并提供不确定性估计,从而提高重建的鲁棒性和精度。
技术框架:该方法主要包括以下几个步骤:1) 将 LiDAR 点云投影到 occupancy grid map 上;2) 为每个 grid cell 计算基于证据理论的基本概率分配(Basic Probability Assignment, BPA),BPA 反映了该 cell 被占据、空闲或未知的置信度;3) 使用 Dempster-Shafer 组合规则融合来自不同 LiDAR 点的 BPA;4) 根据融合后的 BPA 计算每个 cell 的置信度,并将其作为 occupancy map 的值。
关键创新:该方法最重要的创新点在于将证据理论引入到 LiDAR 数据的 occupancy map 重建中。与传统的二元占用栅格地图相比,证据理论能够更好地处理不确定性,并提供更丰富的场景信息。此外,该方法还提出了一种新的 BPA 计算方法,能够更准确地反映 LiDAR 点的测量误差和噪声。
关键设计:BPA 的计算是该方法的一个关键设计。论文提出了一种基于距离和角度的 BPA 计算方法,该方法考虑了 LiDAR 点的测量误差和角度分辨率。此外,论文还使用了 Dempster-Shafer 组合规则来融合来自不同 LiDAR 点的 BPA,该规则能够有效地处理冲突信息,并提高融合结果的可靠性。损失函数方面,论文使用了 MAE (Mean Absolute Error) 来评估 occupancy map 的重建质量,并使用交叉熵损失函数来训练 occupancy 预测模型。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在 nuScenes 和 Waymo 数据集上,将 occupancy map 转换回深度估计并与原始 LiDAR 测量值进行比较时,MAE 分别改进了 30%-52% 和 53%,显著优于其他 occupancy ground-truth 数据生成方法。此外,使用该方法生成的 occupancy map 训练 occupancy 预测模型,在 nuScenes 数据集上将 MAE 降低了 25%。
🎯 应用场景
该研究成果可应用于自动驾驶、机器人导航、三维重建等领域。高质量的 occupancy map 可以为自动驾驶系统提供更准确的环境感知信息,提高决策的可靠性和安全性。此外,该方法还可以用于生成高质量的训练数据,从而提高深度学习模型的性能。未来,该方法可以进一步扩展到融合多种传感器数据,例如摄像头、雷达等,从而实现更全面的环境感知。
📄 摘要(原文)
Automated driving fundamentally requires knowledge about the surrounding geometry of the scene. Modern approaches use only captured images to predict occupancy maps that represent the geometry. Training these approaches requires accurate data that may be acquired with the help of LiDAR scanners. We show that the techniques used for current benchmarks and training datasets to convert LiDAR scans into occupancy grid maps yield very low quality, and subsequently present a novel approach using evidence theory that yields more accurate reconstructions. We demonstrate that these are superior by a large margin, both qualitatively and quantitatively, and that we additionally obtain meaningful uncertainty estimates. When converting the occupancy maps back to depth estimates and comparing them with the raw LiDAR measurements, our method yields a MAE improvement of 30% to 52% on nuScenes and 53% on Waymo over other occupancy ground-truth data. Finally, we use the improved occupancy maps to train a state-of-the-art occupancy prediction method and demonstrate that it improves the MAE by 25% on nuScenes.