Classifying Bicycle Infrastructure Using On-Bike Street-Level Images
作者: Kal Backman, Ben Beck, Dana Kulić
分类: cs.CV
发布日期: 2024-10-24
备注: 8 pages, 6 figures, presented at ITSC 2024
DOI: 10.1109/ITSC58415.2024.10920149
💡 一句话要点
提出一种基于车载图像的时序分析自行车基础设施分类系统
🎯 匹配领域: 支柱六:视频提取与匹配 (Video Extraction)
关键词: 自行车基础设施 街景图像 时序分析 图像分类 车载相机
📋 核心要点
- 缺乏安全适用的基础设施阻碍了自行车出行的推广,高效绘制城市自行车基础设施地图至关重要。
- 该论文提出一种基于车载街景图像的自行车基础设施分类系统,利用时序分析解决标志稀疏问题。
- 实验结果表明,该模型准确率达到95.38%,且对图像特征缺失具有较强的鲁棒性。
📝 摘要(中文)
本文提出了一种利用车载智能手机相机数据对自行车基础设施进行分类的系统。该系统接收图像序列作为输入,并进行时序分析,以解决标志稀疏的问题。模型输出由分层分类系统定义的自行车基础设施类别标签。数据通过参与者骑行者在墨尔本地区收集,覆盖7006公里,并通过GPS和OpenStreetMap数据库匹配算法自动标记。所提出的模型达到了95.38%的准确率,比非时序模型提高了7.55%。该模型对图像特征的极端缺失表现出鲁棒性,在90%的图像被替换为空白图像后,准确率仅下降了6.6%。这项工作是首次仅使用车载手机相机收集的街景图像对自行车基础设施进行分类,同时通过长时间序列分析证明了对特征稀疏性的鲁棒性。
🔬 方法详解
问题定义:现有方法难以高效且低成本地绘制城市范围内的自行车基础设施地图。传统方法依赖人工调查或专业测绘车辆,成本高昂且效率低下。此外,自行车基础设施的标志可能存在稀疏性,导致基于单帧图像的分类方法效果不佳。
核心思路:该论文的核心思路是利用普通骑行者车载智能手机拍摄的街景图像,结合时序分析方法,自动识别和分类自行车基础设施。通过分析图像序列,可以有效克服标志稀疏带来的问题,提高分类准确率和鲁棒性。
技术框架:该系统主要包含数据采集、数据标注和模型训练三个阶段。首先,通过参与者骑行者在城市中骑行,利用车载智能手机相机采集街景图像。然后,利用GPS数据和OpenStreetMap数据库匹配算法,自动标注图像数据。最后,使用标注好的数据训练一个时序分类模型,用于识别和分类自行车基础设施。
关键创新:该论文的关键创新在于:1) 首次使用车载手机相机拍摄的街景图像进行自行车基础设施分类;2) 提出了一种基于时序分析的方法,有效解决了标志稀疏带来的问题;3) 验证了模型对图像特征缺失的鲁棒性。
关键设计:论文中没有详细描述具体的网络结构、损失函数和参数设置。但是,可以推断,该模型可能采用了循环神经网络(RNN)或Transformer等时序模型,用于分析图像序列。损失函数可能采用了交叉熵损失函数,用于分类任务。具体的参数设置未知。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该模型在墨尔本地区的数据集上达到了95.38%的准确率,相比于非时序模型提高了7.55%。更重要的是,该模型对图像特征缺失具有很强的鲁棒性,即使90%的图像被替换为空白图像,准确率仅下降了6.6%。这表明该模型在实际应用中具有很强的实用价值。
🎯 应用场景
该研究成果可应用于城市自行车基础设施的自动绘制和评估,为城市规划者提供数据支持,优化自行车网络布局,提高骑行安全性。此外,该技术还可扩展到其他交通基础设施的识别和分类,例如人行道、公交站等,具有广泛的应用前景。
📄 摘要(原文)
While cycling offers an attractive option for sustainable transportation, many potential cyclists are discouraged from taking up cycling due to the lack of suitable and safe infrastructure. Efficiently mapping cycling infrastructure across entire cities is necessary to advance our understanding of how to provide connected networks of high-quality infrastructure. Therefore we propose a system capable of classifying available cycling infrastructure from on-bike smartphone camera data. The system receives an image sequence as input, temporally analyzing the sequence to account for sparsity of signage. The model outputs cycling infrastructure class labels defined by a hierarchical classification system. Data is collected via participant cyclists covering 7,006Km across the Greater Melbourne region that is automatically labeled via a GPS and OpenStreetMap database matching algorithm. The proposed model achieved an accuracy of 95.38%, an increase in performance of 7.55% compared to the non-temporal model. The model demonstrated robustness to extreme absence of image features where the model lost only 6.6% in accuracy after 90% of images being replaced with blank images. This work is the first to classify cycling infrastructure using only street-level imagery collected from bike-mounted mobile phone cameras, while demonstrating robustness to feature sparsity via long temporal sequence analysis.