DuMapper: Towards Automatic Verification of Large-Scale POIs with Street Views at Baidu Maps

📄 arXiv: 2411.18073v1 📥 PDF

作者: Miao Fan, Jizhou Huang, Haifeng Wang

分类: cs.AI, cs.IR

发布日期: 2024-11-27


💡 一句话要点

DuMapper:利用百度地图街景数据自动验证大规模兴趣点(POI)

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 兴趣点验证 街景图像 深度学习 近似最近邻搜索 地理信息系统

📋 核心要点

  1. 大规模POI数据库的准确性至关重要,但传统的人工验证成本高昂且效率低下。
  2. DuMapper利用街景图像和坐标信息,通过深度学习生成低维向量,实现快速准确的POI验证。
  3. DuMapper已在百度地图上线,显著提升了POI验证的效率和吞吐量,节省了大量人工成本。

📝 摘要(中文)

随着移动设备的普及,Web地图服务已成为我们日常生活中不可或缺的工具。为了提供令用户满意的服务,兴趣点(POI)数据库作为基础架构至关重要,因为它存档了数十亿与人们生活密切相关的地理位置的多模态信息,例如商店或银行。因此,验证大规模POI数据库的正确性至关重要。为了实现这一目标,许多工业公司采用自愿地理信息(VGI)平台,使成千上万的众包工作者和专家地图绘制者能够无缝地验证POI;但这样做,他们每年必须花费数百万美元。为了节省巨额的人工成本,我们设计了DuMapper,这是一个利用百度地图的多模态街景数据进行大规模POI自动验证的系统。DuMapper以真实世界地点的招牌图像和坐标作为输入,生成一个低维向量,ANN算法可以利用该向量在数据库中数十亿个存档的POI中进行更准确的搜索,从而在几毫秒内完成验证。它可以显著提高POI验证的吞吐量50倍。DuMapper自上线以来已部署在生产环境中,极大地提高了百度地图POI验证的生产力和效率。截至2021年12月31日,它在3.5年的时间内完成了超过4.05亿次的POI验证迭代,相当于约800名高性能专家地图绘制者完成的工作量。

🔬 方法详解

问题定义:论文旨在解决大规模POI数据库的自动验证问题。现有方法依赖于人工验证或众包,成本高昂且效率低下,难以满足海量POI数据的实时更新需求。因此,需要一种自动、高效、准确的POI验证方法,以降低成本并提高效率。

核心思路:论文的核心思路是利用街景图像和POI的坐标信息,通过深度学习模型将POI的视觉特征和地理位置信息编码成低维向量表示。然后,利用近似最近邻(ANN)搜索算法,在海量POI数据库中快速找到与输入POI最匹配的候选POI,从而实现自动验证。这种方法避免了人工干预,提高了验证效率。

技术框架:DuMapper系统的整体框架包括以下几个主要模块:1) 数据采集模块:从百度地图获取街景图像和POI的坐标信息。2) 特征提取模块:利用深度学习模型(具体模型未知)提取街景图像的视觉特征,并结合POI的坐标信息,生成低维向量表示。3) 索引构建模块:利用ANN算法(具体算法未知)对POI数据库中的所有POI向量建立索引,以便快速搜索。4) 验证模块:对于待验证的POI,首先提取其特征向量,然后在索引中搜索最匹配的候选POI,并根据匹配度判断其是否正确。

关键创新:该论文的关键创新在于提出了一种基于街景图像和坐标信息的POI自动验证方法,该方法能够显著提高POI验证的效率和准确性。与传统的人工验证方法相比,DuMapper能够节省大量的人工成本。此外,该方法还能够处理海量的POI数据,满足实时更新的需求。

关键设计:论文中没有详细描述深度学习模型的具体结构和参数设置,以及ANN算法的具体选择和参数设置。这些细节对于复现该方法至关重要,但目前未知。损失函数也未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

DuMapper已在百度地图上线,并在3.5年内完成了超过4.05亿次的POI验证迭代,相当于约800名高性能专家地图绘制者完成的工作量。该系统能够将POI验证的吞吐量提高50倍,显著降低了人工成本,提高了POI验证的效率和准确性。

🎯 应用场景

DuMapper可广泛应用于Web地图服务、导航系统、位置服务等领域,能够提高POI数据的准确性和可靠性,提升用户体验。该研究成果对于构建高质量的地理信息数据库具有重要意义,并可为相关产业带来巨大的经济效益。

📄 摘要(原文)

With the increased popularity of mobile devices, Web mapping services have become an indispensable tool in our daily lives. To provide user-satisfied services, such as location searches, the point of interest (POI) database is the fundamental infrastructure, as it archives multimodal information on billions of geographic locations closely related to people's lives, such as a shop or a bank. Therefore, verifying the correctness of a large-scale POI database is vital. To achieve this goal, many industrial companies adopt volunteered geographic information (VGI) platforms that enable thousands of crowdworkers and expert mappers to verify POIs seamlessly; but to do so, they have to spend millions of dollars every year. To save the tremendous labor costs, we devised DuMapper, an automatic system for large-scale POI verification with the multimodal street-view data at Baidu Maps. DuMapper takes the signboard image and the coordinates of a real-world place as input to generate a low-dimensional vector, which can be leveraged by ANN algorithms to conduct a more accurate search through billions of archived POIs in the database for verification within milliseconds. It can significantly increase the throughput of POI verification by $50$ times. DuMapper has already been deployed in production since \DuMPOnline, which dramatically improves the productivity and efficiency of POI verification at Baidu Maps. As of December 31, 2021, it has enacted over $405$ million iterations of POI verification within a 3.5-year period, representing an approximate workload of $800$ high-performance expert mappers.