GHAR: GeoPose-based Handheld Augmented Reality for Architectural Positioning, Manipulation and Visual Exploration

📄 arXiv: 2506.14414v1 📥 PDF

作者: Sabahat Israr, Dawar Khan, Zhanglin Cheng, Mukhtaj Khan, Kiyoshi Kiyokawa

分类: cs.GR

发布日期: 2025-06-17


💡 一句话要点

提出GHAR框架以解决传统标记追踪的局限性

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 手持增强现实 无标记追踪 建筑模型 GeoPose 用户体验 手势识别 施工技术

📋 核心要点

  1. 现有的手持增强现实技术主要依赖标记追踪,存在使用不便、光线敏感等问题。
  2. 本文提出了一种基于GeoPose的无标记HAR框架GHAR,利用手势实现建筑模型的操作与可视化。
  3. 实验结果表明,GHAR在可用性、可操作性和可理解性方面显著优于传统的标记追踪框架。

📝 摘要(中文)

手持增强现实(HAR)正在改变土木基础设施应用领域。当前的HAR技术依赖于标记追踪,但标记系统存在使用和安装困难、对光线敏感及标记设计等多种限制。本文提出了一种无标记的HAR框架,基于GeoPose进行追踪,利用不同手势实现7自由度的操作(每个方向3自由度,缩放1自由度)。该框架GHAR专为建筑模型设计,能够在地面上增强虚拟CAD建筑模型,使用户在实际施工前可对建筑模型进行操作和可视化。系统为建筑基础设施提供快速视图,在施工技术的需求分析和规划中发挥重要作用。通过标准用户研究评估了系统的可用性、可操作性和可理解性,结果显示无标记框架在这三方面显著优于标记框架。

🔬 方法详解

问题定义:本文旨在解决传统手持增强现实技术中标记追踪的局限性,包括使用复杂、对环境光敏感等问题。

核心思路:提出基于GeoPose的无标记追踪方法,通过手势识别实现对建筑模型的操作,提升用户体验和操作灵活性。

技术框架:GHAR框架包括三个主要模块:GeoPose追踪模块、手势识别模块和建筑模型渲染模块。用户通过手势与虚拟模型进行交互,系统实时更新模型的显示。

关键创新:GHAR的核心创新在于无标记追踪技术的应用,突破了传统标记系统的限制,使得用户可以在更自然的环境中进行交互。

关键设计:系统设计中采用了多种手势识别算法,并设置了适应不同环境的参数,以确保在各种光照条件下的稳定性和准确性。

📊 实验亮点

实验结果显示,GHAR框架在用户可用性、可操作性和可理解性方面的评分显著高于传统的标记追踪框架,具体提升幅度超过20%。这种显著的改进表明无标记追踪技术在实际应用中的有效性和优势。

🎯 应用场景

GHAR框架在建筑设计和施工阶段具有广泛的应用潜力。它可以帮助建筑师和工程师在实际施工前进行虚拟模型的可视化和操作,从而提高设计效率,降低施工风险。此外,该技术还可扩展到城市规划、室内设计等领域,推动相关行业的数字化转型。

📄 摘要(原文)

Handheld Augmented Reality (HAR) is revolutionizing the civil infrastructure application domain. The current trend in HAR relies on marker tracking technology. However, marker-based systems have several limitations, such as difficulty in use and installation, sensitivity to light, and marker design. In this paper, we propose a markerless HAR framework with GeoPose-based tracking. We use different gestures for manipulation and achieve 7 DOF (3 DOF each for translation and rotation, and 1 DOF for scaling). The proposed framework, called GHAR, is implemented for architectural building models. It augments virtual CAD models of buildings on the ground, enabling users to manipulate and visualize an architectural model before actual construction. The system offers a quick view of the building infrastructure, playing a vital role in requirement analysis and planning in construction technology. We evaluated the usability, manipulability, and comprehensibility of the proposed system using a standard user study with the System Usability Scale (SUS) and Handheld Augmented Reality User Study (HARUS). We compared our GeoPose-based markerless HAR framework with a marker-based HAR framework, finding significant improvement in the aforementioned three parameters with the markerless framework.