Collecting Human Motion Data in Large and Occlusion-Prone Environments using Ultra-Wideband Localization
作者: Janik Kaden, Maximilian Hilger, Tim Schreiter, Marius Schaab, Thomas Graichen, Andrey Rudenko, Ulrich Heinkel, Achim J. Lilienthal
分类: cs.RO, cs.HC, cs.LG
发布日期: 2025-05-09
备注: accepted for presentation at the 7th Workshop on Long-term Human Motion Prediction (LHMP) at International Conference on Robotics and Automation (ICRA) 2025
💡 一句话要点
利用超宽带定位技术,解决复杂环境中人体运动数据采集难题
🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)
关键词: 超宽带定位 人体运动捕捉 多模态融合 机器人导航 环境感知
📋 核心要点
- 现有运动捕捉系统成本高昂、易受遮挡影响,难以在大型复杂环境中部署,限制了人体运动数据采集的规模和应用。
- 本文提出利用超宽带(UWB)定位技术,结合眼动追踪、激光雷达和雷达等多模态传感器,实现可扩展的人体运动数据采集。
- 在模拟博物馆环境中,采集了超过130分钟的多模态数据,为评估UWB在复杂环境中的人体运动捕捉能力奠定基础。
📝 摘要(中文)
为了使机器人更好地融入人类环境,理解和预测人类运动至关重要。目前的人体运动和活动预测方法需要大量高质量的数据进行训练和评估,这些数据通常来自运动捕捉系统、车载或固定传感器。然而,这些系统的搭建具有挑战性,包括硬件组件的复杂设置、繁琐的校准程序、遮挡问题以及高昂的成本。这些限制使得在新的大型环境中部署此类系统变得困难,并限制了它们在实际测量中的可用性。本文研究了应用新型超宽带(UWB)定位技术作为一种可扩展的替代方案,用于在拥挤和容易发生遮挡的环境中进行人体运动捕捉的可能性。我们还加入了额外的传感方式,如眼动追踪、车载机器人激光雷达和雷达传感器,并记录运动捕捉数据作为评估和比较的ground truth。环境模拟博物馆设置,最多有四名活跃参与者以自然的方式导航到随机目标,并提供超过130分钟的多模态数据。我们的研究为超越基于视觉的系统进行可扩展和准确的运动数据收集迈出了一步,为评估UWB等传感方式在仓库、机场或会议中心等更大更复杂的环境中的应用奠定了基础。
🔬 方法详解
问题定义:现有的人体运动捕捉系统,如光学动作捕捉系统,存在成本高、设置复杂、易受遮挡影响等问题,难以在大规模、复杂的真实环境中应用。这限制了高质量人体运动数据的获取,进而影响了相关人工智能算法的训练和性能。
核心思路:本文的核心思路是利用超宽带(UWB)定位技术作为一种低成本、抗遮挡的替代方案,用于在复杂环境中进行人体运动捕捉。UWB技术通过测量无线电信号的飞行时间来确定物体的位置,具有穿透性强、定位精度高等优点。
技术框架:该研究采用多模态融合的框架,将UWB定位数据与眼动追踪、车载机器人激光雷达和雷达传感器的数据相结合,以提高运动捕捉的准确性和鲁棒性。同时,使用光学动作捕捉系统采集的数据作为ground truth,用于评估UWB定位的性能。数据采集环境模拟博物馆场景,参与者在其中自由移动。
关键创新:该研究的关键创新在于探索了UWB技术在复杂环境人体运动捕捉中的应用潜力,并验证了其作为一种可扩展替代方案的可行性。与传统的视觉方法相比,UWB技术具有更好的抗遮挡能力,更适合在拥挤和复杂的环境中使用。
关键设计:实验中,使用了多个UWB锚点来构建定位网络,并通过卡尔曼滤波等算法对UWB定位数据进行平滑和融合。同时,设计了特定的实验场景和运动模式,以评估UWB定位在不同条件下的性能。具体参数设置和损失函数等技术细节在论文中未详细说明,属于未知信息。
🖼️ 关键图片
📊 实验亮点
该研究在模拟博物馆环境中采集了超过130分钟的多模态人体运动数据,包括UWB定位数据、眼动追踪数据、激光雷达数据和雷达数据。实验结果表明,UWB定位技术在一定程度上可以替代传统的视觉方法,尤其是在遮挡严重的环境中。具体的性能数据和提升幅度在摘要中未明确给出,属于未知信息。
🎯 应用场景
该研究成果可应用于机器人导航、人机交互、智能监控、虚拟现实等领域。例如,在仓库、机场等大型环境中,可以利用UWB技术实现对人员的精确定位和跟踪,从而提高工作效率和安全性。未来,结合人工智能算法,可以实现对人类行为的理解和预测,为机器人提供更智能的交互能力。
📄 摘要(原文)
With robots increasingly integrating into human environments, understanding and predicting human motion is essential for safe and efficient interactions. Modern human motion and activity prediction approaches require high quality and quantity of data for training and evaluation, usually collected from motion capture systems, onboard or stationary sensors. Setting up these systems is challenging due to the intricate setup of hardware components, extensive calibration procedures, occlusions, and substantial costs. These constraints make deploying such systems in new and large environments difficult and limit their usability for in-the-wild measurements. In this paper we investigate the possibility to apply the novel Ultra-Wideband (UWB) localization technology as a scalable alternative for human motion capture in crowded and occlusion-prone environments. We include additional sensing modalities such as eye-tracking, onboard robot LiDAR and radar sensors, and record motion capture data as ground truth for evaluation and comparison. The environment imitates a museum setup, with up to four active participants navigating toward random goals in a natural way, and offers more than 130 minutes of multi-modal data. Our investigation provides a step toward scalable and accurate motion data collection beyond vision-based systems, laying a foundation for evaluating sensing modalities like UWB in larger and complex environments like warehouses, airports, or convention centers.