Learning to Navigate Socially Through Proactive Risk Perception

📄 arXiv: 2510.07871v3 📥 PDF

作者: Erjia Xiao, Lingfeng Zhang, Yingbo Tang, Hao Cheng, Renjing Xu, Wenbo Ding, Lei Zhou, Long Chen, Hangjun Ye, Xiaoshuai Hao

分类: cs.RO, cs.AI, cs.CV, cs.LG

发布日期: 2025-10-09 (更新: 2025-11-07)


💡 一句话要点

提出基于主动风险感知的社交导航方法,提升动态人群环境下的机器人导航能力

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱六:视频提取与匹配 (Video Extraction)

关键词: 社交导航 主动风险感知 机器人导航 RGB-D感知 动态环境

📋 核心要点

  1. 现有社交导航方法难以准确预测动态环境中潜在的碰撞风险,导致机器人导航时安全性不足。
  2. 论文提出主动风险感知模块,学习预测周围人类的碰撞风险,从而增强机器人的空间感知和避碰能力。
  3. 实验结果表明,该方法在Social-HM3D基准上显著提升了机器人在动态人群环境中的导航性能,并在比赛中获得第二名。

📝 摘要(中文)

本报告详细描述了我们提交给IROS 2025 RoboSense挑战赛社交导航赛道的方案的技术细节。该赛道专注于开发基于RGBD的感知和导航系统,使自主智能体能够在动态的人群室内环境中安全、高效且符合社会规范地导航。挑战要求智能体仅使用包括RGB-D观测和里程计在内的板载传感器,从自我中心视角运行,无需访问全局地图或特权信息,同时保持社会规范的遵守,例如安全距离和避免碰撞。在Falcon模型的基础上,我们引入了一个主动风险感知模块,以增强社交导航性能。我们的方法通过碰撞风险理解来增强Falcon,该模块学习预测周围人类的基于距离的碰撞风险评分,这使智能体能够开发更强大的空间感知和主动避碰行为。在Social-HM3D基准上的评估表明,我们的方法提高了智能体在拥挤的室内场景中与动态人类智能体导航到目标时保持个人空间合规性的能力,在挑战赛的16个参赛队伍中获得第二名。

🔬 方法详解

问题定义:现有社交导航方法在动态人群环境中,难以准确预测潜在的碰撞风险,导致机器人无法提前规划路径,容易发生碰撞或侵犯他人个人空间。尤其是在仅依赖RGB-D传感器和里程计等板载传感器的情况下,缺乏全局地图和特权信息,使得风险预测更具挑战性。

核心思路:论文的核心思路是通过学习预测周围行人的碰撞风险,使机器人能够更主动地感知环境中的潜在危险,从而提前规划路径,避免碰撞并保持适当的社交距离。这种主动风险感知能力可以提升机器人在复杂动态环境中的导航安全性和社会适应性。

技术框架:该方法基于Falcon模型,并在此基础上增加了一个主动风险感知模块。整体框架包括:1) 使用RGB-D传感器获取环境信息;2) 利用里程计进行位姿估计;3) 通过Falcon模型进行初步的导航规划;4) 使用主动风险感知模块预测周围行人的碰撞风险;5) 结合风险预测结果,调整导航策略,实现安全、高效的社交导航。

关键创新:该方法最重要的创新点在于引入了主动风险感知模块,该模块能够学习预测周围行人的碰撞风险。与传统的基于规则或静态风险评估的方法不同,该模块能够根据行人的运动状态和环境信息,动态地预测风险,从而更准确地评估潜在的碰撞可能性。

关键设计:主动风险感知模块的关键设计包括:1) 使用距离作为碰撞风险评分的依据;2) 设计合适的网络结构来学习风险预测模型;3) 使用Social-HM3D数据集进行训练和评估;4) 将风险预测结果融入到导航策略中,例如通过调整速度或改变方向来避免高风险区域。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该方法在Social-HM3D基准上进行了评估,实验结果表明,该方法显著提高了机器人在动态人群环境中的导航性能,能够更好地保持个人空间合规性,并在IROS 2025 RoboSense挑战赛社交导航赛道中获得了第二名,证明了其有效性和竞争力。

🎯 应用场景

该研究成果可应用于各种需要在动态人群环境中进行导航的机器人,例如服务机器人、巡逻机器人、自动驾驶轮椅等。通过提升机器人的社交导航能力,可以使其更好地融入人类社会,提供更安全、更高效的服务,并减少人机交互中的冲突和不适。

📄 摘要(原文)

In this report, we describe the technical details of our submission to the IROS 2025 RoboSense Challenge Social Navigation Track. This track focuses on developing RGBD-based perception and navigation systems that enable autonomous agents to navigate safely, efficiently, and socially compliantly in dynamic human-populated indoor environments. The challenge requires agents to operate from an egocentric perspective using only onboard sensors including RGB-D observations and odometry, without access to global maps or privileged information, while maintaining social norm compliance such as safe distances and collision avoidance. Building upon the Falcon model, we introduce a Proactive Risk Perception Module to enhance social navigation performance. Our approach augments Falcon with collision risk understanding that learns to predict distance-based collision risk scores for surrounding humans, which enables the agent to develop more robust spatial awareness and proactive collision avoidance behaviors. The evaluation on the Social-HM3D benchmark demonstrates that our method improves the agent's ability to maintain personal space compliance while navigating toward goals in crowded indoor scenes with dynamic human agents, achieving 2nd place among 16 participating teams in the challenge.