SICNav-Diffusion: Safe and Interactive Crowd Navigation with Diffusion Trajectory Predictions
作者: Sepehr Samavi, Anthony Lem, Fumiaki Sato, Sirui Chen, Qiao Gu, Keijiro Yano, Angela P. Schoellig, Florian Shkurti
分类: cs.RO
发布日期: 2025-03-11 (更新: 2025-06-30)
备注: Accepted to IEEE Robotics and Automation Letters (RA-L)
期刊: IEEE Robotics and Automation Letters 2025
💡 一句话要点
提出SICNav-Diffusion,通过扩散模型预测轨迹,实现安全交互式人群导航
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 人群导航 轨迹预测 扩散模型 模型预测控制 人机交互
📋 核心要点
- 现有基于学习的轨迹预测模型难以保证机器人导航的安全性,尤其是在人机交互场景下,需要考虑机器人动作对人类行为的影响。
- 论文提出SICNav-Diffusion,利用扩散模型生成人类轨迹预测,并将其融入双层模型预测控制(MPC)框架,实现安全且交互式的人群导航。
- 通过模拟和真实机器人实验验证了该方法的有效性,结果表明该方法能够实现安全、高效和反应灵敏的机器人运动。
📝 摘要(中文)
为了在人群中无碰撞地导航,机器人必须预测人类的未来运动并做出相应反应。虽然基于学习的预测模型在生成可能的人类轨迹预测方面取得了成功,但将这些随机模型集成到机器人控制器中存在若干挑战。控制器需要考虑规划的机器人运动与人类预测之间的交互耦合,同时确保预测和机器人动作都是安全的(即无碰撞)。为了应对这些挑战,我们提出了一种用于单机器人多人类环境的后退视界人群导航方法。我们首先提出了一个扩散模型来生成场景中所有人类的联合轨迹预测。然后,我们将这些多模态预测整合到一个SICNav双层MPC问题中,该问题同时求解机器人规划(上层)并充当安全过滤器以细化非碰撞预测(下层)。将规划和预测细化结合到一个双层问题中,确保机器人规划和人类预测是耦合的。我们在常用的ETH/UCY基准上验证了扩散模型的开环轨迹预测性能,并在模拟和广泛的真实机器人实验中评估了机器人导航方法的闭环性能,展示了安全、高效和反应灵敏的机器人运动。
🔬 方法详解
问题定义:论文旨在解决人群导航中机器人与行人之间的安全交互问题。现有方法通常难以同时保证预测的准确性和导航的安全性,尤其是在考虑机器人行为对行人轨迹的影响时。此外,多模态轨迹预测的集成也增加了控制器的复杂性。
核心思路:论文的核心思路是将轨迹预测和运动规划整合到一个双层优化问题中。上层优化机器人的运动轨迹,下层则作为安全过滤器,根据机器人的规划调整人类的轨迹预测,确保无碰撞。扩散模型用于生成多模态的人类轨迹预测,为上层规划提供依据。
技术框架:整体框架包含两个主要模块:1) 扩散模型轨迹预测器:该模块使用扩散模型生成场景中所有行人的联合轨迹预测。2) SICNav双层MPC控制器:该模块包含一个上层优化器,用于规划机器人的运动轨迹;以及一个下层安全过滤器,用于根据机器人的规划调整人类的轨迹预测,确保无碰撞。这两个模块通过双层优化问题进行耦合,实现交互式的导航。
关键创新:论文的关键创新在于将扩散模型和双层MPC相结合,实现安全且交互式的人群导航。扩散模型能够生成多模态的轨迹预测,为机器人提供更全面的信息。双层MPC则能够同时优化机器人的运动轨迹和人类的轨迹预测,确保安全性和交互性。
关键设计:扩散模型采用标准的扩散模型结构,通过添加噪声和去噪过程来生成轨迹预测。双层MPC的上层优化器使用标准的MPC公式,目标是最小化机器人的运动成本和与目标的距离。下层安全过滤器则通过约束人类的轨迹,确保其与机器人的轨迹之间没有碰撞。具体的损失函数和约束条件根据实际场景进行调整。
🖼️ 关键图片
📊 实验亮点
论文在ETH/UCY数据集上验证了扩散模型的轨迹预测性能,并在模拟和真实机器人实验中评估了闭环导航性能。实验结果表明,该方法能够生成准确的人类轨迹预测,并实现安全、高效和反应灵敏的机器人运动。与传统的基于规则的方法相比,该方法能够更好地适应复杂的人群环境,并减少碰撞的发生。
🎯 应用场景
该研究成果可应用于各种需要与人群交互的机器人场景,例如:商场导览机器人、医院送药机器人、餐厅服务机器人等。通过预测人群行为并做出安全反应,可以提高机器人的自主性和适应性,使其更好地融入人类社会,并提供更高效、安全的服务。未来,该技术还可以扩展到自动驾驶领域,提高车辆在复杂交通环境中的安全性。
📄 摘要(原文)
To navigate crowds without collisions, robots must interact with humans by forecasting their future motion and reacting accordingly. While learning-based prediction models have shown success in generating likely human trajectory predictions, integrating these stochastic models into a robot controller presents several challenges. The controller needs to account for interactive coupling between planned robot motion and human predictions while ensuring both predictions and robot actions are safe (i.e. collision-free). To address these challenges, we present a receding horizon crowd navigation method for single-robot multi-human environments. We first propose a diffusion model to generate joint trajectory predictions for all humans in the scene. We then incorporate these multi-modal predictions into a SICNav Bilevel MPC problem that simultaneously solves for a robot plan (upper-level) and acts as a safety filter to refine the predictions for non-collision (lower-level). Combining planning and prediction refinement into one bilevel problem ensures that the robot plan and human predictions are coupled. We validate the open-loop trajectory prediction performance of our diffusion model on the commonly used ETH/UCY benchmark and evaluate the closed-loop performance of our robot navigation method in simulation and extensive real-robot experiments demonstrating safe, efficient, and reactive robot motion.