NeMo-map: Neural Implicit Flow Fields for Spatio-Temporal Motion Mapping

📄 arXiv: 2510.14827v2 📥 PDF

作者: Yufei Zhu, Shih-Min Yang, Andrey Rudenko, Tomasz P. Kucner, Achim J. Lilienthal, Martin Magnusson

分类: cs.RO

发布日期: 2025-10-16 (更新: 2026-02-01)

备注: Published as a conference paper at ICLR 2026

🔗 代码/项目: GITHUB


💡 一句话要点

提出NeMo-map,基于神经隐式流场的时空运动模式建模方法,用于提升复杂环境下的机器人安全。

🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)

关键词: 运动动力学地图 隐式神经函数 时空建模 机器人导航 轨迹预测

📋 核心要点

  1. 现有运动动力学地图(MoD)方法依赖离散空间采样,且通常需要耗时的离线构建,限制了其在复杂环境中的应用。
  2. NeMo-map利用隐式神经函数,将时空坐标直接映射到半包裹高斯混合模型的参数,实现连续的运动模式表示。
  3. 实验表明,NeMo-map在运动表示精度和稀疏区域速度分布平滑性方面优于现有方法,同时保持计算效率。

📝 摘要(中文)

本文提出了一种连续的时空运动动力学地图(MoD)表示方法,该方法基于隐式神经函数,直接将坐标映射到半包裹高斯混合模型(Semi-Wrapped Gaussian Mixture Model)的参数。这种方法消除了离散化的需求,并对不均匀采样的区域进行平滑泛化,从而实现空间和时间上的平滑推广。在两个包含真实世界行人跟踪数据的公共数据集上进行评估,与现有基线相比,该方法在运动表示的准确性和稀疏区域的速度分布平滑性方面都表现出更好的性能,同时保持了计算效率。该方法展示了一种强大而高效的建模复杂人类运动模式的方式,并在轨迹预测下游任务中表现出高性能。

🔬 方法详解

问题定义:现有运动动力学地图(MoD)方法通常采用离散的空间采样,这导致了两个主要问题:一是需要对未采样区域进行插补,二是无法保证运动模式在空间和时间上的平滑性。此外,传统方法通常需要耗时的离线构建过程,难以适应动态变化的环境。因此,需要一种能够连续表示时空运动模式,并且能够高效构建和更新的MoD方法。

核心思路:NeMo-map的核心思路是利用隐式神经函数来表示连续的时空运动模式。具体来说,它将时空坐标作为输入,通过一个神经网络直接预测半包裹高斯混合模型(Semi-Wrapped Gaussian Mixture Model, SWGMM)的参数。SWGMM能够有效地表示速度分布,并且能够处理周期性运动。通过这种方式,NeMo-map避免了离散化和插补,实现了空间和时间上的平滑泛化。

技术框架:NeMo-map的整体框架包括以下几个主要步骤:1)数据收集:收集包含时空坐标和速度信息的运动数据。2)模型训练:使用收集到的数据训练一个隐式神经函数,该函数将时空坐标映射到SWGMM的参数。3)运动模式提取:给定一个时空坐标,使用训练好的神经函数预测SWGMM的参数,从而得到该位置的运动模式。4)轨迹预测(下游任务):将学习到的运动模式用于轨迹预测等下游任务。

关键创新:NeMo-map的关键创新在于使用隐式神经函数来表示连续的时空运动模式。与传统的离散表示方法相比,NeMo-map能够实现空间和时间上的平滑泛化,并且能够高效地构建和更新。此外,NeMo-map使用SWGMM来表示速度分布,能够有效地处理周期性运动。

关键设计:NeMo-map的关键设计包括:1)隐式神经函数的网络结构:可以使用任何类型的神经网络,例如MLP或Transformer。2)损失函数:损失函数用于衡量预测的SWGMM参数与真实运动数据之间的差异。可以使用负对数似然损失函数。3)SWGMM的参数化:SWGMM的参数包括混合权重、均值和方差。这些参数可以通过神经网络直接预测。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在两个公共数据集上的实验结果表明,NeMo-map在运动表示的准确性和稀疏区域的速度分布平滑性方面优于现有基线。具体来说,NeMo-map能够更准确地预测行人的运动轨迹,并且在稀疏区域能够生成更平滑的速度分布。此外,NeMo-map的计算效率也很高,能够实时地构建和更新运动动力学地图。

🎯 应用场景

NeMo-map可应用于机器人导航、自动驾驶、人群行为分析等领域。通过准确建模人类运动模式,机器人可以更好地理解周围环境,从而做出更安全、更高效的决策。例如,在人机协作场景中,机器人可以预测行人的运动轨迹,避免碰撞。在自动驾驶领域,可以用于预测其他车辆和行人的行为,提高驾驶安全性。此外,该方法还可以用于人群行为分析,例如监测异常行为或优化交通流量。

📄 摘要(原文)

Safe and efficient robot operation in complex human environments can benefit from good models of site-specific motion patterns. Maps of Dynamics (MoDs) provide such models by encoding statistical motion patterns in a map, but existing representations use discrete spatial sampling and typically require costly offline construction. We propose a continuous spatio-temporal MoD representation based on implicit neural functions that directly map coordinates to the parameters of a Semi-Wrapped Gaussian Mixture Model. This removes the need for discretization and imputation for unevenly sampled regions, enabling smooth generalization across both space and time. Evaluated on two public datasets with real-world people tracking data, our method achieves better accuracy of motion representation and smoother velocity distributions in sparse regions while still being computationally efficient, compared to available baselines. The proposed approach demonstrates a powerful and efficient way of modeling complex human motion patterns and high performance in the trajectory prediction downstream task. Project code is available at https://github.com/test-bai-cpu/nemo-map