Whenever, Wherever: Towards Orchestrating Crowd Simulations with Spatio-Temporal Spawn Dynamics

作者: Thomas Kreutz, Max Mühlhäuser, Alejandro Sanchez Guinea

分类: cs.LG

发布日期: 2025-03-20 (更新: 2025-06-16)

💡 一句话要点

提出nTPP-GMM模型，用于人群仿真中时空生成动态的建模与编排。

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture)

关键词: 人群仿真 时空动态 神经时序点过程 高斯混合模型 数据驱动 虚拟环境 智能体生成

📋 核心要点

现有数据驱动的人群仿真方法在微观层面表现良好，但忽略了人群密度和流量等宏观特征，这些特征受时空生成动态影响。
论文提出nTPP-GMM模型，利用神经时序点过程（nTPPs）建模时空生成动态，并结合高斯混合模型（GMM）确定智能体的生成和目标位置。
实验结果表明，nTPP-GMM能够生成更逼真的人群仿真，更好地反映真实世界的人群行为，并支持人群分析。

📝 摘要（中文）

逼真的人群仿真是沉浸式虚拟环境的关键，它依赖于个体行为（微观动态）和整体人群模式（宏观特征）。虽然最近的深度强化学习等数据驱动方法提高了微观真实感，但它们常常忽略了关键的宏观特征，如人群密度和流量，这些特征由时空生成动态控制，即智能体何时何地进入场景。传统方法，如随机生成率、随机过程或固定时间表，不能保证捕捉到潜在的复杂性，或者缺乏多样性和真实感。为了解决这个问题，我们提出了一种名为nTPP-GMM的新方法，该方法使用神经时序点过程（nTPPs）建模时空生成动态，并将其与用于智能体生成和目标位置的生成条件高斯混合模型（GMM）相结合。我们通过使用nTPP-GMM编排三个不同的真实世界数据集的人群仿真来评估我们的方法。我们的实验表明，使用nTPP-GMM的编排能够产生反映真实世界人群场景的逼真仿真，并允许人群分析。

🔬 方法详解

问题定义：现有的人群仿真方法，特别是基于深度强化学习的方法，虽然在个体行为的建模上取得了进展，但往往忽略了人群的宏观特性，例如人群密度和流量。这些宏观特性很大程度上取决于智能体在何时何地进入场景，即时空生成动态。传统方法，如随机生成或固定时间表，无法捕捉到真实世界人群行为的复杂性和多样性。

核心思路：论文的核心思路是利用神经时序点过程（nTPPs）来建模人群的时空生成动态。nTPPs能够学习和预测事件（即智能体的生成）在时间和空间上的分布。此外，论文还结合了生成条件高斯混合模型（GMM），用于确定新生成智能体的初始位置和目标位置。通过这种方式，模型能够学习真实世界人群生成模式，并生成更逼真的仿真。

技术框架：该方法主要包含两个模块：nTPP模块和GMM模块。首先，nTPP模块接收历史人群数据，学习人群生成的时间和位置分布，并预测下一个智能体生成的时间。然后，GMM模块根据nTPP模块预测的生成时间，确定新生成智能体的初始位置和目标位置。这两个模块共同作用，实现对人群时空生成动态的建模和仿真。

关键创新：该方法最重要的创新点在于将神经时序点过程（nTPPs）引入到人群仿真中，用于建模人群的时空生成动态。与传统的随机生成或固定时间表方法相比，nTPPs能够学习真实世界人群生成模式，并生成更逼真的仿真。此外，结合GMM模块，能够更好地控制智能体的初始位置和目标位置，进一步提高仿真的真实感。

关键设计：nTPP模块的具体网络结构未知，但通常包含循环神经网络（RNN）或Transformer等结构，用于处理时序数据。GMM模块的关键在于如何选择合适的混合成分数量和参数。损失函数的设计需要同时考虑nTPP模块的预测精度和GMM模块的生成质量。具体的参数设置和损失函数细节在论文中可能有所描述，但此处未知。

🖼️ 关键图片

📊 实验亮点

论文通过在三个不同的真实世界数据集上进行实验，验证了nTPP-GMM模型的有效性。实验结果表明，与传统方法相比，nTPP-GMM能够生成更逼真的人群仿真，更好地反映真实世界的人群行为。具体的性能数据和提升幅度在论文中可能有所描述，但此处未知。

🎯 应用场景

该研究成果可应用于多种领域，例如城市规划、交通管理、安全疏散模拟、虚拟现实游戏等。通过更逼真的人群仿真，可以更好地评估城市规划方案的合理性、优化交通流量、提高安全疏散效率，并为虚拟现实游戏提供更真实的体验。此外，该方法还可以用于分析人群行为模式，为公共安全提供支持。

📄 摘要（原文）

Realistic crowd simulations are essential for immersive virtual environments, relying on both individual behaviors (microscopic dynamics) and overall crowd patterns (macroscopic characteristics). While recent data-driven methods like deep reinforcement learning improve microscopic realism, they often overlook critical macroscopic features such as crowd density and flow, which are governed by spatio-temporal spawn dynamics, namely, when and where agents enter a scene. Traditional methods, like random spawn rates, stochastic processes, or fixed schedules, are not guaranteed to capture the underlying complexity or lack diversity and realism. To address this issue, we propose a novel approach called nTPP-GMM that models spatio-temporal spawn dynamics using Neural Temporal Point Processes (nTPPs) that are coupled with a spawn-conditional Gaussian Mixture Model (GMM) for agent spawn and goal positions. We evaluate our approach by orchestrating crowd simulations of three diverse real-world datasets with nTPP-GMM. Our experiments demonstrate the orchestration with nTPP-GMM leads to realistic simulations that reflect real-world crowd scenarios and allow crowd analysis.

Whenever, Wherever: Towards Orchestrating Crowd Simulations with Spatio-Temporal Spawn Dynamics

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理