VelocityNet: Real-Time Crowd Anomaly Detection via Person-Specific Velocity Analysis

📄 arXiv: 2510.18187v1 📥 PDF

作者: Fatima AlGhamdi, Omar Alharbi, Abdullah Aldwyish, Raied Aljadaany, Muhammad Kamran J Khan, Huda Alamri

分类: cs.CV, cs.AI

发布日期: 2025-10-21

备注: 8 pages, 3 figures


💡 一句话要点

VelocityNet:基于个体速度分析的实时人群异常检测

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 人群异常检测 光流估计 速度分析 实时监控 拥挤场景

📋 核心要点

  1. 现有拥挤场景异常检测方法难以适应不同密度,缺乏可解释性,限制了其应用。
  2. VelocityNet通过头部检测和光流估计个体速度,并聚类为语义运动类别,实现异常检测。
  3. 实验证明VelocityNet能实时检测拥挤环境中的多种异常运动,具有实际应用价值。

📝 摘要(中文)

在拥挤场景中检测异常行为极具挑战,因为个体之间存在严重的遮挡,且运动模式高度动态并依赖于上下文。现有方法通常难以适应变化的拥挤密度,并且缺乏可解释的异常指标。为了解决这些局限性,我们提出了 VelocityNet,一个双通道框架,它结合了头部检测和密集光流来提取个体特定的速度。分层聚类将这些速度分类为语义运动类别(停止、慢速、正常和快速),并且基于百分位数的异常评分系统测量与学习到的正常模式的偏差。实验表明,我们的框架能够实时检测密集拥挤环境中各种异常运动模式。

🔬 方法详解

问题定义:论文旨在解决拥挤场景下实时、准确地检测异常行为的问题。现有方法的痛点在于难以处理个体遮挡、运动模式复杂且上下文依赖性强的情况,同时缺乏对异常行为的可解释性,难以适应不同人群密度。

核心思路:论文的核心思路是通过分析个体速度来判断异常。正常人群的行为模式具有一定的规律性,而异常行为通常表现为速度上的显著偏差。通过提取个体速度特征,并将其与学习到的正常模式进行比较,可以有效地检测出异常行为。这种方法具有较强的可解释性,能够提供关于异常行为类型的线索。

技术框架:VelocityNet是一个双通道框架,包含以下主要模块:1)头部检测:用于定位场景中的个体;2)密集光流估计:用于计算每个个体的速度;3)速度聚类:将个体速度聚类为不同的语义运动类别(停止、慢速、正常、快速);4)异常评分:基于个体速度所属类别的概率分布,计算异常分数。整体流程是先检测头部,然后计算光流,再进行速度聚类,最后进行异常评分。

关键创新:VelocityNet的关键创新在于:1) 提出了一种基于个体速度分析的异常检测方法,能够有效地处理拥挤场景下的遮挡问题;2) 通过速度聚类,将速度信息转化为更具语义信息的运动类别,提高了异常检测的可解释性;3) 采用双通道框架,分别处理头部检测和光流估计,提高了系统的鲁棒性和效率。

关键设计:在头部检测方面,可以使用现有的目标检测器,如YOLO或Faster R-CNN。在光流估计方面,可以使用Dense Inverse Search (DIS) 光流算法。速度聚类可以使用K-means或高斯混合模型。异常评分可以使用基于百分位数的统计方法,例如,如果一个人的速度属于“停止”类别,而该类别在正常人群中出现的概率很低,则该人的异常分数会很高。

📊 实验亮点

论文通过实验验证了VelocityNet在拥挤场景下异常检测的有效性。实验结果表明,VelocityNet能够实时检测多种异常运动模式,并且具有较高的准确率和召回率。与现有方法相比,VelocityNet在处理高密度人群和复杂运动模式方面表现更优,能够提供更具可解释性的异常检测结果。具体性能数据和对比基线在论文中进行了详细描述。

🎯 应用场景

VelocityNet可应用于智能监控、公共安全等领域,例如在机场、火车站、商场等人员密集的场所,实时检测异常行为,如奔跑、跌倒、聚集等,及时发出警报,防止意外事件的发生。该研究有助于提升城市安全管理水平,为构建智慧城市提供技术支撑,并可扩展到机器人导航、自动驾驶等领域。

📄 摘要(原文)

Detecting anomalies in crowded scenes is challenging due to severe inter-person occlusions and highly dynamic, context-dependent motion patterns. Existing approaches often struggle to adapt to varying crowd densities and lack interpretable anomaly indicators. To address these limitations, we introduce VelocityNet, a dual-pipeline framework that combines head detection and dense optical flow to extract person-specific velocities. Hierarchical clustering categorizes these velocities into semantic motion classes (halt, slow, normal, and fast), and a percentile-based anomaly scoring system measures deviations from learned normal patterns. Experiments demonstrate the effectiveness of our framework in real-time detection of diverse anomalous motion patterns within densely crowded environments.