Graph-based 3D Human Pose Estimation using WiFi Signals

📄 arXiv: 2511.19105v1 📥 PDF

作者: Jichao Chen, YangYang Qu, Ruibo Tang, Dirk Slock

分类: cs.CV

发布日期: 2025-11-24

🔗 代码/项目: GITHUB


💡 一句话要点

提出GraphPose-Fi,利用WiFi信号和图神经网络进行3D人体姿态估计

🎯 匹配领域: 支柱三:空间感知 (Perception & SLAM)

关键词: 3D人体姿态估计 WiFi感知 图神经网络 信道状态信息 骨骼拓扑 注意力机制 无线感知

📋 核心要点

  1. 现有基于WiFi的人体姿态估计方法通常直接将信道状态信息回归到3D关节坐标,忽略了人体关节间的拓扑关系。
  2. GraphPose-Fi显式地建模了骨骼拓扑结构,利用图神经网络学习关节间的依赖关系,从而提升姿态估计的准确性。
  3. 实验结果表明,GraphPose-Fi在MM-Fi数据集上显著优于现有方法,证明了该框架的有效性。

📝 摘要(中文)

本文提出了一种基于WiFi信号的3D人体姿态估计框架GraphPose-Fi,旨在解决现有方法忽略人体关节内在拓扑关系的问题。该框架利用跨天线的CNN编码器提取子载波-时间特征,通过轻量级注意力模块自适应地对时间和天线上的特征进行重新加权,并采用基于图的回归头,结合图卷积网络(GCN)层和自注意力机制,以捕获局部拓扑和全局依赖关系。在MM-Fi数据集上的实验结果表明,该方法在各种设置下均显著优于现有方法。源代码已开源。

🔬 方法详解

问题定义:现有基于WiFi的人体姿态估计方法,例如基于回归网络的方案,直接将WiFi信道状态信息(CSI)映射到3D关节坐标。这种方法忽略了人体关节之间固有的拓扑关系,限制了姿态估计的精度。痛点在于缺乏对人体骨骼结构的建模,导致无法有效利用关节间的约束信息。

核心思路:GraphPose-Fi的核心思路是显式地建模人体骨骼的拓扑结构,利用图神经网络(GCN)学习关节之间的依赖关系。通过将人体骨骼表示为图,每个关节作为节点,关节之间的连接作为边,GCN可以有效地聚合来自相邻节点的信息,从而更好地理解人体姿态。

技术框架:GraphPose-Fi框架主要包含三个模块:1) CNN编码器:跨天线共享,用于从子载波-时间维度提取特征。2) 注意力模块:一个轻量级的注意力机制,自适应地对时间和天线上的特征进行重新加权,突出重要特征。3) 基于图的回归头:结合GCN层和自注意力机制,用于捕获局部拓扑和全局依赖关系,最终回归出3D关节坐标。

关键创新:GraphPose-Fi的关键创新在于将图神经网络引入到WiFi-based人体姿态估计中,显式地建模了人体骨骼的拓扑结构。与直接回归的方法相比,GraphPose-Fi能够更好地利用关节间的约束信息,从而提高姿态估计的准确性。此外,轻量级的注意力模块和跨天线共享的CNN编码器也提高了模型的效率和泛化能力。

关键设计:在图回归头中,GCN层用于聚合局部邻域信息,自注意力机制用于捕获全局依赖关系。损失函数方面,可能采用了均方误差(MSE)损失或其他针对3D姿态估计的损失函数。具体的网络结构细节,例如GCN的层数、注意力头的数量等,需要在论文中进一步查找。

📊 实验亮点

GraphPose-Fi在MM-Fi数据集上进行了广泛的实验,结果表明该方法在各种设置下均显著优于现有方法。具体的性能数据和提升幅度需要在论文中查找。开源代码的提供也方便了其他研究者进行复现和改进。

🎯 应用场景

该研究成果可应用于智能家居、健康监测、安全监控等领域。例如,无需摄像头即可通过WiFi信号监测老年人的跌倒行为,保护用户隐私。此外,该技术还可用于人机交互、虚拟现实等领域,实现更自然、更便捷的人机交互方式。未来,结合其他传感器数据,可以进一步提升姿态估计的准确性和鲁棒性。

📄 摘要(原文)

WiFi-based human pose estimation (HPE) has attracted increasing attention due to its resilience to occlusion and privacy-preserving compared to camera-based methods. However, existing WiFi-based HPE approaches often employ regression networks that directly map WiFi channel state information (CSI) to 3D joint coordinates, ignoring the inherent topological relationships among human joints. In this paper, we present GraphPose-Fi, a graph-based framework that explicitly models skeletal topology for WiFi-based 3D HPE. Our framework comprises a CNN encoder shared across antennas for subcarrier-time feature extraction, a lightweight attention module that adaptively reweights features over time and across antennas, and a graph-based regression head that combines GCN layers with self-attention to capture local topology and global dependencies. Our proposed method significantly outperforms existing methods on the MM-Fi dataset in various settings. The source code is available at: https://github.com/Cirrick/GraphPose-Fi.