GaitProtector: Impersonation-Driven Gait De-Identification via Training-Free Diffusion Latent Optimization
作者: Huiran Duan, Qian Zhou, Zhongliang Guo, Junhao Dong, Yuqi Li, Guoying Zhao, Yingli Tian
分类: cs.CV
发布日期: 2026-05-12
备注: Accepted to the 20th IEEE International Conference on Automatic Face and Gesture Recognition (FG 2026)
💡 一句话要点
GaitProtector:通过无训练扩散潜在空间优化实现基于模仿的步态去识别
🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)
关键词: 步态去识别 隐私保护 扩散模型 无训练学习 对抗学习
📋 核心要点
- 现有步态去识别方法在身份抑制和时空结构保持之间存在权衡,难以兼顾。
- GaitProtector通过混淆源身份并模仿目标身份,在预训练扩散先验下优化潜在空间,实现步态去识别。
- 实验表明,GaitProtector在有效保护隐私的同时,保持了步态的视觉和时间质量,以及下游任务的可用性。
📝 摘要(中文)
传统的步态去识别方法常常面临一个固有的权衡:要么身份抑制不足,要么引入时空扭曲,阻碍了对结构敏感的下游应用。我们提出了GaitProtector,一个基于模仿驱动的步态去识别框架,它将隐私保护定义为一个统一的目标,包含两个紧密耦合的组件:(i)混淆,使受保护的步态远离源身份;(ii)模仿,使其靠近选定的目标身份。目标身份充当语义锚点,使优化偏向于在预训练扩散先验下结构上合理的步态模式,从而有助于保持主要的身体形状和运动动态。我们通过一个无训练的扩散潜在空间优化流程来实现这个想法。我们不是为每个数据集重新训练生成器,而是将每个输入轮廓序列反演为预训练的3D视频扩散模型的潜在轨迹,并使用可微对抗目标迭代优化潜在代码以合成受保护的步态。在CASIA-B数据集上的实验表明,GaitProtector在黑盒步态识别下实现了56.7%的模仿成功率,并将Rank-1识别准确率从89.6%降低到15.0%,同时保持了良好的视觉和时间质量。我们进一步在Scoliosis1K数据集上评估了下游效用,其中诊断准确率仅从91.4%降低到74.2%。据我们所知,这项工作是第一个以无训练的方式利用预训练的3D扩散先验进行基于轮廓的步态去识别。
🔬 方法详解
问题定义:步态去识别旨在保护个体的身份信息,同时保持步态的生物力学特征,以便用于下游应用,如医疗诊断。现有方法要么无法充分抑制身份信息,要么引入了不希望的时空扭曲,影响了步态的结构完整性,从而降低了下游任务的性能。
核心思路:GaitProtector的核心思想是将隐私保护问题转化为一个统一的优化目标,该目标包含两个关键部分:混淆和模仿。混淆旨在使受保护的步态远离其原始身份,而模仿则旨在将其吸引到选定的目标身份。通过模仿,可以利用目标身份的语义信息作为锚点,引导优化过程产生结构上合理的步态模式。
技术框架:GaitProtector的整体框架包括以下步骤:1) 将输入的步态轮廓序列反演到预训练的3D视频扩散模型的潜在空间中,得到潜在轨迹。2) 使用可微对抗目标迭代优化潜在代码,该目标同时考虑了混淆损失和模仿损失。混淆损失鼓励生成的步态远离原始身份,而模仿损失鼓励生成的步态接近目标身份。3) 将优化后的潜在代码解码回像素空间,得到受保护的步态序列。
关键创新:GaitProtector的关键创新在于利用预训练的3D扩散模型作为先验知识,以无训练的方式进行步态去识别。与需要为每个数据集重新训练生成器的方法不同,GaitProtector可以直接利用预训练模型的强大生成能力,从而避免了训练成本,并提高了泛化能力。此外,通过在潜在空间中进行优化,可以更好地控制生成步态的结构和动态,从而保持下游任务的可用性。
关键设计:GaitProtector的关键设计包括:1) 使用预训练的3D视频扩散模型作为生成先验。2) 设计了可微的对抗损失函数,该函数同时考虑了混淆损失和模仿损失。3) 在潜在空间中进行优化,以更好地控制生成步态的结构和动态。具体的损失函数设计和优化算法细节在论文中有详细描述,例如对抗损失的具体形式,以及优化器的选择。
🖼️ 关键图片
📊 实验亮点
GaitProtector在CASIA-B数据集上实现了56.7%的模仿成功率,并将Rank-1识别准确率从89.6%降低到15.0%,表明其具有强大的隐私保护能力。同时,在Scoliosis1K数据集上的下游任务评估表明,诊断准确率仅从91.4%降低到74.2%,表明其在保护隐私的同时,保持了良好的下游任务可用性。这些结果表明GaitProtector在步态去识别方面具有显著的优势。
🎯 应用场景
GaitProtector在医疗健康、智能安防等领域具有广泛的应用前景。在医疗健康领域,它可以用于保护患者的步态数据,同时允许研究人员利用这些数据进行步态分析和疾病诊断。在智能安防领域,它可以用于隐藏个体的身份信息,同时允许安全系统进行异常行为检测。该研究有助于推动步态识别技术在隐私保护方面的应用,并促进相关技术的发展。
📄 摘要(原文)
Conventional gait de-identification methods often encounter an inherent trade-off: they either provide insufficient identity suppression or introduce spatiotemporal distortions that impede structure-sensitive downstream applications. We propose GaitProtector, an impersonation-driven gait de-identification framework that formulates privacy protection as a unified objective with two tightly coupled components: (i) obfuscation, which repels the protected gait from the source identity, and (ii) impersonation, which attracts it toward a selected target identity. The target identity serves as a semantic anchor that biases optimization toward structurally plausible gait patterns under the pretrained diffusion prior, helping preserve dominant body shape and motion dynamics. We instantiate this idea through a training-free diffusion latent optimization pipeline. Instead of retraining a generator for each dataset, we invert each input silhouette sequence into the latent trajectory of a pretrained 3D video diffusion model and iteratively optimize latent codes with a differentiable adversarial objective to synthesize protected gaits. Experiments on the CASIA-B dataset show that GaitProtector achieves a 56.7% impersonation success rate under black-box gait recognition and reduces Rank-1 identification accuracy from 89.6% to 15.0%, while maintaining favorable visual and temporal quality. We further evaluate downstream utility on the Scoliosis1K dataset, where diagnostic accuracy decreases only from 91.4% to 74.2%. To the best of our knowledge, this work is the first to leverage pretrained 3D diffusion priors in a training-free manner for silhouette-based gait de-identification.