Efficient Face Image Quality Assessment via Self-training and Knowledge Distillation

📄 arXiv: 2507.15709v2 📥 PDF

作者: Wei Sun, Weixia Zhang, Linhan Cao, Jun Jia, Xiangyang Zhu, Dandan Zhu, Xiongkuo Min, Guangtao Zhai

分类: cs.CV

发布日期: 2025-07-21 (更新: 2025-08-10)

备注: Efficient-FIQA achieved first place in the ICCV VQualA 2025 Face Image Quality Assessment Challenge

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于自训练和知识蒸馏的高效人脸图像质量评估方法,适用于实际部署。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 人脸图像质量评估 自训练 知识蒸馏 计算效率 轻量级模型

📋 核心要点

  1. 现有FIQA算法计算复杂度高,难以在实际系统中部署,限制了其应用范围。
  2. 采用自训练增强教师模型,并利用知识蒸馏将知识迁移到轻量级学生模型,实现高效FIQA。
  3. 实验表明,学生模型在保持性能的同时,显著降低了计算开销,并在ICCV 2025 VQualA FIQA挑战赛中获得第一名。

📝 摘要(中文)

人脸图像质量评估(FIQA)对于各种人脸相关应用至关重要。尽管FIQA已得到广泛研究并取得显著进展,但FIQA算法的计算复杂度仍然是确保可扩展性和在实际系统中实际部署的关键问题。本文旨在开发一种计算高效的FIQA方法,该方法可以轻松地部署在实际应用中。具体来说,我们的方法包括两个阶段:训练一个强大的教师模型,并从中提炼出一个轻量级的学生模型。为了构建一个强大的教师模型,我们采用了一种自训练策略来提高其能力。我们首先使用标记的人脸图像训练教师模型,然后使用它为一组未标记的图像生成伪标签。这些伪标记的样本以两种方式使用:(1)将知识提炼到学生模型中,以及(2)与原始标记的图像结合,通过自训练进一步增强教师模型。增强的教师模型用于进一步伪标记另一组未标记的图像,以用于提炼学生模型。学生模型使用标记的图像、来自原始教师模型的伪标记图像以及来自增强的教师模型的伪标记图像的组合进行训练。实验结果表明,我们的学生模型以极低的计算开销实现了与教师模型相当的性能。此外,我们的方法在ICCV 2025 VQualA FIQA挑战赛中获得第一名。

🔬 方法详解

问题定义:论文旨在解决人脸图像质量评估(FIQA)算法计算复杂度高,难以在实际场景中部署的问题。现有方法通常需要大量的计算资源,限制了其在移动设备或嵌入式系统等资源受限环境中的应用。

核心思路:论文的核心思路是利用知识蒸馏技术,将一个强大的教师模型(teacher model)的知识迁移到一个轻量级的学生模型(student model),从而在保证性能的同时,显著降低计算复杂度。此外,论文还采用了自训练策略来增强教师模型的能力。

技术框架:整体框架包含两个主要阶段:教师模型训练和学生模型蒸馏。首先,使用标记数据训练一个初始的教师模型。然后,利用该教师模型对未标记数据进行伪标记,并将伪标记数据与原始标记数据结合,通过自训练进一步提升教师模型的能力。最后,利用增强后的教师模型,将知识蒸馏到学生模型中。学生模型同时使用标记数据和来自原始教师模型以及增强教师模型的伪标记数据进行训练。

关键创新:论文的关键创新在于结合了自训练和知识蒸馏两种技术,有效地提升了FIQA模型的性能和效率。自训练能够利用大量的未标记数据来增强教师模型的能力,而知识蒸馏则可以将教师模型的知识迁移到轻量级的学生模型中,从而实现高效的FIQA。

关键设计:论文中,教师模型和学生模型的具体网络结构未知,但关键在于自训练过程中伪标签的生成和使用,以及知识蒸馏过程中损失函数的选择。具体参数设置和损失函数细节在论文中未明确给出,但通常会采用交叉熵损失或均方误差损失等。

🖼️ 关键图片

fig_0

📊 实验亮点

该方法在ICCV 2025 VQualA FIQA挑战赛中获得第一名,表明其在实际应用中具有很强的竞争力。虽然论文中没有给出具体的性能数据和对比基线,但强调了学生模型在保持与教师模型相当的性能的同时,显著降低了计算开销,这对于实际部署至关重要。具体的性能提升幅度未知。

🎯 应用场景

该研究成果可广泛应用于各种人脸相关的应用场景,例如人脸识别、人脸验证、人脸属性分析等。尤其是在移动设备、嵌入式系统等资源受限的环境中,高效的FIQA算法能够提升用户体验,并降低计算成本。此外,该方法还可以应用于视频监控、智能安防等领域,提高人脸识别系统的鲁棒性和准确性。

📄 摘要(原文)

Face image quality assessment (FIQA) is essential for various face-related applications. Although FIQA has been extensively studied and achieved significant progress, the computational complexity of FIQA algorithms remains a key concern for ensuring scalability and practical deployment in real-world systems. In this paper, we aim to develop a computationally efficient FIQA method that can be easily deployed in real-world applications. Specifically, our method consists of two stages: training a powerful teacher model and distilling a lightweight student model from it. To build a strong teacher model, we adopt a self-training strategy to improve its capacity. We first train the teacher model using labeled face images, then use it to generate pseudo-labels for a set of unlabeled images. These pseudo-labeled samples are used in two ways: (1) to distill knowledge into the student model, and (2) to combine with the original labeled images to further enhance the teacher model through self-training. The enhanced teacher model is used to further pseudo-label another set of unlabeled images for distilling the student models. The student model is trained using a combination of labeled images, pseudo-labeled images from the original teacher model, and pseudo-labeled images from the enhanced teacher model. Experimental results demonstrate that our student model achieves comparable performance to the teacher model with an extremely low computational overhead. Moreover, our method achieved first place in the ICCV 2025 VQualA FIQA Challenge. The code is available at https://github.com/sunwei925/Efficient-FIQA.git.