Blind-Match: Efficient Homomorphic Encryption-Based 1:N Matching for Privacy-Preserving Biometric Identification
作者: Hyunmin Choi, Jiwon Kim, Chiyoung Song, Simon S. Woo, Hyoungshick Kim
分类: cs.CV, cs.CR
发布日期: 2024-08-12 (更新: 2024-10-13)
备注: Accepted to CIKM 2024 (Applied Research Track)
💡 一句话要点
Blind-Match:基于同态加密的高效隐私保护生物特征1:N匹配
🎯 匹配领域: 支柱五:交互与反应 (Interaction & Reaction)
关键词: 生物特征识别 同态加密 隐私保护 余弦相似度 人脸识别 指纹识别
📋 核心要点
- 现有生物特征识别方法在保护用户隐私方面存在不足,容易受到数据泄露和攻击。
- Blind-Match的核心思想是利用同态加密技术,在加密域中进行生物特征匹配,保护用户数据隐私。
- 实验结果表明,Blind-Match在人脸和指纹识别任务中均取得了优异的准确率和效率,优于现有方法。
📝 摘要(中文)
本文提出了一种名为Blind-Match的新型生物特征识别系统,该系统利用同态加密(HE)实现高效且保护隐私的1:N匹配。Blind-Match引入了一种HE优化的余弦相似度计算方法,其核心思想是将特征向量分成更小的部分进行处理,而不是一次性计算整个向量。通过优化这些部分的数量,Blind-Match在确保数据隐私的同时,最大限度地缩短了执行时间。在各种生物特征数据集上,Blind-Match的性能优于最先进的方法。在LFW人脸数据集上,Blind-Match使用128维特征向量达到了99.63%的Rank-1准确率,展示了其在人脸识别任务中的鲁棒性。对于指纹识别,Blind-Match在PolyU数据集上使用紧凑的16维特征向量实现了99.55%的Rank-1准确率,显著优于最先进的方法Blind-Touch,后者仅达到59.17%。此外,Blind-Match在大型生物特征识别场景(如Naver Cloud的FaceSign)中展示了实际效率,使用128维特征向量在0.74秒内处理了6,144个生物特征样本。
🔬 方法详解
问题定义:论文旨在解决生物特征识别中隐私保护和效率之间的矛盾。现有方法要么效率低下,要么无法提供足够的隐私保护,难以满足实际应用需求。尤其是在大规模1:N匹配场景下,如何在保护用户生物特征数据隐私的同时,实现快速准确的识别是一个挑战。
核心思路:Blind-Match的核心思路是利用同态加密技术,将生物特征数据加密后进行匹配计算,从而避免在明文状态下暴露用户数据。同时,为了提高计算效率,论文提出了一种HE优化的余弦相似度计算方法,将特征向量分割成小块进行处理。
技术框架:Blind-Match系统的整体流程如下:1) 用户注册:用户提供生物特征数据,系统提取特征向量并使用同态加密进行加密。2) 数据库存储:加密后的特征向量存储在数据库中。3) 识别请求:用户提供待识别的生物特征数据,系统提取特征向量并使用相同的密钥进行加密。4) 加密域匹配:系统在加密域中计算待识别特征向量与数据库中所有加密特征向量的相似度。5) 结果返回:系统返回相似度最高的匹配结果,但不解密用户的生物特征数据。
关键创新:Blind-Match的关键创新在于提出了一种HE优化的余弦相似度计算方法。传统方法直接在加密后的完整特征向量上进行计算,效率较低。Blind-Match将特征向量分割成小块,并优化了分割块的数量,从而在保证精度的前提下,显著提高了计算效率。
关键设计:论文的关键设计包括:1) 特征向量分割策略:通过实验确定最佳的分割块数量,以平衡计算效率和精度。2) 同态加密方案选择:选择合适的同态加密方案,以支持高效的加密域计算。3) 相似度计算方法:采用余弦相似度作为匹配指标,并针对HE进行了优化。
🖼️ 关键图片
📊 实验亮点
Blind-Match在LFW人脸数据集上达到了99.63%的Rank-1准确率(128维特征向量),在PolyU指纹数据集上达到了99.55%的Rank-1准确率(16维特征向量)。特别是在PolyU指纹数据集上,Blind-Match的性能显著优于现有最先进的方法Blind-Touch(59.17%)。此外,Blind-Match在Naver Cloud的FaceSign应用中,能够在0.74秒内处理6,144个生物特征样本(128维特征向量),展示了其在大规模场景下的高效性。
🎯 应用场景
Blind-Match具有广泛的应用前景,包括但不限于:安全门禁系统、移动支付认证、身份验证服务、云端生物特征识别等。该研究成果有助于在保护用户隐私的前提下,实现更加安全可靠的生物特征识别应用,具有重要的社会价值和商业潜力。
📄 摘要(原文)
We present Blind-Match, a novel biometric identification system that leverages homomorphic encryption (HE) for efficient and privacy-preserving 1:N matching. Blind-Match introduces a HE-optimized cosine similarity computation method, where the key idea is to divide the feature vector into smaller parts for processing rather than computing the entire vector at once. By optimizing the number of these parts, Blind-Match minimizes execution time while ensuring data privacy through HE. Blind-Match achieves superior performance compared to state-of-the-art methods across various biometric datasets. On the LFW face dataset, Blind-Match attains a 99.63% Rank-1 accuracy with a 128-dimensional feature vector, demonstrating its robustness in face recognition tasks. For fingerprint identification, Blind-Match achieves a remarkable 99.55% Rank-1 accuracy on the PolyU dataset, even with a compact 16-dimensional feature vector, significantly outperforming the state-of-the-art method, Blind-Touch, which achieves only 59.17%. Furthermore, Blind-Match showcases practical efficiency in large-scale biometric identification scenarios, such as Naver Cloud's FaceSign, by processing 6,144 biometric samples in 0.74 seconds using a 128-dimensional feature vector.