Non-Colliding Biometric Identities for Digital Entities: Geometry, Capacity, and Million-Scale Virtual Identity Provisioning

📄 arXiv: 2605.18238v1 📥 PDF

作者: Yuyang Ji, Yixuan Shen, Anil Jain, Xiaoming Liu, Feng Liu

分类: cs.CV

发布日期: 2026-05-18

备注: 25 pages, 11 figures


💡 一句话要点

提出生物特征身份配置(BIP)框架,为数字实体提供百万级无冲突虚拟身份。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 生物特征身份 虚拟身份 人脸生成 流形学习 数字实体 身份配置 非冲突身份

📋 核心要点

  1. 现有数字实体身份基础设施依赖凭证,缺乏基于生物特征的身份认证,无法有效区分数字实体和真实人类。
  2. 提出生物特征身份配置(BIP)框架,利用真实人脸流形中的间隙来分配虚拟身份,确保与真实身份不冲突且具有高可分性。
  3. 实验证明该方法能够生成百万级非冲突虚拟身份,并训练出高质量的虚拟人脸生成器GapGen,构建了虚拟人脸数据集v-LFW。

📝 摘要(中文)

本文提出生物特征身份配置(BIP)这一新问题和解决方案框架,旨在解决以下问题:给定真实人类身份的注册库,如何配置与每个已注册身份不冲突、保持足够类间可分性,并且可以实现为高保真面部图像的虚拟身份。核心几何洞察在于,真实面部身份占据嵌入超球面的低维子空间,没有剩余子空间可用于虚拟身份。因此,虚拟身份必须被分配为真实面部流形本身内未被声明的间隙。因此,BIP是一个受约束的填充问题:可用间隙远远超过任何可预见的注册规模,并且即使在随后注册新的真实身份时,配置的身份仍然不冲突。基于这种几何结构,我们基于排斥的分配不受任何固定配置计数的限制;我们展示了针对36万真实身份的1000万个非冲突虚拟身份嵌入。为了将这些嵌入实现为面部图像,需要一个在真实面部图像的训练分布之外运行的生成器;我们引入了GapGen,一个具有课程学习的间隙感知生成器,逐步将合成扩展到非冲突区域,并在100万张逼真的虚拟面部图像上进行了验证。我们进一步构建了v-LFW,LFW面部数据集的虚拟对应物,具有虚拟面部验证、跨现实匹配、真实与虚拟检测以及统一识别和检测的协议。

🔬 方法详解

问题定义:论文旨在解决为数字实体(如AI代理和机器人)分配唯一且不与真实人类身份冲突的生物特征身份的问题。现有方法主要依赖于凭证,缺乏生物特征层面的身份区分,无法保证数字实体与真实人类身份的唯一性,存在潜在的安全风险和伦理问题。

核心思路:论文的核心思路是利用真实人脸在特征空间中占据的低维流形结构,将虚拟身份分配到真实人脸流形中的“间隙”区域。由于真实人脸占据了特征空间的主要部分,剩余的“间隙”区域可以用于分配虚拟身份,同时保证虚拟身份与真实身份之间的可区分性。这种方法避免了直接在真实人脸分布中生成虚拟身份,从而降低了冲突的风险。

技术框架:整体框架包含两个主要部分:虚拟身份嵌入生成和虚拟人脸图像生成。首先,通过基于排斥的分配策略,在真实人脸流形的间隙中生成大量的非冲突虚拟身份嵌入。然后,利用GapGen生成器,将这些虚拟身份嵌入转化为逼真的虚拟人脸图像。最后,构建v-LFW数据集,用于评估虚拟人脸的质量和性能。

关键创新:论文的关键创新在于提出了基于人脸流形间隙的虚拟身份分配策略。与传统的生成模型不同,GapGen生成器专门设计用于在真实人脸分布之外生成虚拟人脸,避免了与真实人脸的冲突。此外,论文还提出了基于排斥的分配算法,能够高效地生成大量的非冲突虚拟身份嵌入。

关键设计:GapGen生成器采用课程学习策略进行训练,逐步扩展其生成能力到非冲突区域。损失函数包括对抗损失、身份损失和间隙感知损失,以保证生成图像的真实性、身份一致性和与真实人脸的区分度。基于排斥的分配算法通过迭代更新虚拟身份的位置,使其远离真实人脸嵌入,从而保证非冲突性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法能够生成1000万个与36万真实人脸不冲突的虚拟身份嵌入。GapGen生成器能够生成高质量的虚拟人脸图像,并在v-LFW数据集上取得了良好的性能。在虚拟人脸验证、跨现实匹配和真实与虚拟检测等任务中,该方法均表现出优异的性能。

🎯 应用场景

该研究成果可应用于数字身份管理、虚拟角色创建、AI安全和隐私保护等领域。例如,可以为AI代理和机器人分配唯一的生物特征身份,防止身份欺骗和恶意攻击。此外,还可以用于生成逼真的虚拟角色,用于游戏、电影和虚拟现实等应用。该研究还有助于提高人脸识别系统的安全性,防止利用合成人脸进行欺诈。

📄 摘要(原文)

Digital entities such as AI agents and humanoid robots increasingly operate alongside real humans, yet their identity infrastructure is based on credentials rather than embodied biometric identity. We introduce Biometric Identity Provisioning (BIP), a new problem and solution framework that addresses: given an enrollment gallery of real human identities, provision virtual identities that are non-colliding with every enrolled identity, maintain sufficient inter-class separability, and are realizable as high-fidelity face images. The key geometric insight is that real face identities occupy a low-dimensional subspace of the embedding hypersphere, leaving no residual subspace for virtual identities. Hence, virtual identities must instead be allocated as unclaimed gaps within the real face manifold itself. BIP is therefore a constrained packing problem: available gaps vastly exceed any foreseeable enrollment scale, and provisioned identities remain non-colliding even as new real identities are subsequently enrolled. Grounded in this geometry, our repulsion-based allocation is not bounded by any fixed provisioning count; we demonstrate 10M non-colliding virtual identity embeddings against a gallery of 360K real identities. Realizing these embeddings as face images requires a generator that operates outside the training distribution of real face images; we introduce GapGen, a gap-aware generator trained with a curriculum that progressively extends synthesis into non-colliding regions, validated at 1M photorealistic virtual face images. We further construct v-LFW, a virtual counterpart to LFW face dataset, with protocols for virtual face verification, cross-reality matching, real-vs-virtual detection, and unified recognition and detection.