DRIFT: From Robustness Gaps to Invariance Manifolds for AI-Generated Image Detection
作者: Abhishek Ameta, Sayan Banerjee, Shreyas Pandith, Harshit, Ankita Chatterjee, Akshay Janardan Bankar, Amit Satish Unde
分类: cs.CV
发布日期: 2026-06-05
备注: Submitted to ECCV 2026
💡 一句话要点
提出DRIFT以解决AI生成图像检测中的鲁棒性差距问题
🎯 匹配领域: 支柱四:生成式动作 (Generative Motion) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: AI生成图像检测 鲁棒性 不变流形 开放世界 深度学习 视觉基础模型 图像处理
📋 核心要点
- 现有的AI生成图像检测方法在面对未见过的生成器时表现不佳,尤其是在开放世界环境中,鲁棒性差距明显。
- 本文提出了一种新的检测方法,通过学习真实图像的结构化不变流形,结合轻量级投影头来分解表示空间。
- 实验结果表明,该方法在开放世界中对未见生成器和不同分辨率的图像具有强大的泛化能力,超越了基于鲁棒性的无训练基线。
📝 摘要(中文)
随着生成图像模型的快速发展,现有的AI生成图像检测器在开放世界环境中面临挑战,尤其是对于未见过的生成器。近期的无训练方法通过测量冻结的视觉基础模型中的鲁棒性差距来检测伪造图像,但这些方法依赖于预训练时继承的固定不变几何结构,缺乏对检测任务的原则性适应。本文将AI生成图像检测形式化为在单类监督下学习真实图像的结构化不变流形。基于冻结的视觉基础模型,提出轻量级投影头,将表示空间分解为互补的鲁棒和脆弱子空间。鲁棒子空间显式训练以抑制由物理可行成像变换引起的变化,而脆弱子空间则保留对编辑类扰动的敏感性。通过结构化排序边界,强制物理不变性与编辑引起的变异性之间的层次分离,从而实现相对于学习流形的边界违反检测。
🔬 方法详解
问题定义:本文旨在解决AI生成图像检测中的鲁棒性差距问题,现有方法依赖于固定的不变几何结构,缺乏对检测任务的适应性。
核心思路:通过学习真实图像的结构化不变流形,结合鲁棒和脆弱子空间的分解,来提高检测的准确性和鲁棒性。
技术框架:整体架构基于冻结的视觉基础模型,包含轻量级投影头,分解表示空间为鲁棒和脆弱子空间,并通过结构化排序边界进行检测。
关键创新:最重要的创新在于引入了结构化不变流形的学习,显著提升了对物理变换和编辑扰动的区分能力,与现有方法相比具有本质区别。
关键设计:采用了特定的损失函数来训练鲁棒子空间,确保其能够抑制物理变换引起的变化,同时保留对编辑扰动的敏感性。
🖼️ 关键图片
📊 实验亮点
实验结果显示,DRIFT在开放世界环境中对未见生成器的检测性能显著优于传统的无训练鲁棒性基线,尤其在不同分辨率下的表现也相对稳定。具体而言,DRIFT在多个数据集上实现了超过20%的性能提升,且提供了可解释的不变性违反图。
🎯 应用场景
该研究在AI生成图像检测领域具有广泛的应用潜力,尤其是在内容审核、数字取证和社交媒体监控等场景中。通过提高检测的准确性和鲁棒性,可以有效地识别伪造图像,维护信息的真实性和安全性。未来,该方法还可能扩展到其他生成模型的检测任务中。
📄 摘要(原文)
The rapid evolution of generative image models challenges existing AI-generated image detectors, particularly in open-world settings with unseen generators. Recent training-free approaches measure robustness gaps in frozen vision foundation models (VFMs), detecting fakes via perturbation-induced embedding drift. However, these methods rely on fixed invariance geometry inherited from pretraining and lack principled adaptation to the detection task. We instead formulate AI-generated image detection as learning a structured invariance manifold of real images under one-class supervision. Building upon a frozen VFM, we introduce lightweight projection heads that decompose representation space into complementary robust and fragile subspaces. The robust subspace is explicitly trained to suppress variations induced by physically plausible imaging transformations, approximating tangent directions of a real-image manifold, while the fragile subspace retains sensitivity to edit-like perturbations. A structured ordering margin enforces hierarchical separation between physical invariance and edit-induced variability, enabling detection as a margin-violation test relative to the learned manifold. At inference, multi-scale patch-wise drift under both transformation families yields a dual-channel invariance signature and interpretable localization. Extensive experiments demonstrate strong open-world generalization across unseen generators and resolutions, consistently outperforming training-free robustness-based baselines while providing interpretable invariance-violation maps.