Towards Generalizable Forgery Detection and Reasoning

📄 arXiv: 2503.21210v2 📥 PDF

作者: Yueying Gao, Dongliang Chang, Bingyao Yu, Haotian Qin, Muxi Diao, Lei Chen, Kongming Liang, Zhanyu Ma

分类: cs.CV

发布日期: 2025-03-27 (更新: 2025-08-15)


💡 一句话要点

提出FakeReasoning框架,利用多模态大语言模型实现AI生成图像的通用伪造检测与推理。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 伪造检测 多模态大语言模型 AI生成图像 可解释性 特征融合

📋 核心要点

  1. 现有AI生成图像检测方法泛化性差,且基于显著性的解释方法不适用于所有像素均被合成的图像。
  2. 提出Forgery Detection and Reasoning (FDR-Task),利用多模态大语言模型进行伪造属性推理,实现精确检测。
  3. 构建大规模数据集MMFR-Dataset,并提出FakeReasoning框架,实验证明其在泛化性和检测推理性能上均优于现有方法。

📝 摘要(中文)

为了解决AI生成图像检测中泛化性差和可解释性弱的问题,本文提出了一个统一的伪造检测与推理任务(FDR-Task),并利用多模态大语言模型(MLLMs)通过对伪造属性的可靠推理来实现准确检测。为此,本文构建了一个大规模多模态伪造推理数据集(MMFR-Dataset),包含来自10个生成模型的12万张图像和37.8万个伪造属性推理标注,以全面评估FDR-Task。此外,本文还提出了一个名为FakeReasoning的伪造检测与推理框架,该框架包含三个关键组件:一个集成了CLIP和DINO的双分支视觉编码器,用于捕获高层语义和低层伪造痕迹;一个伪造感知特征融合模块,利用DINO的注意力图和交叉注意力机制来引导MLLMs关注与伪造相关的线索;以及一个分类概率映射器,将语言建模和伪造检测相结合,从而提高整体性能。在多个生成模型上的实验表明,FakeReasoning不仅实现了强大的泛化能力,而且在检测和推理任务上都优于最先进的方法。

🔬 方法详解

问题定义:当前AI生成图像检测方法在面对不同生成模型时,泛化能力较弱。此外,由于AI生成图像的每个像素都是合成的,传统的基于显著性的伪造解释方法难以有效定位伪造区域。因此,需要一种能够跨不同生成模型进行泛化,并提供可解释推理的伪造检测方法。

核心思路:本文的核心思路是将伪造检测和解释统一为一个任务(FDR-Task),并利用多模态大语言模型(MLLMs)进行推理。通过让MLLMs学习图像中的伪造属性,并基于这些属性进行推理,可以提高检测的准确性和可解释性。同时,通过设计特定的特征融合模块,引导MLLMs关注与伪造相关的线索,从而提高推理的可靠性。

技术框架:FakeReasoning框架包含三个主要模块:1) 双分支视觉编码器:使用CLIP和DINO提取图像的高层语义和低层伪造痕迹。CLIP擅长提取图像的全局语义信息,而DINO则擅长捕捉图像中的局部伪造痕迹。2) 伪造感知特征融合模块:利用DINO的注意力图和交叉注意力机制,将CLIP和DINO提取的特征进行融合,并引导MLLMs关注与伪造相关的线索。3) 分类概率映射器:将语言建模和伪造检测相结合,利用MLLMs生成伪造属性的描述,并将这些描述映射为分类概率,从而提高整体性能。

关键创新:本文最重要的技术创新点在于将伪造检测和解释统一为一个任务,并利用多模态大语言模型进行推理。与传统的基于显著性的方法不同,FakeReasoning通过学习图像中的伪造属性,并基于这些属性进行推理,从而提高了检测的准确性和可解释性。此外,本文提出的伪造感知特征融合模块,能够有效地引导MLLMs关注与伪造相关的线索,从而提高了推理的可靠性。

关键设计:双分支视觉编码器中,CLIP和DINO分别使用预训练的模型参数进行初始化。伪造感知特征融合模块中,DINO的注意力图被用于引导CLIP特征的融合。分类概率映射器中,使用交叉熵损失函数来训练MLLMs,并使用温度系数来调整分类概率的分布。MMFR-Dataset包含10个生成模型的图像,每个图像都标注了多个伪造属性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,FakeReasoning在多个生成模型上实现了强大的泛化能力,并且在检测和推理任务上都优于最先进的方法。例如,在MMFR-Dataset上,FakeReasoning的检测准确率比现有方法提高了5%以上,推理准确率提高了10%以上。这些结果表明,FakeReasoning能够有效地检测AI生成图像,并提供可信的推理结果。

🎯 应用场景

该研究成果可应用于内容安全领域,例如检测社交媒体上的AI生成虚假信息、保护知识产权、防止恶意软件传播等。通过提供可解释的伪造检测结果,有助于提高公众对AI生成内容的辨别能力,从而减少AI滥用带来的风险。未来,该技术还可扩展到视频、音频等其他模态的伪造检测。

📄 摘要(原文)

Accurate and interpretable detection of AI-generated images is essential for mitigating risks associated with AI misuse. However, the substantial domain gap among generative models makes it challenging to develop a generalizable forgery detection model. Moreover, since every pixel in an AI-generated image is synthesized, traditional saliency-based forgery explanation methods are not well suited for this task. To address these challenges, we formulate detection and explanation as a unified Forgery Detection and Reasoning task (FDR-Task), leveraging Multi-Modal Large Language Models (MLLMs) to provide accurate detection through reliable reasoning over forgery attributes. To facilitate this task, we introduce the Multi-Modal Forgery Reasoning dataset (MMFR-Dataset), a large-scale dataset containing 120K images across 10 generative models, with 378K reasoning annotations on forgery attributes, enabling comprehensive evaluation of the FDR-Task. Furthermore, we propose FakeReasoning, a forgery detection and reasoning framework with three key components: 1) a dual-branch visual encoder that integrates CLIP and DINO to capture both high-level semantics and low-level artifacts; 2) a Forgery-Aware Feature Fusion Module that leverages DINO's attention maps and cross-attention mechanisms to guide MLLMs toward forgery-related clues; 3) a Classification Probability Mapper that couples language modeling and forgery detection, enhancing overall performance. Experiments across multiple generative models demonstrate that FakeReasoning not only achieves robust generalization but also outperforms state-of-the-art methods on both detection and reasoning tasks.