MarkCleaner: High-Fidelity Watermark Removal via Imperceptible Micro-Geometric Perturbation
作者: Xiaoxi Kong, Jieyu Yuan, Pengdi Chen, Yuanlin Zhang, Chongyi Li, Bin Li
分类: eess.IV, cs.AI, cs.CR, cs.CV
发布日期: 2026-02-02
💡 一句话要点
MarkCleaner:通过不可察觉的微几何扰动实现高保真水印去除
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 水印去除 微几何扰动 语义水印 图像重建 高斯溅射
📋 核心要点
- 语义水印具有很强的鲁棒性,但容易受到微几何扰动攻击,现有方法难以在去除水印的同时保持图像语义。
- MarkCleaner通过微几何扰动监督训练模型,使模型能够分离语义内容和空间对齐,从而实现鲁棒的水印去除。
- 实验结果表明,MarkCleaner在水印去除效果和视觉保真度方面均优于现有方法,并能实现高效的实时推理。
📝 摘要(中文)
语义水印对传统的图像空间攻击表现出很强的鲁棒性。本文表明,这种鲁棒性在微几何扰动下会失效:空间位移可以通过破坏相位对齐来去除水印。受此启发,我们提出了MarkCleaner,一个水印去除框架,它避免了基于重构的水印去除方法引起的语义漂移。具体来说,MarkCleaner使用微几何扰动监督进行训练,这鼓励模型将语义内容与严格的空间对齐分离,并实现对细微几何位移的鲁棒重建。该框架采用一个mask引导的编码器,学习显式的空间表示,以及一个基于2D高斯溅射的解码器,显式地参数化几何扰动,同时保留语义内容。大量实验表明,MarkCleaner在水印去除效果和视觉保真度方面都取得了优异的性能,同时实现了高效的实时推理。我们的代码将在接收后公开。
🔬 方法详解
问题定义:论文旨在解决语义水印难以去除,且现有水印去除方法容易导致图像语义漂移的问题。传统的图像空间攻击对语义水印无效,而基于重构的方法在去除水印的同时,容易引入不希望的语义变化,影响图像质量。
核心思路:论文的核心思路是利用微几何扰动来破坏语义水印的相位对齐,从而实现水印去除。通过训练模型使其对微小的几何扰动具有鲁棒性,从而在去除水印的同时,保持图像的语义内容。
技术框架:MarkCleaner框架主要包含一个mask引导的编码器和一个基于2D高斯溅射的解码器。编码器学习显式的空间表示,解码器显式地参数化几何扰动,并重建图像。训练过程中,使用微几何扰动监督,鼓励模型分离语义内容和空间对齐。
关键创新:该论文的关键创新在于利用微几何扰动作为攻击手段,并设计了一种新的网络结构,能够显式地建模几何扰动,从而在去除水印的同时,保持图像的语义内容。与现有方法相比,MarkCleaner避免了基于重构的水印去除方法引起的语义漂移。
关键设计:Mask引导的编码器用于学习显式的空间表示。2D高斯溅射解码器用于参数化几何扰动,并重建图像。损失函数的设计旨在鼓励模型对微小的几何扰动具有鲁棒性,同时保持图像的语义内容。具体的参数设置和网络结构细节将在论文中详细描述。
🖼️ 关键图片
📊 实验亮点
实验结果表明,MarkCleaner在水印去除效果和视觉保真度方面均优于现有方法。具体来说,MarkCleaner能够有效地去除语义水印,同时保持图像的视觉质量,避免了语义漂移。此外,MarkCleaner还具有高效的实时推理能力,使其能够应用于实际场景。
🎯 应用场景
MarkCleaner可应用于图像版权保护、内容安全等领域。该技术可以有效地去除图像中的语义水印,从而保护图像的知识产权。此外,该技术还可以用于检测和防御恶意水印攻击,提高内容安全性。未来,该技术有望在数字媒体领域得到广泛应用。
📄 摘要(原文)
Semantic watermarks exhibit strong robustness against conventional image-space attacks. In this work, we show that such robustness does not survive under micro-geometric perturbations: spatial displacements can remove watermarks by breaking the phase alignment. Motivated by this observation, we introduce MarkCleaner, a watermark removal framework that avoids semantic drift caused by regeneration-based watermark removal. Specifically, MarkCleaner is trained with micro-geometry-perturbed supervision, which encourages the model to separate semantic content from strict spatial alignment and enables robust reconstruction under subtle geometric displacements. The framework adopts a mask-guided encoder that learns explicit spatial representations and a 2D Gaussian Splatting-based decoder that explicitly parameterizes geometric perturbations while preserving semantic content. Extensive experiments demonstrate that MarkCleaner achieves superior performance in both watermark removal effectiveness and visual fidelity, while enabling efficient real-time inference. Our code will be made available upon acceptance.