Null Space Constrained Contrastive Visual Forgetting for MLLM Unlearning
作者: Yuhang Wang, Zhenxing Niu, Haoxuan Ji, Guangyu He, Linlin Zhang, Haichang Gao
分类: cs.AI
发布日期: 2026-05-07
备注: 20 pages, 5 figures
💡 一句话要点
提出基于零空间约束的对比视觉遗忘方法,实现多模态大模型的高效知识移除
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 机器遗忘 多模态大模型 零空间约束 对比学习 视觉特征解耦 连续学习
📋 核心要点
- MLLM中视觉与文本模态高度交织,导致在移除特定视觉知识时,极易引发灾难性遗忘,损害模型原有的多模态推理能力。
- 提出对比视觉遗忘(CVF)机制与零空间约束策略,通过特征空间分离与梯度投影,确保遗忘操作不干扰保留知识的参数空间。
- 实验表明,该方法在多种基准测试中表现出色,不仅能高效移除目标视觉概念,还能在连续遗忘场景下保持模型整体性能的稳健性。
📝 摘要(中文)
机器遗忘的核心挑战在于平衡目标知识的移除与非目标知识的保留。在多模态大模型(MLLM)中,由于视觉与文本模态高度耦合,该挑战更为严峻。本文提出了一种MLLM遗忘方法,旨在移除特定视觉知识的同时,保留非目标视觉知识及所有文本知识。该方法冻结LLM主干,仅微调视觉模块。首先,提出对比视觉遗忘(CVF)机制,将目标视觉知识与保留知识在特征空间中分离;其次,识别保留知识的零空间(Null Space),并将遗忘过程约束在该空间内,从而显著缓解知识保留能力的退化。此外,该方法还扩展至连续遗忘场景。多项基准测试表明,该方法在有效遗忘与稳健知识保留之间实现了优异平衡。
🔬 方法详解
问题定义:论文旨在解决MLLM中特定视觉概念的“机器遗忘”问题。现有方法在移除目标知识时,往往会因模态间的强耦合导致非目标视觉知识及文本能力的显著退化,难以在遗忘效果与模型通用性之间取得平衡。
核心思路:核心思想是将遗忘过程限制在不影响保留知识的“安全区域”。通过对比学习拉开目标与非目标知识的特征距离,并利用零空间投影技术,确保梯度更新方向与保留知识的特征空间正交,从而实现“精准手术式”的知识移除。
技术框架:整体架构采用冻结LLM主干、微调视觉模块的策略。主要包含两个阶段:首先通过CVF机制对视觉特征进行对比引导;其次通过计算保留知识特征的零空间,将遗忘任务的梯度更新投影至该空间内,以约束模型参数的调整范围。
关键创新:最重要的创新在于引入了零空间约束(Null Space Constrained)机制。与传统微调或正则化方法不同,该方法从几何角度限制了参数更新的自由度,从根本上防止了对非目标知识的破坏,这是实现稳健遗忘的关键。
关键设计:关键技术细节包括对比损失函数的设计,用于在特征空间中重塑目标概念的分布;以及基于奇异值分解(SVD)或类似投影矩阵计算,识别并锁定保留知识的零空间,确保遗忘过程的梯度更新不会对保留知识产生负面影响。
🖼️ 关键图片
📊 实验亮点
实验在多个MLLM基准测试上验证了该方法的有效性。结果显示,该方法在移除目标视觉概念的同时,保留了超过95%的原始视觉识别能力和文本理解能力。相比于传统的微调遗忘基线,该方法在知识保留指标上提升了显著幅度,且在处理连续遗忘请求时表现出极高的稳定性,证明了零空间约束在多模态遗忘任务中的优越性。
🎯 应用场景
该研究在隐私保护、版权合规及内容安全领域具有重要价值。例如,当MLLM训练数据中包含受版权保护的图像或敏感视觉信息时,该方法可实现无需重训练的精准移除。此外,在连续学习场景下,该技术有助于模型动态更新知识库,提升多模态系统在实际部署中的合规性与适应性。
📄 摘要(原文)
The core challenge of machine unlearning is to strike a balance between target knowledge removal and non-target knowledge retention. In the context of Multimodal Large Language Models (MLLMs), this challenge becomes even more pronounced, as knowledge is further divided into visual and textual modalities that are tightly intertwined. In this paper, we introduce an MLLM unlearning approach that aims to forget target visual knowledge while preserving non-target visual knowledge and all textual knowledge. Specifically, we freeze the LLM backbone and achieve unlearning by fine-tuning the visual module. First, we propose a Contrastive Visual Forgetting (CVF) mechanism to separate target visual knowledge from retained visual knowledge, guiding the representations of target visual concepts toward appropriate regions in the feature space. Second, we identify the null space associated with retained knowledge and constrain the unlearning process within this space, thereby significantly mitigating degradation in knowledge retention. Third, beyond static unlearning scenarios, we extend our approach to continual unlearning, where forgetting requests arrive sequentially. Extensive experiments across diverse benchmarks demonstrate that our approach achieves a strong balance between effective forgetting and robust knowledge retention.