Disentangling Fact from Sentiment: A Dynamic Conflict-Consensus Framework for Multimodal Fake News Detection

📄 arXiv: 2512.20670v1 📥 PDF

作者: Weilin Zhou, Zonghao Ying, Junjie Mu, Shengwei Tian, Quanchen Zou, Deyue Zhang, Dongdong Yang, Xiangzheng Zhang

分类: cs.LG, cs.AI

发布日期: 2025-12-19


💡 一句话要点

提出动态冲突-共识框架DCCF,用于增强多模态假新闻检测中矛盾信息的利用。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多模态假新闻检测 冲突-共识框架 特征动力学 不一致性寻求 事实情感解耦

📋 核心要点

  1. 现有方法将跨模态差异视为噪声并进行平滑,忽略了假新闻中模态间的矛盾信息。
  2. DCCF框架将输入解耦为事实和情感空间,并利用特征动力学主动提取模态间的冲突。
  3. 实验结果表明,DCCF在多个数据集上优于现有方法,平均准确率提升了3.52%。

📝 摘要(中文)

目前流行的多模态假新闻检测依赖于基于一致性的融合,但这种范式从根本上误解了关键的跨模态差异,将其视为噪声,导致过度平滑,从而稀释了伪造的关键证据。主流的基于一致性的融合固有地最小化特征差异以对齐模态,但这种方法从根本上是失败的,因为它无意中平滑了细微的跨模态矛盾,而这些矛盾是伪造的主要证据。为了解决这个问题,我们提出了动态冲突-共识框架(DCCF),这是一种不一致性寻求范式,旨在放大而不是抑制矛盾。首先,DCCF将输入解耦为独立的“事实”和“情感”空间,以区分客观不匹配和情感不和谐。其次,我们采用受物理学启发的特征动力学来迭代地极化这些表示,主动提取信息量最大的冲突。最后,一种冲突-共识机制根据全局上下文标准化这些局部差异,以实现稳健的审议判断。在三个真实世界数据集上进行的大量实验表明,DCCF始终优于最先进的基线,平均准确率提高了3.52%。

🔬 方法详解

问题定义:多模态假新闻检测旨在通过分析文本、图像等多种模态的信息来识别虚假新闻。现有方法通常采用基于一致性的融合策略,即最小化不同模态之间的特征差异,以期获得更鲁棒的表示。然而,这种策略忽略了假新闻中一个关键特征:不同模态之间往往存在矛盾或不一致的信息。现有方法将这些矛盾视为噪声并进行平滑,导致关键的伪造证据被稀释。

核心思路:DCCF的核心思路是改变以往“求同”的策略,转而“求异”,即主动寻找并放大不同模态之间的冲突信息。该框架认为,这些冲突信息是识别假新闻的关键证据。为了更有效地提取冲突,DCCF将输入解耦为“事实”和“情感”两个空间,分别处理客观信息和情感信息,从而更好地区分客观不匹配和情感不和谐。

技术框架:DCCF框架主要包含三个阶段:1) 解耦输入:将多模态输入解耦为独立的“事实”和“情感”空间。2) 特征动力学:采用受物理学启发的特征动力学方法,迭代地极化这些表示,主动提取信息量最大的冲突。3) 冲突-共识机制:根据全局上下文标准化这些局部差异,以实现稳健的判断。该机制旨在平衡局部冲突和全局一致性,从而做出更准确的决策。

关键创新:DCCF最重要的创新点在于其“不一致性寻求”的范式。与现有方法专注于模态对齐和一致性融合不同,DCCF主动寻找并放大模态间的冲突信息,将其作为识别假新闻的关键证据。此外,将输入解耦为“事实”和“情感”空间,并采用特征动力学方法提取冲突,也是该框架的重要创新。

关键设计:DCCF的关键设计包括:1) 如何将输入解耦为“事实”和“情感”空间(具体方法未知)。2) 特征动力学的具体实现方式,例如采用什么样的物理模型,如何定义能量函数等(具体细节未知)。3) 冲突-共识机制的具体实现方式,例如如何计算局部差异和全局上下文,如何进行标准化等(具体细节未知)。这些细节将直接影响DCCF的性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

DCCF在三个真实世界数据集上进行了广泛的实验,结果表明,DCCF始终优于最先进的基线方法,平均准确率提高了3.52%。这表明DCCF框架在多模态假新闻检测方面具有显著的优势,能够更有效地利用模态间的冲突信息。

🎯 应用场景

DCCF框架可应用于各种在线平台,例如社交媒体、新闻网站等,以自动检测和过滤虚假新闻,从而提高信息的可信度,减少虚假信息对社会的影响。该研究对于维护健康的在线信息生态系统具有重要意义,并有助于提升公众对信息的辨别能力。

📄 摘要(原文)

Prevalent multimodal fake news detection relies on consistency-based fusion, yet this paradigm fundamentally misinterprets critical cross-modal discrepancies as noise, leading to over-smoothing, which dilutes critical evidence of fabrication. Mainstream consistency-based fusion inherently minimizes feature discrepancies to align modalities, yet this approach fundamentally fails because it inadvertently smoothes out the subtle cross-modal contradictions that serve as the primary evidence of fabrication. To address this, we propose the Dynamic Conflict-Consensus Framework (DCCF), an inconsistency-seeking paradigm designed to amplify rather than suppress contradictions. First, DCCF decouples inputs into independent Fact and Sentiment spaces to distinguish objective mismatches from emotional dissonance. Second, we employ physics-inspired feature dynamics to iteratively polarize these representations, actively extracting maximally informative conflicts. Finally, a conflict-consensus mechanism standardizes these local discrepancies against the global context for robust deliberative judgment.Extensive experiments conducted on three real world datasets demonstrate that DCCF consistently outperforms state-of-the-art baselines, achieving an average accuracy improvement of 3.52\%.