Disentangling Fact from Sentiment: A Dynamic Conflict-Consensus Framework for Multimodal Fake News Detection

作者: Weilin Zhou, Zonghao Ying, Junjie Mu, Shengwei Tian, Quanchen Zou, Deyue Zhang, Dongdong Yang, Xiangzheng Zhang

分类: cs.LG, cs.AI

发布日期: 2025-12-19

💡 一句话要点

提出动态冲突-共识框架DCCF，用于增强多模态假新闻检测中矛盾信息的利用。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 多模态假新闻检测 冲突-共识框架 特征动力学 不一致性寻求 事实情感解耦

📋 核心要点

现有方法将跨模态差异视为噪声并进行平滑，忽略了假新闻中模态间的矛盾信息。
DCCF框架将输入解耦为事实和情感空间，并利用特征动力学主动提取模态间的冲突。
实验结果表明，DCCF在多个数据集上优于现有方法，平均准确率提升了3.52%。

📝 摘要（中文）

目前流行的多模态假新闻检测依赖于基于一致性的融合，但这种范式从根本上误解了关键的跨模态差异，将其视为噪声，导致过度平滑，从而稀释了伪造的关键证据。主流的基于一致性的融合固有地最小化特征差异以对齐模态，但这种方法从根本上是失败的，因为它无意中平滑了细微的跨模态矛盾，而这些矛盾是伪造的主要证据。为了解决这个问题，我们提出了动态冲突-共识框架（DCCF），这是一种不一致性寻求范式，旨在放大而不是抑制矛盾。首先，DCCF将输入解耦为独立的“事实”和“情感”空间，以区分客观不匹配和情感不和谐。其次，我们采用受物理学启发的特征动力学来迭代地极化这些表示，主动提取信息量最大的冲突。最后，一种冲突-共识机制根据全局上下文标准化这些局部差异，以实现稳健的审议判断。在三个真实世界数据集上进行的大量实验表明，DCCF始终优于最先进的基线，平均准确率提高了3.52%。

🔬 方法详解

问题定义：多模态假新闻检测旨在通过分析文本、图像等多种模态的信息来识别虚假新闻。现有方法通常采用基于一致性的融合策略，即最小化不同模态之间的特征差异，以期获得更鲁棒的表示。然而，这种策略忽略了假新闻中一个关键特征：不同模态之间往往存在矛盾或不一致的信息。现有方法将这些矛盾视为噪声并进行平滑，导致关键的伪造证据被稀释。

核心思路：DCCF的核心思路是改变以往“求同”的策略，转而“求异”，即主动寻找并放大不同模态之间的冲突信息。该框架认为，这些冲突信息是识别假新闻的关键证据。为了更有效地提取冲突，DCCF将输入解耦为“事实”和“情感”两个空间，分别处理客观信息和情感信息，从而更好地区分客观不匹配和情感不和谐。

技术框架：DCCF框架主要包含三个阶段：1) 解耦输入：将多模态输入解耦为独立的“事实”和“情感”空间。2) 特征动力学：采用受物理学启发的特征动力学方法，迭代地极化这些表示，主动提取信息量最大的冲突。3) 冲突-共识机制：根据全局上下文标准化这些局部差异，以实现稳健的判断。该机制旨在平衡局部冲突和全局一致性，从而做出更准确的决策。

关键创新：DCCF最重要的创新点在于其“不一致性寻求”的范式。与现有方法专注于模态对齐和一致性融合不同，DCCF主动寻找并放大模态间的冲突信息，将其作为识别假新闻的关键证据。此外，将输入解耦为“事实”和“情感”空间，并采用特征动力学方法提取冲突，也是该框架的重要创新。

关键设计：DCCF的关键设计包括：1) 如何将输入解耦为“事实”和“情感”空间（具体方法未知）。2) 特征动力学的具体实现方式，例如采用什么样的物理模型，如何定义能量函数等（具体细节未知）。3) 冲突-共识机制的具体实现方式，例如如何计算局部差异和全局上下文，如何进行标准化等（具体细节未知）。这些细节将直接影响DCCF的性能。

🖼️ 关键图片

📊 实验亮点

DCCF在三个真实世界数据集上进行了广泛的实验，结果表明，DCCF始终优于最先进的基线方法，平均准确率提高了3.52%。这表明DCCF框架在多模态假新闻检测方面具有显著的优势，能够更有效地利用模态间的冲突信息。

🎯 应用场景

DCCF框架可应用于各种在线平台，例如社交媒体、新闻网站等，以自动检测和过滤虚假新闻，从而提高信息的可信度，减少虚假信息对社会的影响。该研究对于维护健康的在线信息生态系统具有重要意义，并有助于提升公众对信息的辨别能力。

📄 摘要（原文）

Prevalent multimodal fake news detection relies on consistency-based fusion, yet this paradigm fundamentally misinterprets critical cross-modal discrepancies as noise, leading to over-smoothing, which dilutes critical evidence of fabrication. Mainstream consistency-based fusion inherently minimizes feature discrepancies to align modalities, yet this approach fundamentally fails because it inadvertently smoothes out the subtle cross-modal contradictions that serve as the primary evidence of fabrication. To address this, we propose the Dynamic Conflict-Consensus Framework (DCCF), an inconsistency-seeking paradigm designed to amplify rather than suppress contradictions. First, DCCF decouples inputs into independent Fact and Sentiment spaces to distinguish objective mismatches from emotional dissonance. Second, we employ physics-inspired feature dynamics to iteratively polarize these representations, actively extracting maximally informative conflicts. Finally, a conflict-consensus mechanism standardizes these local discrepancies against the global context for robust deliberative judgment.Extensive experiments conducted on three real world datasets demonstrate that DCCF consistently outperforms state-of-the-art baselines, achieving an average accuracy improvement of 3.52\%.

Disentangling Fact from Sentiment: A Dynamic Conflict-Consensus Framework for Multimodal Fake News Detection

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理