Triple Path Enhanced Neural Architecture Search for Multimodal Fake News Detection
作者: Bo Xu, Qiujie Xie, Jiahui Zhou, Linlin Zong
分类: cs.CV
发布日期: 2025-01-24 (更新: 2025-02-06)
备注: IEEE International Conference on Acoustics, Speech, and Signal Processing(ICASSP 2025)
💡 一句话要点
提出MUSE模型,通过三路径增强神经架构搜索解决多模态假新闻检测问题。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 多模态假新闻检测 神经架构搜索 模态融合 部分模态学习 动态路径 静态路径
📋 核心要点
- 现有方法在多模态假新闻检测中存在模型架构固化,导致多模态信息融合效果不佳的问题。
- MUSE模型采用三路径结构,包含两条动态路径处理部分模态数据,一条静态路径挖掘多模态关联。
- 实验结果表明,MUSE模型在假新闻检测任务上优于现有基线模型,性能得到稳定提升。
📝 摘要(中文)
多模态假新闻检测已成为社交媒体平台上面临的最关键问题之一。尽管现有方法已经取得了先进的性能,但仍然存在两个主要挑战:(1)由于模型架构固化,多模态新闻信息融合效果不佳;(2)对于包含部分模态的假新闻,泛化能力较弱。为了应对这些挑战,我们提出了一种新颖且灵活的三路径增强神经架构搜索模型MUSE。MUSE包括两条用于检测包含部分模态的假新闻的动态路径和一条用于挖掘潜在多模态相关性的静态路径。实验结果表明,MUSE相对于基线模型实现了稳定的性能提升。
🔬 方法详解
问题定义:论文旨在解决多模态假新闻检测中,现有模型架构固化导致的多模态信息融合不充分,以及对包含部分模态信息的假新闻泛化能力弱的问题。现有方法通常采用预定义的网络结构,难以适应不同模态信息之间的复杂关系,并且在模态缺失的情况下表现不佳。
核心思路:论文的核心思路是利用神经架构搜索(NAS)技术,自动搜索最优的网络结构,从而实现更有效的多模态信息融合。同时,设计三路径结构,分别处理完整模态信息和部分模态信息,增强模型对不同模态组合的适应性。
技术框架:MUSE模型包含三个主要路径:两条动态路径和一个静态路径。动态路径用于处理包含部分模态的假新闻,通过神经架构搜索自动学习最优的特征提取和融合方式。静态路径则用于处理包含所有模态的假新闻,利用预定义的网络结构挖掘潜在的多模态相关性。三个路径的输出最终进行融合,得到最终的预测结果。
关键创新:MUSE的关键创新在于引入了三路径增强的神经架构搜索框架。与传统的单路径模型相比,MUSE能够更好地处理模态缺失的情况,并自动学习最优的多模态融合策略。动态路径的设计使得模型能够灵活地适应不同的模态组合,提高了模型的泛化能力。
关键设计:在动态路径中,使用了可微分的神经架构搜索算法,通过梯度下降优化网络结构。搜索空间包括不同的卷积操作、池化操作和激活函数。损失函数包括分类损失和结构正则化损失,用于平衡模型的准确性和复杂度。静态路径则采用预训练的视觉和文本特征提取器,例如BERT和ResNet,提取高质量的模态特征。
🖼️ 关键图片
📊 实验亮点
实验结果表明,MUSE模型在多模态假新闻检测任务上取得了显著的性能提升。相较于基线模型,MUSE在多个数据集上都取得了更好的F1-score和准确率。尤其是在包含部分模态信息的数据集上,MUSE的性能提升更为明显,验证了其对模态缺失情况的鲁棒性。
🎯 应用场景
该研究成果可应用于社交媒体平台、新闻聚合网站等,用于自动检测和过滤虚假新闻,提高信息的可信度,减少虚假信息对社会的影响。此外,该方法也可以推广到其他多模态信息处理任务中,例如多模态情感分析、多模态事件检测等。
📄 摘要(原文)
Multimodal fake news detection has become one of the most crucial issues on social media platforms. Although existing methods have achieved advanced performance, two main challenges persist: (1) Under-performed multimodal news information fusion due to model architecture solidification, and (2) weak generalization ability on partial-modality contained fake news. To meet these challenges, we propose a novel and flexible triple path enhanced neural architecture search model MUSE. MUSE includes two dynamic paths for detecting partial-modality contained fake news and a static path for exploiting potential multimodal correlations. Experimental results show that MUSE achieves stable performance improvement over the baselines.