ExTax: Explainable Disinformation Detection via Persuasion, Emotion, and Narrative Role Taxonomies
作者: Shang Luo, Yingguang Yang, Zhenchen Sun, Yang Liu, Bin Chong, Jingru Chen, Yancheng Chen, Jiayu Liang, Kefu Xu, Hao Peng, Philip S. Yu
分类: cs.CL
发布日期: 2026-05-26
💡 一句话要点
ExTax:提出一种基于说服、情感和叙事角色分类法的可解释虚假信息检测框架
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 虚假信息检测 可解释性 说服性修辞 情感操纵 叙事角色 多模态融合 异构注意力
📋 核心要点
- 现有虚假信息检测方法侧重于孤立信号,难以捕捉多方面的操纵意图,缺乏可解释性。
- ExTax框架将说服性修辞、情感操纵和叙事角色统一到17维分类空间,提供可解释的操纵概况。
- ExTax在跨领域和跨类型基准测试中优于现有方法,并在类型不平衡情况下表现出更强的鲁棒性。
📝 摘要(中文)
大型语言模型的普及加速了高流畅度虚假信息的生成和传播,使得传统的语法-语义验证方法越来越不足。此类欺骗很少仅仅依赖于表面上的虚假,而是经常结合说服性修辞、情感操纵和叙事角色构建,通过多种认知途径影响读者的解读。然而,现有的检测器通常强调孤立的信号,例如语法、外部知识、说服或情感线索,因此难以捕捉虚假信息背后多方面的操纵意图,也无法提供可供人工审核的解释。为了解决这一差距,我们提出了ExTax,一个与分类法对齐的可解释虚假信息检测框架。ExTax将说服性修辞、情感操纵和叙事角色统一到一个17维的分类空间中,涵盖6种说服性修辞策略、5种情感操纵方法和6种叙事角色类别。它从多个前沿大型语言模型中提取属性,通过熵驱动的动态标签平滑来协调它们之间的分歧,并通过异构多头注意力将生成的分类表示与上下文编码融合,从而将每个预测都建立在一个可解释的操纵概况之上。在五个跨领域和跨类型的基准测试中,ExTax实现了0.8456的总体Macro F1值,优于最先进的深度学习和基于LLM的基线模型。它在严重的类型不平衡下仍然保持稳健,而最强的深度学习基线从0.9454降至0.6194。
🔬 方法详解
问题定义:当前虚假信息检测方法主要依赖于语法、语义或外部知识的验证,忽略了虚假信息中常见的说服性修辞、情感操纵和叙事角色等深层认知影响因素。这些方法难以捕捉到虚假信息背后复杂的操纵意图,并且缺乏可解释性,难以进行人工审核和验证。
核心思路:ExTax的核心思路是将虚假信息检测问题转化为一个多维属性分类问题,通过构建一个包含说服性修辞、情感操纵和叙事角色的分类体系,对虚假信息进行细粒度的分析和表示。通过将预测结果与这些可解释的属性关联起来,ExTax能够提供更具解释性的检测结果。
技术框架:ExTax框架主要包含以下几个模块:1) 分类体系构建:构建一个包含17个维度的分类体系,涵盖6种说服性修辞策略、5种情感操纵方法和6种叙事角色类别。2) 属性提取:利用多个大型语言模型(LLMs)从文本中提取这些属性。3) 标签平滑:使用熵驱动的动态标签平滑方法来协调不同LLM之间的分歧,提高属性提取的准确性。4) 表示融合:通过异构多头注意力机制,将提取的分类属性表示与上下文编码融合,得到最终的虚假信息检测结果。
关键创新:ExTax最重要的技术创新在于其分类体系和属性融合方法。该分类体系能够全面地描述虚假信息中的操纵意图,而异构多头注意力机制能够有效地融合不同类型的属性表示,从而提高检测的准确性和可解释性。与现有方法相比,ExTax不再仅仅关注表面上的虚假性,而是深入挖掘虚假信息背后的认知影响因素。
关键设计:在属性提取阶段,ExTax使用了多个不同的LLM,并采用熵驱动的动态标签平滑方法来处理LLM之间的分歧。这种方法能够根据LLM预测结果的不确定性动态调整标签的权重,从而提高属性提取的准确性。在表示融合阶段,ExTax使用了异构多头注意力机制,允许模型学习不同类型属性之间的关系,从而更好地捕捉虚假信息的操纵意图。
🖼️ 关键图片
📊 实验亮点
ExTax在五个跨领域和跨类型的基准测试中取得了显著的性能提升,总体Macro F1值达到0.8456,优于最先进的深度学习和基于LLM的基线模型。尤其是在严重的类型不平衡情况下,ExTax表现出更强的鲁棒性,而最强的深度学习基线性能显著下降,这表明ExTax具有更强的泛化能力。
🎯 应用场景
ExTax可应用于社交媒体平台、新闻网站等场景,用于自动检测和识别虚假信息,帮助用户识别和抵制虚假信息的传播。该研究有助于提高公众对虚假信息的认知和防范能力,维护网络空间的健康和安全。未来,该方法可以扩展到其他类型的欺骗性内容检测,例如网络诈骗、恶意评论等。
📄 摘要(原文)
The democratization of LLMs has accelerated the generation and circulation of highly fluent disinformation, making traditional syntax-semantic verification increasingly insufficient. Such deception rarely relies solely on surface-level falsity; instead, it often combines persuasive rhetoric, emotional manipulation, and narrative role construction to influence readers' interpretations through multiple cognitive pathways. However, existing detectors typically emphasize isolated signals -- such as syntax, external knowledge, persuasion, or affective cues -- and therefore struggle to capture the multi-faceted manipulative intents underlying disinformation or provide human-auditable explanations. To address this gap, we present \textbf{ExTax}, a taxonomy-aligned framework for explainable disinformation detection. ExTax unifies persuasive rhetoric, emotional manipulation, and narrative roles into a 17-dimensional taxonomic space, covering 6 persuasive-rhetoric strategies, 5 emotional-manipulation methods, and 6 narrative-role categories. It elicits attributes from multiple frontier LLMs, reconciles their disagreements through Entropy-driven Dynamic Label Smoothing, and fuses the resulting taxonomic representations with contextual encodings via Heterogeneous Multi-Head Attention, grounding each prediction in an interpretable manipulation profile. Across five cross-domain and cross-genre benchmarks, ExTax achieves an overall Macro $F_1$ of $0.8456$, outperforming state-of-the-art deep learning and LLM-based baselines. It also remains robust under severe genre imbalance, where the strongest deep baseline degrades from $0.9454$ to $0.6194$.