ExTax: Explainable Disinformation Detection via Persuasion, Emotion, and Narrative Role Taxonomies

作者: Shang Luo, Yingguang Yang, Zhenchen Sun, Yang Liu, Bin Chong, Jingru Chen, Yancheng Chen, Jiayu Liang, Kefu Xu, Hao Peng, Philip S. Yu

分类: cs.CL

发布日期: 2026-05-26

💡 一句话要点

ExTax：提出一种基于说服、情感和叙事角色分类法的可解释虚假信息检测框架

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 虚假信息检测 可解释性 说服性修辞 情感操纵 叙事角色 多模态融合 异构注意力

📋 核心要点

现有虚假信息检测方法侧重于孤立信号，难以捕捉多方面的操纵意图，缺乏可解释性。
ExTax框架将说服性修辞、情感操纵和叙事角色统一到17维分类空间，提供可解释的操纵概况。
ExTax在跨领域和跨类型基准测试中优于现有方法，并在类型不平衡情况下表现出更强的鲁棒性。

📝 摘要（中文）

大型语言模型的普及加速了高流畅度虚假信息的生成和传播，使得传统的语法-语义验证方法越来越不足。此类欺骗很少仅仅依赖于表面上的虚假，而是经常结合说服性修辞、情感操纵和叙事角色构建，通过多种认知途径影响读者的解读。然而，现有的检测器通常强调孤立的信号，例如语法、外部知识、说服或情感线索，因此难以捕捉虚假信息背后多方面的操纵意图，也无法提供可供人工审核的解释。为了解决这一差距，我们提出了ExTax，一个与分类法对齐的可解释虚假信息检测框架。ExTax将说服性修辞、情感操纵和叙事角色统一到一个17维的分类空间中，涵盖6种说服性修辞策略、5种情感操纵方法和6种叙事角色类别。它从多个前沿大型语言模型中提取属性，通过熵驱动的动态标签平滑来协调它们之间的分歧，并通过异构多头注意力将生成的分类表示与上下文编码融合，从而将每个预测都建立在一个可解释的操纵概况之上。在五个跨领域和跨类型的基准测试中，ExTax实现了0.8456的总体Macro F1值，优于最先进的深度学习和基于LLM的基线模型。它在严重的类型不平衡下仍然保持稳健，而最强的深度学习基线从0.9454降至0.6194。

🔬 方法详解

问题定义：当前虚假信息检测方法主要依赖于语法、语义或外部知识的验证，忽略了虚假信息中常见的说服性修辞、情感操纵和叙事角色等深层认知影响因素。这些方法难以捕捉到虚假信息背后复杂的操纵意图，并且缺乏可解释性，难以进行人工审核和验证。

核心思路：ExTax的核心思路是将虚假信息检测问题转化为一个多维属性分类问题，通过构建一个包含说服性修辞、情感操纵和叙事角色的分类体系，对虚假信息进行细粒度的分析和表示。通过将预测结果与这些可解释的属性关联起来，ExTax能够提供更具解释性的检测结果。

技术框架：ExTax框架主要包含以下几个模块：1) 分类体系构建：构建一个包含17个维度的分类体系，涵盖6种说服性修辞策略、5种情感操纵方法和6种叙事角色类别。2) 属性提取：利用多个大型语言模型（LLMs）从文本中提取这些属性。3) 标签平滑：使用熵驱动的动态标签平滑方法来协调不同LLM之间的分歧，提高属性提取的准确性。4) 表示融合：通过异构多头注意力机制，将提取的分类属性表示与上下文编码融合，得到最终的虚假信息检测结果。

关键创新：ExTax最重要的技术创新在于其分类体系和属性融合方法。该分类体系能够全面地描述虚假信息中的操纵意图，而异构多头注意力机制能够有效地融合不同类型的属性表示，从而提高检测的准确性和可解释性。与现有方法相比，ExTax不再仅仅关注表面上的虚假性，而是深入挖掘虚假信息背后的认知影响因素。

关键设计：在属性提取阶段，ExTax使用了多个不同的LLM，并采用熵驱动的动态标签平滑方法来处理LLM之间的分歧。这种方法能够根据LLM预测结果的不确定性动态调整标签的权重，从而提高属性提取的准确性。在表示融合阶段，ExTax使用了异构多头注意力机制，允许模型学习不同类型属性之间的关系，从而更好地捕捉虚假信息的操纵意图。

🖼️ 关键图片

📊 实验亮点

ExTax在五个跨领域和跨类型的基准测试中取得了显著的性能提升，总体Macro F1值达到0.8456，优于最先进的深度学习和基于LLM的基线模型。尤其是在严重的类型不平衡情况下，ExTax表现出更强的鲁棒性，而最强的深度学习基线性能显著下降，这表明ExTax具有更强的泛化能力。

🎯 应用场景

ExTax可应用于社交媒体平台、新闻网站等场景，用于自动检测和识别虚假信息，帮助用户识别和抵制虚假信息的传播。该研究有助于提高公众对虚假信息的认知和防范能力，维护网络空间的健康和安全。未来，该方法可以扩展到其他类型的欺骗性内容检测，例如网络诈骗、恶意评论等。

📄 摘要（原文）

The democratization of LLMs has accelerated the generation and circulation of highly fluent disinformation, making traditional syntax-semantic verification increasingly insufficient. Such deception rarely relies solely on surface-level falsity; instead, it often combines persuasive rhetoric, emotional manipulation, and narrative role construction to influence readers' interpretations through multiple cognitive pathways. However, existing detectors typically emphasize isolated signals -- such as syntax, external knowledge, persuasion, or affective cues -- and therefore struggle to capture the multi-faceted manipulative intents underlying disinformation or provide human-auditable explanations. To address this gap, we present \textbf{ExTax}, a taxonomy-aligned framework for explainable disinformation detection. ExTax unifies persuasive rhetoric, emotional manipulation, and narrative roles into a 17-dimensional taxonomic space, covering 6 persuasive-rhetoric strategies, 5 emotional-manipulation methods, and 6 narrative-role categories. It elicits attributes from multiple frontier LLMs, reconciles their disagreements through Entropy-driven Dynamic Label Smoothing, and fuses the resulting taxonomic representations with contextual encodings via Heterogeneous Multi-Head Attention, grounding each prediction in an interpretable manipulation profile. Across five cross-domain and cross-genre benchmarks, ExTax achieves an overall Macro $F_1$ of $0.8456$, outperforming state-of-the-art deep learning and LLM-based baselines. It also remains robust under severe genre imbalance, where the strongest deep baseline degrades from $0.9454$ to $0.6194$.

ExTax: Explainable Disinformation Detection via Persuasion, Emotion, and Narrative Role Taxonomies

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理