Rumor Detection on Social Media with Reinforcement Learning-based Key Propagation Graph Generator

📄 arXiv: 2405.13094v2 📥 PDF

作者: Yusong Zhang, Kun Xie, Xingyi Zhang, Xiangyu Dong, Sibo Wang

分类: cs.SI, cs.AI, cs.LG

发布日期: 2024-05-21 (更新: 2025-06-22)

DOI: 10.1145/3696410.3714651


💡 一句话要点

提出基于强化学习的关键传播图生成器KPG,用于提升社交媒体谣言检测的准确性。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 谣言检测 社交媒体 强化学习 图神经网络 传播图

📋 核心要点

  1. 现有谣言检测方法依赖传播图,但易受噪声和无关结构干扰,尤其在传播早期信息不足时效果不佳。
  2. 提出关键传播图生成器(KPG),利用强化学习生成信息丰富的传播模式,并识别关键子结构。
  3. KPG在四个数据集上表现优于现有方法,验证了其在谣言检测任务中的有效性。

📝 摘要(中文)

社交媒体上谣言的传播,尤其是在美国大选和COVID-19疫情等重大事件期间,对社会稳定和公众健康构成了严重威胁。现有的谣言检测方法主要依赖传播图来提高模型性能。然而,这些方法的有效性通常会受到传播过程中噪声和不相关结构的影响。为了解决这个问题,已经提出了权重调整和数据增强等技术。但是,它们严重依赖于丰富的原始传播结构,限制了它们在处理缺乏足够传播信息的谣言时的有效性,尤其是在传播的早期阶段。在这项工作中,我们介绍了一种新的基于强化学习的框架——关键传播图生成器(KPG),该框架为拓扑信息不足的事件生成上下文连贯且信息丰富的传播模式,并识别冗余和嘈杂的传播结构中重要子结构。KPG包括两个关键组件:候选响应生成器(CRG)和结束节点选择器(ENS)。CRG从精炼的传播模式中学习潜在变量分布,以消除噪声并为ENS生成新的候选对象,而ENS识别传播图中最具影响力的子结构,并为CRG提供训练数据。此外,我们开发了一个端到端框架,该框架利用来自预训练图神经网络的奖励来指导训练过程。生成的关键传播图随后用于下游谣言检测任务。在四个数据集上进行的大量实验表明,KPG优于当前最先进的方法。

🔬 方法详解

问题定义:现有社交媒体谣言检测方法依赖传播图,但传播图通常包含大量噪声和不相关结构,尤其是在谣言传播初期,信息不足导致性能下降。现有方法如权重调整和数据增强依赖于原始传播结构的丰富性,无法有效处理信息匮乏的早期谣言检测问题。

核心思路:论文的核心思路是利用强化学习自动生成高质量的关键传播图,从而克服原始传播图中的噪声和信息不足问题。通过学习生成更具代表性和信息量的传播模式,模型能够更准确地识别谣言。强化学习能够根据下游谣言检测任务的反馈,动态调整传播图的生成策略,从而优化传播图的质量。

技术框架:KPG框架包含两个主要模块:候选响应生成器(CRG)和结束节点选择器(ENS)。CRG负责从精炼的传播模式中学习潜在变量分布,生成新的候选传播节点,以扩展或修正原始传播图。ENS则负责从候选节点中选择最具影响力的节点,构建关键传播图的子结构。整个框架采用端到端的方式训练,利用预训练的图神经网络作为奖励函数,指导CRG和ENS的学习过程。最终生成的关键传播图被用于下游的谣言检测任务。

关键创新:该方法的核心创新在于利用强化学习自动生成关键传播图。与传统方法依赖于原始传播图的结构不同,KPG能够根据上下文信息和下游任务的反馈,动态生成更具信息量的传播模式。这种方法能够有效处理信息不足和噪声干扰的问题,尤其是在谣言传播的早期阶段。

关键设计:CRG使用变分自编码器(VAE)学习传播模式的潜在表示,并通过采样生成新的候选节点。ENS使用图神经网络(GNN)评估候选节点的重要性,并选择得分最高的节点加入关键传播图。奖励函数基于预训练的图神经网络在谣言检测任务上的性能,用于指导CRG和ENS的训练。具体损失函数包括VAE的重构损失和KL散度损失,以及强化学习的策略梯度损失。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,KPG在四个数据集上均优于现有最先进的谣言检测方法。具体而言,KPG在早期谣言检测任务中表现出显著优势,能够有效处理信息不足的情况。相较于基线方法,KPG在准确率和召回率等指标上均有显著提升,验证了其在谣言检测任务中的有效性。

🎯 应用场景

该研究成果可应用于社交媒体平台的内容审核、舆情监控和虚假信息治理。通过自动生成高质量的关键传播图,可以更准确地识别和抑制谣言的传播,维护社会稳定和公共安全。该技术还可扩展到其他图结构数据的分析和挖掘任务,如知识图谱补全、社交网络分析等。

📄 摘要(原文)

The spread of rumors on social media, particularly during significant events like the US elections and the COVID-19 pandemic, poses a serious threat to social stability and public health. Current rumor detection methods primarily rely on propagation graphs to improve the model performance. However, the effectiveness of these methods is often compromised by noisy and irrelevant structures in the propagation process. To tackle this issue, techniques such as weight adjustment and data augmentation have been proposed. However, they depend heavily on rich original propagation structures, limiting their effectiveness in handling rumors that lack sufficient propagation information, especially in the early stages of dissemination. In this work, we introduce the Key Propagation Graph Generator (KPG), a novel reinforcement learning-based framework, that generates contextually coherent and informative propagation patterns for events with insufficient topology information and identifies significant substructures in events with redundant and noisy propagation structures. KPG comprises two key components: the Candidate Response Generator (CRG) and the Ending Node Selector (ENS). CRG learns latent variable distributions from refined propagation patterns to eliminate noise and generate new candidates for ENS, while ENS identifies the most influential substructures in propagation graphs and provides training data for CRG. Furthermore, we develop an end-to-end framework that utilizes rewards derived from a pre-trained graph neural network to guide the training process. The resulting key propagation graphs are then employed in downstream rumor detection tasks. Extensive experiments conducted on four datasets demonstrate that KPG outperforms current state-of-the-art methods.