SURGE: An Event-Centric Social Media Sentiment Time Series Benchmark with Interaction Structure
作者: Chen Su, Pengsen Cheng, Yuanhe Tian, Yan Song
分类: cs.SI, cs.AI
发布日期: 2026-05-20
💡 一句话要点
SURGE:一个事件中心、包含交互结构的社交媒体情感时间序列基准
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 社交媒体分析 情感时间序列 事件检测 交互结构 基准数据集
📋 核心要点
- 现有社交媒体事件分析数据集规模小,且忽略了帖子间的交互结构,限制了模型泛化能力和对交互影响的深入研究。
- SURGE通过自动化流程构建大规模多事件数据集,包含事件级别时间序列、文本信息和帖子间的交互结构。
- 实验表明,SURGE具有局部持久性、文本增强预测迁移性差以及回复密集时期难度高等特点,为交互感知预测研究提供支持。
📝 摘要(中文)
社交媒体上的公共事件会产生大量的讨论,这些集体动态对于舆情预测和危机响应具有直接价值。捕捉这些动态在事件生命周期中的演变,需要将碎片化的帖子组织成事件级别的时间序列。现有的数据集仅涵盖单个类别中的少量事件,并且在构建时间序列时通常会忽略帖子之间的交互结构,这限制了跨事件类型的迁移以及对交互如何影响集体动态的受控研究。我们提出了SURGE,这是一个多事件社交媒体基准,它将事件级别的时间序列与对齐的文本和连接事件内帖子的交互结构配对。SURGE通过自动化的流程构建,以三种时间粒度生成日历对齐的时间序列,涵盖五个事件类别的67个事件和超过80万个帖子。每个时间段都与来自相同选定帖子的扁平化和结构化文本视图配对,从而能够对社交交互结构是否影响预测行为进行受控评估。在SURGE之上,我们定义了仅数值预测、文本增强预测、高交互评估和留一类别泛化的基准协议。使用代表性的时间序列和多模态预测模型进行的实验揭示了基准的三个属性:一个强大的局部持久性机制,其中朴素基线在绝对误差下仍然难以击败;现有文本增强预测器向事件驱动的社交媒体数据的迁移能力有限;以及回复密集时期难度增加,而聚合指标往往会掩盖这些时期。我们进一步包含了一个轻量级的结构感知探针作为参考实现,说明了SURGE如何支持交互感知预测研究。
🔬 方法详解
问题定义:现有社交媒体事件分析数据集存在以下痛点:一是数据集规模较小,事件覆盖范围有限;二是忽略了帖子之间的交互结构,例如回复、转发等关系,导致无法深入研究社交互动对舆情演变的影响;三是缺乏统一的基准测试协议,难以公平比较不同模型的性能。这些问题限制了模型在不同事件类型上的泛化能力,也阻碍了对社交互动影响的有效评估。
核心思路:SURGE的核心思路是构建一个大规模、多事件、包含交互结构的社交媒体情感时间序列基准数据集。通过自动化流程收集和整理数据,将碎片化的帖子组织成事件级别的时间序列,并保留帖子之间的交互关系。同时,定义了一系列基准测试协议,用于评估不同模型在数值预测、文本增强预测、高交互评估和跨类别泛化等方面的性能。
技术框架:SURGE的构建流程主要包括以下几个阶段:1) 数据收集:从社交媒体平台收集与特定事件相关的帖子;2) 数据清洗:对收集到的帖子进行清洗和过滤,去除噪声数据;3) 事件对齐:将帖子按照事件进行对齐,形成事件级别的时间序列;4) 交互结构构建:分析帖子之间的回复、转发等关系,构建帖子之间的交互结构;5) 特征提取:从帖子文本中提取文本特征,例如情感极性、主题等;6) 基准测试协议定义:定义一系列基准测试协议,用于评估不同模型的性能。
关键创新:SURGE的主要创新点在于:1) 构建了一个大规模、多事件的社交媒体情感时间序列基准数据集,涵盖了五个事件类别的67个事件和超过80万个帖子;2) 保留了帖子之间的交互结构,为研究社交互动对舆情演变的影响提供了数据基础;3) 定义了一系列基准测试协议,为公平比较不同模型的性能提供了标准。
关键设计:SURGE在数据构建过程中,采用了自动化流程,以保证数据的质量和效率。在交互结构构建方面,采用了图神经网络等技术,对帖子之间的关系进行建模。在基准测试协议方面,定义了多种评估指标,例如绝对误差、均方误差等,以全面评估模型的性能。此外,还提供了一个轻量级的结构感知探针作为参考实现,方便研究人员进行交互感知预测研究。
🖼️ 关键图片
📊 实验亮点
实验结果表明,SURGE数据集具有较强的局部持久性,朴素基线模型在绝对误差指标下表现良好。同时,现有文本增强预测模型在事件驱动的社交媒体数据上的迁移能力有限。此外,回复密集时期预测难度增加,表明交互结构对预测结果有重要影响。SURGE数据集为研究社交互动对舆情演变的影响提供了有力支持。
🎯 应用场景
SURGE数据集可广泛应用于舆情监测、危机预警、事件预测等领域。通过分析社交媒体上事件相关讨论的情感变化和交互结构,可以帮助政府、企业和个人及时了解舆论动态,预测事件发展趋势,并采取相应的应对措施。此外,SURGE还可以促进社交媒体情感分析、时间序列预测和图神经网络等领域的研究。
📄 摘要(原文)
Public events on social media generate large volumes of discussion whose collective dynamics carry direct value for opinion forecasting and crisis response. Capturing how these dynamics evolve across an event's lifecycle requires organizing fragmented posts into event-level time series. Existing datasets cover only a small number of events within a single category, and typically discard the interaction structure between posts when constructing time series, which restricts both transfer across event types and controlled study of how interactions shape the resulting collective dynamics. We present SURGE, a multi-event social media benchmark that pairs event-level time series with aligned text and interaction structure linking posts within an event. SURGE is built through an automated pipeline that produces calendar-aligned time series at three temporal granularities, covering 67 events and more than 800K posts across five event categories. Each time bin is paired with flat and structured textual views derived from the same selected posts, enabling controlled evaluation of whether social interaction structure affects forecasting behavior. On top of SURGE we define benchmark protocols for numerical-only forecasting, text-augmented forecasting, high-interaction evaluation, and leave-one-category-out generalization. Experiments with representative time-series and multimodal forecasting models reveal three properties of the benchmark: a strong local-persistence regime in which naive baselines remain hard to beat under absolute error, limited transfer of existing text-augmented forecasters to event-driven social-media data, and increased difficulty on reply-dense periods that aggregate metrics tend to obscure. We further include a lightweight structure-aware probe as a reference implementation, illustrating how SURGE can support interaction-aware forecasting research.