Bots Don't Sit Still: A Longitudinal Study of Bot Behaviour Change, Temporal Drift, and Feature-Structure Evolution
作者: Ohoud Alzahrani, Russell Beale, Bob Hendley
分类: cs.HC, cs.AI, cs.SI
发布日期: 2025-12-18
💡 一句话要点
揭示社交Bot行为随时间演变规律,为Bot检测系统设计提供依据
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 社交Bot检测 行为演变 时间序列分析 特征工程 非平稳性
📋 核心要点
- 现有Bot检测系统假设Bot行为是静态的,忽略了Bot随时间演变的特性,这降低了检测的准确性。
- 本文通过分析Twitter推广Bot的行为特征随时间的变化,揭示了Bot行为的非平稳性和适应性。
- 实验结果表明,Bot的行为特征及其相互关系会随时间发生显著变化,不同代和不同生命周期的Bot表现出不同的行为模式。
📝 摘要(中文)
社交Bot已被广泛应用于在线平台,进行推广、劝说和操纵。大多数Bot检测系统将行为特征视为静态的,隐含地假设Bot的行为随时间保持不变。本文针对Twitter上的推广Bot,分析了单个行为信号及其相互关系的变化,从而验证了这一假设。研究使用了2615个推广Bot账户和280万条推文,构建了10个基于内容的元特征的年度时间序列。Augmented Dickey-Fuller和KPSS检验以及线性趋势表明,所有10个特征都是非平稳的:9个随时间增加,而语言多样性略有下降。按激活代和账户年龄分层显示了系统性差异:第二代Bot最活跃且链接最多;短期Bot表现出强烈、重复的活动,大量使用主题标签/URL;长期Bot不太活跃,但语言更加多样化,并且更灵活地使用表情符号。然后,使用涵盖操作、主题相似性、URL、主题标签、情感、表情符号和媒体的18个可解释的二元特征(153对)分析了各代之间的共现情况。卡方检验表明几乎所有对都是相关的。Spearman相关性在强度上发生变化,有时甚至极性也会发生变化:许多链接(例如,多个带有媒体的主题标签;带有URL的情感)得到加强,而另一些链接则从弱正相关变为弱或中等负相关。后几代显示出更结构化的线索组合。总而言之,这些研究提供了证据,表明推广社交Bot会随着时间的推移在单个元特征和特征相互依赖的层面上进行调整,这对基于历史行为特征训练的Bot检测系统的设计和评估具有直接影响。
🔬 方法详解
问题定义:现有Bot检测方法通常假设Bot的行为模式是静态的,即在一段时间内不会发生显著变化。然而,Bot的开发者会不断调整Bot的行为,以规避检测并提高其有效性。因此,如何检测随时间演变的Bot行为是一个重要的挑战。现有方法的痛点在于无法有效应对Bot行为的动态变化,导致检测准确率下降。
核心思路:本文的核心思路是通过纵向研究,分析Bot行为特征随时间的变化趋势和相互依赖关系的变化。通过对大量Bot账户的推文数据进行分析,提取出关键的行为特征,并观察这些特征在不同时间段内的变化情况。同时,研究不同特征之间的相关性,以及这些相关性如何随时间演变。这样可以更全面地了解Bot行为的动态特性,从而为设计更有效的Bot检测系统提供依据。
技术框架:本文的研究框架主要包括以下几个阶段:1. 数据收集:收集大量的Twitter推广Bot账户及其推文数据。2. 特征提取:从推文中提取出10个基于内容的元特征,例如链接数量、主题标签数量、语言多样性等。3. 时间序列分析:构建每个特征的年度时间序列,并使用Augmented Dickey-Fuller和KPSS检验来验证特征的非平稳性。4. 分层分析:按激活代和账户年龄对Bot进行分层,分析不同层级Bot的行为特征差异。5. 共现分析:使用18个二元特征分析各代Bot之间的共现情况,并使用卡方检验和Spearman相关性分析特征之间的依赖关系。
关键创新:本文最重要的技术创新点在于对Bot行为的纵向分析。与以往的研究不同,本文没有将Bot行为视为静态的,而是关注其随时间的变化。通过时间序列分析和共现分析,揭示了Bot行为的非平稳性和适应性。此外,本文还对不同代和不同生命周期的Bot进行了分层分析,发现了它们之间存在的系统性差异。
关键设计:在特征提取方面,本文选择了10个基于内容的元特征,这些特征能够反映Bot的行为模式。在时间序列分析方面,本文使用了Augmented Dickey-Fuller和KPSS检验来验证特征的非平稳性。在共现分析方面,本文使用了18个二元特征,并使用卡方检验和Spearman相关性分析特征之间的依赖关系。这些设计使得本文能够更全面地了解Bot行为的动态特性。
🖼️ 关键图片
📊 实验亮点
研究发现,所有10个内容元特征都是非平稳的,其中9个随时间增加,而语言多样性略有下降。第二代Bot最活跃且链接最多,短期Bot表现出强烈、重复的活动,长期Bot不太活跃但语言更加多样化。Spearman相关性分析表明,许多特征之间的相关性强度和极性会随时间发生变化,后几代Bot显示出更结构化的线索组合。
🎯 应用场景
该研究成果可应用于社交媒体平台,用于提高Bot检测系统的准确性和鲁棒性。通过了解Bot行为的演变规律,可以设计出能够适应Bot行为变化的检测算法,从而更有效地识别和阻止恶意Bot。此外,该研究还可以帮助社交媒体平台更好地理解Bot的行为模式,从而制定更有效的反Bot策略。
📄 摘要(原文)
Social bots are now deeply embedded in online platforms for promotion, persuasion, and manipulation. Most bot-detection systems still treat behavioural features as static, implicitly assuming bots behave stationarily over time. We test that assumption for promotional Twitter bots, analysing change in both individual behavioural signals and the relationships between them. Using 2,615 promotional bot accounts and 2.8M tweets, we build yearly time series for ten content-based meta-features. Augmented Dickey-Fuller and KPSS tests plus linear trends show all ten are non-stationary: nine increase over time, while language diversity declines slightly. Stratifying by activation generation and account age reveals systematic differences: second-generation bots are most active and link-heavy; short-lived bots show intense, repetitive activity with heavy hashtag/URL use; long-lived bots are less active but more linguistically diverse and use emojis more variably. We then analyse co-occurrence across generations using 18 interpretable binary features spanning actions, topic similarity, URLs, hashtags, sentiment, emojis, and media (153 pairs). Chi-square tests indicate almost all pairs are dependent. Spearman correlations shift in strength and sometimes polarity: many links (e.g. multiple hashtags with media; sentiment with URLs) strengthen, while others flip from weakly positive to weakly or moderately negative. Later generations show more structured combinations of cues. Taken together, these studies provide evidence that promotional social bots adapt over time at both the level of individual meta-features and the level of feature interdependencies, with direct implications for the design and evaluation of bot-detection systems trained on historical behavioural features.