Emotion-Aware Clickbait Attack in Social Media

📄 arXiv: 2604.27369v1 📥 PDF

作者: Syed Mhamudul Hasan, Mohd. Farhan Israk Soumik, Abdur R. Shahid

分类: cs.CL, cs.SI

发布日期: 2026-04-30


💡 一句话要点

提出情感感知型Clickbait攻击框架,通过优化情感影响绕过现有检测系统。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Clickbait攻击 情感感知 社交媒体 自然语言处理 大型语言模型

📋 核心要点

  1. 现有Clickbait检测方法侧重于静态文本特征,忽略了情感因素在诱导点击中的重要作用。
  2. 提出基于VAD空间的情感感知框架,通过风格转换优化Clickbait的情感表达,增强用户参与度。
  3. 实验表明,该方法能有效降低现有Clickbait检测系统的性能,错误率提升高达30.63%。

📝 摘要(中文)

Clickbait的特征是相对于信息内容而言,具有不成比例的高情感强度,并且通常通过特定的结构模式来强化。然而,目前的研究将Clickbait视为一种静态的文本现象,其特征在于语言模式和结构线索。此外,现有的检测系统主要依赖于Clickbait的表面特征。本文提出了一种情感感知型Clickbait生成攻击,其中使用风格转换来优化情感影响。我们提出了一个基于Valence-Arousal-Dominance (VAD)空间的情感感知框架,以模拟Clickbait生成中潜在的情感动态,从而实现最佳的用户参与度。为了模拟真实的攻击场景,我们使用Sentence-BERT将Clickbait标题与语义相似的社交媒体帖子对齐,并通过大型语言模型(LLMs)生成多个风格重写。在此基础上,我们定义了一个好奇心差距(CG)函数,该函数计算Clickbait标题与当前帖子的变化,以量化情感激活将如何促进用户的好奇心并规避社交媒体上现有的系统。实验结果表明,情感感知风格化显著降低了最先进分类器的性能,导致基础系统上的错误分类率高达2.58%至30.63%。

🔬 方法详解

问题定义:现有Clickbait检测方法主要依赖于表面语言特征和结构线索,将Clickbait视为静态文本现象。这种方法忽略了情感在诱导用户点击中的关键作用,使得检测系统容易被情感表达更丰富的Clickbait绕过。因此,需要研究如何利用情感因素生成更具欺骗性的Clickbait,并评估现有检测系统的鲁棒性。

核心思路:论文的核心思路是构建一个情感感知的Clickbait生成攻击框架,通过优化Clickbait的情感表达来提高其欺骗性。该框架利用Valence-Arousal-Dominance (VAD)情感空间来建模情感动态,并使用风格转换技术来调整Clickbait的文本风格,使其更具情感冲击力,从而吸引用户点击。

技术框架:该框架主要包含以下几个模块:1) 使用Sentence-BERT将Clickbait标题与语义相似的社交媒体帖子对齐;2) 使用大型语言模型(LLMs)生成多个风格重写的标题;3) 定义一个好奇心差距(CG)函数,用于量化情感激活对用户好奇心的影响;4) 基于VAD空间的情感模型,用于评估和优化Clickbait的情感表达。整体流程是:输入社交媒体帖子,生成多个风格重写的Clickbait标题,使用情感模型和好奇心差距函数评估标题的欺骗性,选择最优的标题作为攻击结果。

关键创新:最重要的技术创新点在于情感感知的Clickbait生成方法。与现有方法不同,该方法不仅考虑了Clickbait的语言特征,还考虑了其情感表达。通过在VAD空间中建模情感动态,并使用风格转换技术来优化情感表达,该方法能够生成更具欺骗性的Clickbait。

关键设计:关键设计包括:1) 使用Sentence-BERT进行语义匹配,确保生成的Clickbait与原始帖子相关;2) 使用大型语言模型进行风格转换,生成多样化的标题;3) 定义好奇心差距函数,量化情感激活对用户好奇心的影响,公式未知;4) 使用VAD空间建模情感,具体VAD值的获取方式未知;5) 损失函数的设计未知,用于指导风格转换和情感优化。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,情感感知风格化显著降低了最先进分类器的性能,导致基础系统上的错误分类率从2.58%提升至30.63%。这表明现有Clickbait检测系统对情感攻击的防御能力较弱,需要进一步改进。

🎯 应用场景

该研究成果可应用于评估和提升Clickbait检测系统的鲁棒性,帮助社交媒体平台更好地识别和过滤恶意Clickbait,从而改善用户体验。此外,该研究也为理解情感在信息传播中的作用提供了新的视角,有助于开发更有效的信息过滤和推荐系统。

📄 摘要(原文)

Clickbait is characterized by disproportionately high emotional intensity relative to informational content, often reinforced by specific structural patterns. However, current research considers clickbait as a static textual phenomenon characterized by linguistic patterns and structural cues. Additionally, existing detection systems primarily rely on surface-level features of clickbait. This paper introduces an emotion-aware clickbait generation attack, where stylistic transformations are used to optimize emotional impact. We propose an emotion-aware framework based on the Valence-Arousal-Dominance (VAD) space to model the emotional dynamics underlying clickbait generation for optimal user engagement. To simulate realistic attack scenarios, we align clickbait headlines with semantically similar social media posts using Sentence-BERT and generate multiple stylistic rewrites via Large Language Models (LLMs). Building on this, we define a Curiosity Gap (CG) function that computes clickbait's headline variation to the current post to quantify how emotional activation will contribute to user curiosity and evade the existing system found on social media. Experimental results demonstrate that emotion-aware stylization significantly degrades the performance of state-of-the-art classifiers, leading to misclassification rates of up to 2.58% to 30.63% on the base system.