FigSIM: A Dataset for Fine-grained Suicide Severity and Figurative Language in Suicide Memes
作者: Liuliu Chen, Elise R. Carrotte, Brian E. Chapman, Jo Robinson, Mike Conway
分类: cs.CL, cs.CV, cs.CY
发布日期: 2026-06-01
备注: Content warning: contains suicide-related content. Accepted to Findings of the Association for Computational Linguistics: ACL 2026
💡 一句话要点
FigSIM:用于细粒度自杀倾向和隐喻表达的自杀梗数据集
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 自杀梗 数据集 细粒度分析 隐喻识别 内容审核
📋 核心要点
- 社交媒体上自杀梗日益增多,但缺乏有效的内容审核方法,主要原因是缺乏带标注的自杀梗数据集。
- 论文构建了FigSIM数据集,包含细粒度的自杀倾向等级、隐喻现象和自杀相关内容标注,用于自杀梗的细粒度分析。
- 实验表明,自杀梗对模型提出了独特的挑战,尤其是在隐喻表达和高自杀倾向等级的识别方面存在偏差。
📝 摘要(中文)
自杀梗是在社交媒体上表达与自杀相关的想法或评论相关问题的表情包。它们日益普遍,但人们对其理解仍然不足,并且可能有害。迫切需要更好地理解它们的特征,并制定适当的内容审核策略,以限制用户接触潜在有害内容。目前,缺乏带标注的自杀梗数据集仍然是开发和评估自动审核方法的关键障碍。本文介绍了FigSIM,这是第一个为细粒度分析自杀梗而设计的数据集。该数据集包含1049个梗,每个梗都标注了(1)细粒度的自杀倾向等级,(2)隐喻现象(例如,隐喻),以及(3)与自杀相关的内容(例如,自杀方法描述)。我们对16个单模态和多模态模型在三个任务上进行了基准测试:隐喻语言、自杀倾向和自杀相关内容检测。总体而言,FigSIM表明自杀梗对建模和内容审核都提出了独特的挑战。分析揭示了偏差,例如对较高自杀倾向等级的低估,特别是对于隐喻梗。该数据集(包括用于分析的分割)是公开可用的。内容警告:本文包含可能引发不适的自杀相关内容。
🔬 方法详解
问题定义:论文旨在解决自杀梗内容审核中缺乏高质量标注数据集的问题。现有方法难以准确识别自杀梗中的自杀倾向等级、隐喻表达以及自杀相关内容,导致内容审核效果不佳,无法有效限制用户接触潜在有害内容。
核心思路:论文的核心思路是构建一个包含丰富标注信息的自杀梗数据集,从而为开发和评估自动审核方法提供基础。通过细粒度的标注,模型可以更好地理解自杀梗的语义信息,从而提高识别准确率。
技术框架:FigSIM数据集的构建流程主要包括数据收集、人工标注和数据分析三个阶段。首先,从社交媒体平台收集大量的自杀梗图像和文本数据。然后,由专业的标注人员对每个梗进行标注,包括自杀倾向等级、隐喻现象和自杀相关内容。最后,对标注数据进行统计分析,揭示自杀梗的特征和规律。
关键创新:FigSIM数据集是第一个专门为细粒度分析自杀梗而设计的数据集。它不仅提供了自杀倾向等级的标注,还标注了隐喻现象和自杀相关内容,从而为研究人员提供了更全面的信息。此外,论文还对16个单模态和多模态模型进行了基准测试,为后续研究提供了参考。
关键设计:数据集包含1049个梗,每个梗都标注了三个维度的信息:细粒度的自杀倾向等级(例如,低、中、高)、隐喻现象(例如,隐喻、讽刺)以及与自杀相关的内容(例如,自杀方法描述、自杀地点)。标注人员接受过专业的培训,以确保标注的准确性和一致性。论文还公开了数据集的分割方式,方便研究人员进行比较。
🖼️ 关键图片
📊 实验亮点
论文构建的FigSIM数据集包含1049个自杀梗,并进行了细粒度的标注,包括自杀倾向等级、隐喻现象和自杀相关内容。实验结果表明,现有模型在处理自杀梗时存在偏差,尤其是在识别隐喻表达和高自杀倾向等级方面表现不佳。该数据集和基准测试结果为后续研究提供了重要的参考。
🎯 应用场景
该研究成果可应用于社交媒体平台的内容审核系统,帮助自动识别和过滤潜在有害的自杀梗,从而减少用户接触自杀相关信息的风险。此外,该数据集还可以用于研究自杀梗的传播规律和影响因素,为制定更有效的自杀预防策略提供依据。未来,可以进一步扩展数据集,并开发更先进的自杀梗识别模型。
📄 摘要(原文)
Suicide memes are memes used to express suicide-related thoughts or comment on suicide-related issues. Suicide memes are increasingly common on social media, yet remain poorly understood and potentially harmful. There is an urgent need to better understand their characteristics and to develop appropriate content moderation strategies that limits users' exposure to potentially harmful content. Currently, the absence of annotated datasets of suicide memes remains a key barrier to developing and evaluating automated moderation approaches. In this paper, we introduce FigSIM, the first dataset designed for fine-grained analysis of suicide memes. The dataset consists of 1049 memes, each annotated for (1) fine-grained suicide severity levels, (2) figurative phenomena (e.g., metaphors), and (3) suicide-related content (e.g., suicide method depiction). We benchmark 16 unimodal and multimodal models across three tasks: figurative language, suicide severity, and suicide-related content detection. Overall, FigSIM demonstrates that suicide memes pose unique challenges for both modeling and content moderation. Analysis revealed biases, such as underprediction of higher suicide severity levels, especially for figurative memes. The dataset (including splits used for analyses) is publicly available. Content Warning: This paper contains suicide-related content that may be triggering.