Conceptualizing Suicidal Behavior: Utilizing Explanations of Predicted Outcomes to Analyze Longitudinal Social Media Data

📄 arXiv: 2312.08299v2 📥 PDF

作者: Van Minh Nguyen, Nasheen Nur, William Stern, Thomas Mercer, Chiradeep Sen, Siddhartha Bhattacharyya, Victor Tumbiolo, Seng Jhing Goh

分类: cs.CL, cs.CY, cs.SI

发布日期: 2023-12-13 (更新: 2023-12-30)

备注: Presented at ICMLA 2023, Special Session: Machine Learning in Health, 8 pages, 6 figures, 7 tables

DOI: 10.1109/ICMLA58977.2023.00316


💡 一句话要点

利用预测结果解释分析纵向社交媒体数据,概念化自杀行为

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 自杀意念检测 社交媒体分析 模型解释性 Layer Integrated Gradients 自然语言处理

📋 核心要点

  1. 现有方法缺乏对社交媒体数据中自杀意念的解释性分析,难以有效利用纵向数据。
  2. 该研究提出一种基于Layer Integrated Gradients的模型解释方法,用于分析Reddit帖子中token对自杀意念预测的贡献。
  3. 通过分析token归因,该方法旨在初步筛选社交媒体帖子中的自杀意念,无需在推理阶段使用大型语言模型。

📝 摘要(中文)

新冠疫情加剧了全球范围内的精神健康危机,社会隔离和经济不稳定导致自杀行为增加。自杀可能源于社会因素,如羞耻感、虐待、遗弃,以及抑郁症、创伤后应激障碍(PTSD)、注意力缺陷多动障碍(ADHD)、焦虑症和双相情感障碍等精神健康状况。这些状况的发展可能在社交媒体互动中表现出自杀意念的迹象。利用人工智能(AI)技术分析社交媒体数据有助于识别自杀行为模式,为自杀预防机构、专业人士和更广泛的社区意识倡议提供宝贵的见解。为此目的的机器学习算法需要大量准确标记的数据。以往的研究尚未充分探索在分析和标记纵向社交媒体数据中整合解释的潜力。本研究采用模型解释方法,即Layer Integrated Gradients,结合微调后的最先进语言模型,为Reddit用户帖子中的每个token分配一个用于预测自杀意念的归因分数。通过提取和分析数据中token的归因,我们提出了一种在推理过程中无需使用大型语言模型即可初步筛选社交媒体帖子以查找自杀意念的方法。

🔬 方法详解

问题定义:该论文旨在解决如何更有效地利用社交媒体数据识别潜在的自杀行为。现有方法通常依赖于大型语言模型进行预测,但缺乏可解释性,难以理解模型做出判断的原因,并且在推理阶段计算成本高昂。此外,现有研究未能充分利用纵向社交媒体数据,忽略了用户行为随时间变化的模式。

核心思路:该论文的核心思路是利用模型解释方法(Layer Integrated Gradients)来分析社交媒体帖子中各个token对自杀意念预测的贡献。通过识别对预测结果影响最大的token,可以更好地理解模型判断的原因,并为人工审核提供依据。此外,通过分析token归因,可以构建一个更轻量级的筛选模型,从而降低推理成本。

技术框架:该研究的技术框架主要包括以下几个步骤:1) 使用Reddit的社交媒体数据,这些数据包含用户帖子和评论。2) 使用微调后的先进语言模型(具体模型未知)对帖子进行自杀意念预测。3) 使用Layer Integrated Gradients方法计算每个token对预测结果的归因分数。4) 分析token归因,识别与自杀意念相关的关键词和短语。5) 基于token归因构建初步筛选模型,用于快速识别潜在的自杀意念帖子。

关键创新:该论文的关键创新在于将模型解释方法应用于自杀意念检测任务,并利用token归因来构建更轻量级的筛选模型。与现有方法相比,该方法具有更高的可解释性和更低的推理成本。此外,该研究还探索了利用纵向社交媒体数据进行自杀意念检测的可能性。

关键设计:关于语言模型的选择、微调策略、Layer Integrated Gradients的具体实现细节以及筛选模型的构建方法,论文摘要中没有提供详细信息。Layer Integrated Gradients是一种事后解释方法,用于计算输入特征(在本例中为token)对模型预测结果的贡献。具体实现细节(如积分路径的选择、积分步数等)未知。筛选模型的具体结构和训练方法也未知。

📊 实验亮点

摘要中没有提供具体的实验结果和性能数据。研究重点在于提出了一种新的方法,即利用Layer Integrated Gradients进行token归因分析,并基于此构建初步筛选模型。具体的性能提升和对比基线未知,需要在论文正文中查找。

🎯 应用场景

该研究成果可应用于自杀预防领域,帮助相关机构和专业人士更有效地识别和干预潜在的自杀行为。通过分析社交媒体数据,可以及时发现高风险人群,并提供必要的支持和帮助。此外,该研究还可以提高公众对自杀问题的认识,促进社区层面的预防工作。未来,该方法可以扩展到其他类型的社交媒体平台和语言,从而更广泛地应用于全球范围内的自杀预防工作。

📄 摘要(原文)

The COVID-19 pandemic has escalated mental health crises worldwide, with social isolation and economic instability contributing to a rise in suicidal behavior. Suicide can result from social factors such as shame, abuse, abandonment, and mental health conditions like depression, Post-Traumatic Stress Disorder (PTSD), Attention-Deficit/Hyperactivity Disorder (ADHD), anxiety disorders, and bipolar disorders. As these conditions develop, signs of suicidal ideation may manifest in social media interactions. Analyzing social media data using artificial intelligence (AI) techniques can help identify patterns of suicidal behavior, providing invaluable insights for suicide prevention agencies, professionals, and broader community awareness initiatives. Machine learning algorithms for this purpose require large volumes of accurately labeled data. Previous research has not fully explored the potential of incorporating explanations in analyzing and labeling longitudinal social media data. In this study, we employed a model explanation method, Layer Integrated Gradients, on top of a fine-tuned state-of-the-art language model, to assign each token from Reddit users' posts an attribution score for predicting suicidal ideation. By extracting and analyzing attributions of tokens from the data, we propose a methodology for preliminary screening of social media posts for suicidal ideation without using large language models during inference.