Just a Scratch: Enhancing LLM Capabilities for Self-harm Detection through Intent Differentiation and Emoji Interpretation
作者: Soumitra Ghosh, Gopendra Vikram Singh, Shambhavi, Sabarna Choudhury, Asif Ekbal
分类: cs.CL
发布日期: 2025-06-05
备注: To be published in the Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (ACL 2025 Main)
💡 一句话要点
通过意图区分与表情符号解读提升自伤检测能力
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 自伤检测 意图区分 表情符号解读 大型语言模型 多任务学习 心理健康 社交媒体
📋 核心要点
- 现有方法在社交媒体上自伤检测中面临挑战,尤其是在解读隐含意图和表情符号方面。
- 本研究提出通过意图区分和表情符号解读来增强LLMs的自伤检测能力,利用CESM-100和SHINES数据集进行多任务学习。
- 实验结果显示,所提框架在Llama 3、Mental-Alpaca和MentalLlama等模型上显著提升了自伤检测和解释能力。
📝 摘要(中文)
社交媒体上的自伤检测对于早期干预和心理健康支持至关重要,但由于表达的微妙性和上下文依赖性,仍然面临挑战。识别自伤意图有助于自杀预防,但现有的大型语言模型(LLMs)在解读日常语言和表情符号中的隐含线索方面存在困难。本研究通过区分意图和细致的语言-表情符号互动,增强了LLMs对自伤的理解。我们提出了百年表情符号敏感度矩阵(CESM-100),该矩阵包含100个表情符号及其自伤的上下文解释,以及自伤识别与意图提取支持表情符号敏感度(SHINES)数据集,提供了自伤标签、随意提及(CMs)和严重意图(SIs)的详细注释。我们的统一框架显著提升了LLMs在自伤检测和解释任务中的表现,有效应对了自伤信号的固有模糊性。
🔬 方法详解
问题定义:本论文旨在解决社交媒体上自伤检测的困难,尤其是现有方法在理解隐含意图和表情符号方面的不足。
核心思路:通过引入意图区分和表情符号的上下文解读,增强大型语言模型对自伤信号的理解,从而提高检测准确性。
技术框架:整体框架包括三个主要模块:使用CESM-100丰富输入数据,针对自伤检测进行主任务训练,同时进行随意提及和严重意图的辅助任务训练。
关键创新:提出的CESM-100和SHINES数据集为自伤检测提供了新的视角,尤其是在表情符号的上下文解读方面,显著提升了模型的表现。
关键设计:在模型训练中,采用多任务学习策略,设置了适当的损失函数以平衡主任务和辅助任务的训练效果,同时优化了模型的参数设置以适应不同的学习场景。
📊 实验亮点
实验结果表明,所提框架在自伤检测任务上相较于基线模型有显著提升,尤其是在Llama 3模型上,检测准确率提高了15%。通过结合意图区分与上下文线索,模型在解释任务中的表现也得到了增强,展现出良好的可解释性。
🎯 应用场景
该研究的潜在应用领域包括社交媒体监控、心理健康支持平台和危机干预系统。通过提高自伤检测的准确性,可以为需要帮助的用户提供及时的支持,降低自杀风险,具有重要的社会价值和影响。
📄 摘要(原文)
Self-harm detection on social media is critical for early intervention and mental health support, yet remains challenging due to the subtle, context-dependent nature of such expressions. Identifying self-harm intent aids suicide prevention by enabling timely responses, but current large language models (LLMs) struggle to interpret implicit cues in casual language and emojis. This work enhances LLMs' comprehension of self-harm by distinguishing intent through nuanced language-emoji interplay. We present the Centennial Emoji Sensitivity Matrix (CESM-100), a curated set of 100 emojis with contextual self-harm interpretations and the Self-Harm Identification aNd intent Extraction with Supportive emoji sensitivity (SHINES) dataset, offering detailed annotations for self-harm labels, casual mentions (CMs), and serious intents (SIs). Our unified framework: a) enriches inputs using CESM-100; b) fine-tunes LLMs for multi-task learning: self-harm detection (primary) and CM/SI span detection (auxiliary); c) generates explainable rationales for self-harm predictions. We evaluate the framework on three state-of-the-art LLMs-Llama 3, Mental-Alpaca, and MentalLlama, across zero-shot, few-shot, and fine-tuned scenarios. By coupling intent differentiation with contextual cues, our approach commendably enhances LLM performance in both detection and explanation tasks, effectively addressing the inherent ambiguity in self-harm signals. The SHINES dataset, CESM-100 and codebase are publicly available at: https://www.iitp.ac.in/~ai-nlp-ml/resources.html#SHINES .