Turn-Level Empathy Prediction Using Psychological Indicators

📄 arXiv: 2407.08607v1 📥 PDF

作者: Shaz Furniturewala, Kokil Jaidka

分类: cs.CL

发布日期: 2024-07-11


💡 一句话要点

提出基于心理指标分解的turn-level共情预测方法,提升共情检测性能。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 共情预测 心理指标 大型语言模型 DeBERTA 文本增强

📋 核心要点

  1. 现有共情检测方法缺乏对共情内在心理机制的深入建模,导致性能提升受限。
  2. 将共情分解为情感语言等六个心理指标,利用LLM进行文本增强,再微调DeBERTA模型。
  3. 实验表明,该方法在共情检测任务上显著提升了皮尔逊相关系数和F1分数。

📝 摘要(中文)

本文针对WASSA 2024共情与人格预测共享任务,提出了一种新颖的turn-level共情检测方法。该方法将共情分解为六个心理指标:情感语言、视角采择、同情与怜悯、外向性、开放性和宜人性。通过使用大型语言模型(LLM)进行文本增强,然后对DeBERTA模型进行微调,在共情检测的皮尔逊相关系数和F1分数上均取得了显著提升,突显了该方法的有效性。该系统在CONV-turn赛道中排名第七。

🔬 方法详解

问题定义:论文旨在解决对话turn级别的共情预测问题。现有方法通常直接预测共情得分,忽略了共情的复杂心理构成,导致模型难以捕捉细微的情感变化和深层次的理解。因此,如何更有效地建模共情成为一个挑战。

核心思路:论文的核心思路是将共情分解为多个可解释的心理指标,包括情感语言、视角采择、同情与怜悯、外向性、开放性和宜人性。通过预测这些指标,模型可以更好地理解共情的各个方面,从而提高预测准确性。这种分解的思路借鉴了心理学研究中对共情的认知和情感成分的分析。

技术框架:整体框架包含两个主要阶段:1) 文本增强阶段:使用大型语言模型(LLM)对输入文本进行增强,生成更丰富的上下文信息。2) 模型微调阶段:使用增强后的文本对DeBERTA模型进行微调,使其能够预测共情以及分解后的六个心理指标。最终的共情预测结果基于DeBERTA模型的输出。

关键创新:该方法最重要的创新点在于将共情分解为多个心理指标,并利用这些指标来指导模型的学习。这种分解不仅提高了预测准确性,还使得模型具有更好的可解释性。与直接预测共情得分的方法相比,该方法能够更全面地理解共情的各个方面。

关键设计:在文本增强阶段,使用了具体的LLM模型(论文中未明确指出具体模型,未知)。在模型微调阶段,使用了DeBERTA模型,并针对共情预测和心理指标预测设计了相应的损失函数。具体的参数设置和网络结构细节在论文中没有详细描述,属于未知信息。

📊 实验亮点

该方法在WASSA 2024共情与人格预测共享任务的CONV-turn赛道中排名第七,证明了其有效性。通过LLM文本增强和DeBERTA微调,该方法在共情检测的皮尔逊相关系数和F1分数上均取得了显著提升。具体的性能数据和对比基线在论文中没有详细给出,属于未知信息。

🎯 应用场景

该研究成果可应用于智能对话系统、心理健康咨询、社交机器人等领域。通过准确预测对话中的共情程度,可以提升人机交互的自然性和有效性,帮助构建更具同理心和理解能力的AI系统。未来,该方法还可用于分析社交媒体文本,识别潜在的情感问题,并提供个性化的支持和干预。

📄 摘要(原文)

For the WASSA 2024 Empathy and Personality Prediction Shared Task, we propose a novel turn-level empathy detection method that decomposes empathy into six psychological indicators: Emotional Language, Perspective-Taking, Sympathy and Compassion, Extroversion, Openness, and Agreeableness. A pipeline of text enrichment using a Large Language Model (LLM) followed by DeBERTA fine-tuning demonstrates a significant improvement in the Pearson Correlation Coefficient and F1 scores for empathy detection, highlighting the effectiveness of our approach. Our system officially ranked 7th at the CONV-turn track.