CARE: Counselor-Aligned Response Engine for Online Mental-Health Support

作者: Hagai Astrin, Ayal Swaid, Avi Segal, Kobi Gal

分类: cs.CL

发布日期: 2026-04-23

备注: 9 pages, 4 figures

💡 一句话要点

CARE：针对在线心理健康支持的咨询师对齐回复引擎

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 心理健康支持 大型语言模型 低资源语言 领域微调 危机对话 咨询师对齐 人机协作

📋 核心要点

现有基于LLM的心理健康支持系统，缺乏在低资源语言和真实世界数据上的训练，难以模仿专业咨询师的干预策略。
CARE通过在专家评估的高效危机对话数据上，对开源LLM进行微调，生成与咨询师策略对齐的回复建议。
实验表明，CARE在语义和策略上更接近专业咨询师的回复，证明了领域微调在低资源语言环境下的有效性。

📝 摘要（中文）

全球范围内，心理健康问题日益严峻，给情感支持服务带来巨大压力，导致咨询师工作过载。这可能导致在危机情况下（如自杀意念）的响应延迟，而及时的干预至关重要。虽然大型语言模型（LLM）已展现出强大的生成能力，但它们在低资源语言中的应用，尤其是在心理健康等敏感领域，仍未得到充分探索。此外，由于缺乏对大规模真实世界数据集的训练，现有的基于LLM的智能体通常难以复制专业人员使用的支持性语言和干预策略。为了解决这个问题，我们提出了CARE（Counselor-Aligned Response Engine），这是一个GenAI框架，通过生成实时的、心理学对齐的回复建议来辅助咨询师。CARE使用真实危机对话的精选子集，针对希伯来语和阿拉伯语分别对开源LLM进行微调。训练数据包括被专业咨询师评为高效的会话，使模型能够捕捉与成功降级相关的互动模式。通过对完整的对话历史进行训练，CARE可以保持咨询师-求助者对话不断发展的情感背景和动态结构。在实验环境中，与非专业LLM相比，CARE在语义和策略上与黄金标准的咨询师回复表现出更强的对齐性。这些发现表明，在专家验证的数据上进行特定领域的微调可以显著支持咨询师的工作流程，并提高低资源语言环境下的护理质量。

🔬 方法详解

问题定义：论文旨在解决在线心理健康支持领域中，现有大型语言模型（LLM）难以在低资源语言环境下生成与专业咨询师策略对齐的回复的问题。现有方法缺乏在真实世界危机对话数据上的训练，无法有效捕捉咨询师的干预技巧和语言风格，导致生成的回应不够专业和有效。

核心思路：论文的核心思路是利用专家评估的高质量危机对话数据，对开源LLM进行特定领域的微调，从而使模型能够学习并模仿专业咨询师的回复策略和语言风格。通过这种方式，模型可以更好地理解对话的上下文，并生成更具针对性和有效性的回复建议。

技术框架：CARE框架包含以下主要步骤：1) 数据收集与筛选：收集真实世界的危机对话数据，并由专业咨询师进行评估，筛选出被认为高效的对话。2) 模型选择与微调：选择合适的开源LLM，并使用筛选后的高质量数据进行微调，针对希伯来语和阿拉伯语分别训练模型。3) 回复生成与评估：使用微调后的模型生成回复建议，并通过实验评估其与黄金标准咨询师回复的对齐程度。

关键创新：该论文的关键创新在于：1) 专注于低资源语言（希伯来语和阿拉伯语）的心理健康支持；2) 使用专家评估的高质量数据进行模型微调，确保模型学习到有效的咨询策略；3) 通过对完整对话历史进行训练，使模型能够更好地理解对话的上下文和情感动态。

关键设计：论文的关键设计包括：1) 数据筛选标准：选择被专业咨询师评为高效的对话作为训练数据，确保数据的质量和相关性；2) 模型微调策略：针对希伯来语和阿拉伯语分别进行模型微调，以适应不同语言的特点；3) 评估指标：使用语义和策略对齐度等指标，评估生成回复与黄金标准咨询师回复的相似程度。

🖼️ 关键图片

📊 实验亮点

实验结果表明，CARE在语义和策略上与黄金标准的咨询师回复表现出更强的对齐性，优于非专业LLM。这表明，通过在专家验证的数据上进行特定领域的微调，可以显著提高LLM在心理健康支持领域的应用效果。具体的性能数据和提升幅度在论文中进行了详细的展示，证明了CARE框架的有效性。

🎯 应用场景

CARE框架可应用于在线心理健康支持平台，为咨询师提供实时的回复建议，减轻其工作负担，并提高服务质量。尤其是在资源有限的地区或语言环境中，该框架可以帮助更多的人获得及时的心理健康支持。未来，该研究可以扩展到其他语言和心理健康领域，并与其他技术（如语音识别和情感分析）相结合，提供更个性化和全面的支持。

📄 摘要（原文）

Mental health challenges are increasing worldwide, straining emotional support services and leading to counselor overload. This can result in delayed responses during critical situations, such as suicidal ideation, where timely intervention is essential. While large language models (LLMs) have shown strong generative capabilities, their application in low-resource languages, especially in sensitive domains like mental health, remains underexplored. Furthermore, existing LLM-based agents often struggle to replicate the supportive language and intervention strategies used by professionals due to a lack of training on large-scale, real-world datasets. To address this, we propose CARE (Counselor-Aligned Response Engine), a GenAI framework that assists counselors by generating real-time, psychologically aligned response recommendations. CARE fine-tunes open-source LLMs separately for Hebrew and Arabic using curated subsets of real-world crisis conversations. The training data consists of sessions rated as highly effective by professional counselors, enabling the models to capture interaction patterns associated with successful de-escalation. By training on complete conversation histories, CARE maintains the evolving emotional context and dynamic structure of counselor-help-seeker dialogue. In experimental settings, CARE demonstrates stronger semantic and strategic alignment with gold-standard counselor responses compared to non-specialized LLMs. These findings suggest that domain-specific fine-tuning on expert-validated data can significantly support counselor workflows and improve care quality in low-resource language contexts.

CARE: Counselor-Aligned Response Engine for Online Mental-Health Support

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理