DiaCBT: A Long-Periodic Dialogue Corpus Guided by Cognitive Conceptualization Diagram for CBT-based Psychological Counseling
作者: Yougen Zhou, Ningning Zhou, Qin Chen, Jie Zhou, Aimin Zhou, Liang He
分类: cs.CL
发布日期: 2025-09-03
💡 一句话要点
DiaCBT:构建认知概念化图引导的CBT心理咨询长周期对话语料库
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 心理咨询 认知行为疗法 对话语料库 大型语言模型 认知概念化图
📋 核心要点
- 心理咨询资源有限,LLM在心理健康领域有潜力,但缺乏高质量的心理咨询对话数据集。
- 构建DiaCBT语料库,利用认知概念化图(CCDs)指导客户模拟,模拟真实咨询场景。
- 训练咨询模型并进行评估,结果表明DiaCBT能有效提升LLM的CBT咨询能力。
📝 摘要(中文)
由于社会偏见和治疗师资源的限制,心理治疗仅能覆盖一小部分精神障碍患者。具备专业心理治疗技能的大型语言模型(LLMs)为扩大心理健康服务的可及性提供了一个有希望的解决方案。然而,缺乏心理咨询对话数据集对开发有效的、以心理治疗为指导的对话Agent提出了重大挑战。本文构建了一个基于认知行为疗法(CBT)的咨询长周期对话语料库。我们精心策划的数据集包括每次咨询的多个会话,并结合认知概念化图(CCDs)来指导跨不同场景的客户模拟。为了评估数据集的效用,我们训练了一个深入的咨询模型,并提出了一个全面的评估框架,以根据既定的CBT心理学标准对其进行基准测试。结果表明,DiaCBT有效地增强了LLMs模拟具有CBT专业知识的心理学家的能力,突显了其在训练更专业的咨询Agent方面的潜力。
🔬 方法详解
问题定义:现有心理咨询服务可及性低,大型语言模型有潜力提供帮助,但缺乏高质量的、基于认知行为疗法(CBT)的心理咨询对话数据集。现有方法难以模拟真实咨询场景,缺乏对咨询过程的有效指导。
核心思路:论文的核心思路是构建一个长周期的对话语料库DiaCBT,该语料库以认知概念化图(CCDs)为指导,模拟真实的CBT咨询过程。通过CCDs,可以更好地理解客户的认知模式,从而生成更贴近实际咨询场景的对话。
技术框架:DiaCBT的构建主要包含以下几个阶段:1) 定义咨询场景和客户画像;2) 构建认知概念化图(CCDs),用于描述客户的认知、情感和行为模式;3) 基于CCDs生成多轮对话,模拟咨询师和客户的互动;4) 对生成的数据进行人工审核和修正,确保数据的质量和一致性。
关键创新:该论文的关键创新在于将认知概念化图(CCDs)引入到心理咨询对话语料库的构建中。CCDs能够有效地捕捉客户的认知模式,从而指导对话的生成,使得生成的对话更具针对性和专业性。此外,该语料库是长周期的,包含多次咨询会话,更贴近真实的咨询过程。
关键设计:CCDs的设计是关键。具体来说,CCDs包含以下几个要素:核心信念、中间信念、自动思维、情感、行为和生理反应。这些要素之间的关系通过图结构进行表示。在对话生成过程中,模型会根据CCDs中的信息,生成针对性的问题和回应,引导客户进行思考和改变。
🖼️ 关键图片
📊 实验亮点
实验结果表明,使用DiaCBT训练的LLM在模拟CBT咨询师方面表现出色,能够生成更具针对性和专业性的对话。通过与基线模型进行对比,证明了DiaCBT的有效性。该研究还提出了一个全面的评估框架,用于评估LLM在CBT咨询方面的能力,为后续研究提供了参考。
🎯 应用场景
该研究成果可应用于开发智能心理咨询机器人,为用户提供个性化的心理健康服务。通过与用户进行对话,机器人可以识别用户的认知模式,并提供基于CBT的干预措施。此外,该语料库也可用于训练心理咨询师,提高其专业技能。未来,该研究有望促进心理健康服务的普及,降低心理疾病的患病率。
📄 摘要(原文)
Psychotherapy reaches only a small fraction of individuals suffering from mental disorders due to social stigma and the limited availability of therapists. Large language models (LLMs), when equipped with professional psychotherapeutic skills, offer a promising solution to expand access to mental health services. However, the lack of psychological conversation datasets presents significant challenges in developing effective psychotherapy-guided conversational agents. In this paper, we construct a long-periodic dialogue corpus for counseling based on cognitive behavioral therapy (CBT). Our curated dataset includes multiple sessions for each counseling and incorporates cognitive conceptualization diagrams (CCDs) to guide client simulation across diverse scenarios. To evaluate the utility of our dataset, we train an in-depth counseling model and present a comprehensive evaluation framework to benchmark it against established psychological criteria for CBT-based counseling. Results demonstrate that DiaCBT effectively enhances LLMs' ability to emulate psychologists with CBT expertise, underscoring its potential for training more professional counseling agents.