DiaCBT: A Long-Periodic Dialogue Corpus Guided by Cognitive Conceptualization Diagram for CBT-based Psychological Counseling
作者: Yougen Zhou, Ningning Zhou, Qin Chen, Jie Zhou, Aimin Zhou, Liang He
分类: cs.CL
发布日期: 2025-09-03
💡 一句话要点
DiaCBT:构建认知概念化图引导的CBT心理咨询长周期对话语料库
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 心理咨询 认知行为疗法 对话语料库 认知概念化图 大型语言模型
📋 核心要点
- 现有心理治疗因社会偏见和资源限制覆盖面窄,而缺乏专业心理咨询对话数据集阻碍了LLM在心理健康领域的应用。
- 论文提出DiaCBT,一个基于认知行为疗法(CBT)的长周期对话语料库,利用认知概念化图(CCDs)指导客户模拟。
- 实验结果表明,使用DiaCBT训练的模型能有效提升LLM模拟CBT专家能力,为训练更专业的咨询Agent奠定基础。
📝 摘要(中文)
由于社会偏见和治疗师资源的限制,心理治疗仅能覆盖一小部分精神障碍患者。大型语言模型(LLMs)若具备专业的心理治疗技能,有望扩展心理健康服务的可及性。然而,缺乏心理咨询对话数据集是开发有效的心理治疗引导对话Agent的主要挑战。本文构建了一个基于认知行为疗法(CBT)的咨询长周期对话语料库。我们精心策划的数据集包含每个咨询的多个会话,并结合认知概念化图(CCDs)来指导不同场景下的客户模拟。为了评估数据集的效用,我们训练了一个深度咨询模型,并提出了一个全面的评估框架,以根据CBT咨询的既定心理标准对其进行基准测试。结果表明,DiaCBT有效地增强了LLMs模拟具有CBT专业知识的心理学家的能力,突显了其在训练更专业的咨询Agent方面的潜力。
🔬 方法详解
问题定义:现有心理咨询对话数据集的匮乏是制约基于大型语言模型(LLM)构建有效心理治疗对话Agent的关键瓶颈。特别是,缺乏长周期、多轮对话,以及能够有效指导对话过程的结构化知识表示,使得LLM难以学习和模拟专业的心理咨询过程,例如认知行为疗法(CBT)。
核心思路:论文的核心思路是构建一个高质量的、长周期的CBT心理咨询对话语料库,并引入认知概念化图(CCDs)作为指导对话生成的结构化知识。通过CCDs,可以更好地模拟客户在不同情境下的认知、情感和行为模式,从而使LLM能够学习到更具专业性和针对性的咨询策略。
技术框架:DiaCBT的构建主要包含以下几个阶段:(1) 定义CBT咨询场景和目标;(2) 设计基于CCDs的客户模拟流程,包括识别核心信念、自动思维、情绪和行为等要素;(3) 收集和标注多轮对话数据,确保对话的连贯性和专业性;(4) 构建评估框架,用于评估模型在CBT咨询方面的表现。整体流程旨在创建一个能够反映真实CBT咨询过程,并能有效指导LLM学习的语料库。
关键创新:该论文的关键创新在于将认知概念化图(CCDs)引入到心理咨询对话语料库的构建中。CCDs提供了一种结构化的方式来表示客户的认知模式,从而能够更有效地指导对话的生成和评估。与以往的对话数据集相比,DiaCBT具有更强的专业性和针对性,能够更好地支持LLM学习CBT咨询的技巧。
关键设计:在CCDs的设计上,需要仔细考虑如何表示客户的核心信念、自动思维、情绪和行为之间的关系。在数据标注方面,需要专业的心理学知识,以确保标注的准确性和一致性。在模型训练方面,可以采用各种序列到序列的模型,并结合强化学习等技术,以提高模型的对话生成质量和咨询效果。具体的损失函数和网络结构的选择需要根据实际情况进行调整和优化。
📊 实验亮点
实验结果表明,使用DiaCBT训练的LLM在模拟CBT咨询方面表现出色,能够生成更具专业性和针对性的对话。通过与基线模型进行对比,DiaCBT显著提升了LLM在CBT咨询方面的性能,验证了该数据集的有效性和价值。具体的性能数据(例如,在特定评估指标上的提升幅度)需要在论文中查找。
🎯 应用场景
该研究成果可应用于开发智能心理咨询机器人,为无法获得传统心理咨询服务的人群提供支持。通过与智能咨询机器人进行对话,用户可以获得专业的心理评估、情绪疏导和认知行为矫正指导。此外,该语料库也可用于训练心理咨询师,提高其专业技能和服务水平,具有重要的社会价值和应用前景。
📄 摘要(原文)
Psychotherapy reaches only a small fraction of individuals suffering from mental disorders due to social stigma and the limited availability of therapists. Large language models (LLMs), when equipped with professional psychotherapeutic skills, offer a promising solution to expand access to mental health services. However, the lack of psychological conversation datasets presents significant challenges in developing effective psychotherapy-guided conversational agents. In this paper, we construct a long-periodic dialogue corpus for counseling based on cognitive behavioral therapy (CBT). Our curated dataset includes multiple sessions for each counseling and incorporates cognitive conceptualization diagrams (CCDs) to guide client simulation across diverse scenarios. To evaluate the utility of our dataset, we train an in-depth counseling model and present a comprehensive evaluation framework to benchmark it against established psychological criteria for CBT-based counseling. Results demonstrate that DiaCBT effectively enhances LLMs' ability to emulate psychologists with CBT expertise, underscoring its potential for training more professional counseling agents.