Toward Real-World Chinese Psychological Support Dialogues: CPsDD Dataset and a Co-Evolving Multi-Agent System
作者: Yuanchen Shi, Longyin Zhang, Fang Kong
分类: cs.CL, cs.AI, cs.MA
发布日期: 2025-07-10
备注: 10pages,8 figures
💡 一句话要点
提出CPsDD数据集与协同演化多智能体系统,用于真实中文心理支持对话
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 心理支持对话 中文数据集 大型语言模型 对话生成 情感计算
📋 核心要点
- 现有心理支持对话数据集稀缺,尤其缺乏高质量的中文数据集,限制了相关研究发展。
- 利用有限的真实数据和专家知识,通过生成器和修改器协同工作,构建大规模高质量的心理支持对话。
- 提出的CADSS系统在CPsDD和ESConv数据集上,策略预测和情感支持对话任务中均取得SOTA性能。
📝 摘要(中文)
由于压力增大,对心理支持的需求日益增长,这暴露了相关数据集的稀缺性,尤其是在非英语语言中。为了解决这个问题,我们提出了一个框架,该框架利用有限的真实世界数据和专家知识来微调两个大型语言模型:对话生成器和对话修改器。生成器基于预定义的路径创建大规模的心理咨询对话,这些路径指导系统响应策略和用户交互,从而为有效的支持奠定基础。修改器改进这些对话,使其与真实世界的数据质量保持一致。通过自动化和人工审查,我们构建了中文心理支持对话数据集(CPsDD),其中包含13个组、16个心理问题、13个原因和12个支持重点的68K个对话。此外,我们还引入了综合智能体对话支持系统(CADSS),其中分析器分析用户特征,摘要器凝练对话历史,规划器选择策略,支持者生成共情响应。策略预测和情感支持对话(ESC)任务的实验结果表明,CADSS在CPsDD和ESConv数据集上均实现了最先进的性能。
🔬 方法详解
问题定义:论文旨在解决中文心理支持对话数据集匮乏的问题。现有方法依赖于通用对话模型或少量人工标注数据,难以生成高质量、符合心理咨询原则的对话,缺乏对用户心理状态的精准理解和个性化支持策略。
核心思路:论文的核心思路是利用大型语言模型(LLM)的生成能力,结合专家知识和真实数据,构建一个能够生成高质量心理支持对话的数据集,并在此基础上开发一个能够提供个性化心理支持的对话系统。通过生成器和修改器协同工作,提升数据的真实性和质量。
技术框架:论文提出了一个包含数据生成和对话系统两部分的框架。数据生成部分包括:1) 对话生成器,基于预定义的对话路径生成大规模对话;2) 对话修改器,利用真实数据对生成对话进行润色和修改。对话系统部分,即CADSS,包含:1) Profiler,分析用户特征;2) Summarizer,总结对话历史;3) Planner,选择支持策略;4) Supporter,生成共情回复。
关键创新:论文的关键创新在于:1) 提出了一个基于LLM和专家知识协同的数据生成框架,能够高效地构建大规模高质量的心理支持对话数据集;2) 设计了一个综合智能体对话支持系统(CADSS),能够根据用户特征、对话历史和预定义的策略,生成个性化的心理支持回复。
关键设计:在数据生成阶段,论文设计了预定义的对话路径,指导生成器生成符合心理咨询原则的对话。在CADSS系统中,Profiler可能使用了用户画像技术,Summarizer可能使用了文本摘要模型,Planner可能使用了强化学习或规则引擎,Supporter可能使用了条件生成模型。具体的参数设置、损失函数和网络结构等细节在论文中可能没有详细描述,属于未知信息。
🖼️ 关键图片
📊 实验亮点
实验结果表明,提出的CADSS系统在CPsDD和ESConv数据集上,策略预测和情感支持对话(ESC)任务中均取得了最先进的性能。具体提升幅度未知,但表明该系统在理解用户情感和生成有效支持性回复方面具有显著优势。
🎯 应用场景
该研究成果可应用于在线心理咨询平台、智能客服系统、心理健康教育等领域。通过提供高质量的心理支持对话数据和智能对话系统,能够有效缓解心理压力,提升心理健康水平,并为心理咨询师提供辅助工具。
📄 摘要(原文)
The growing need for psychological support due to increasing pressures has exposed the scarcity of relevant datasets, particularly in non-English languages. To address this, we propose a framework that leverages limited real-world data and expert knowledge to fine-tune two large language models: Dialog Generator and Dialog Modifier. The Generator creates large-scale psychological counseling dialogues based on predefined paths, which guide system response strategies and user interactions, forming the basis for effective support. The Modifier refines these dialogues to align with real-world data quality. Through both automated and manual review, we construct the Chinese Psychological support Dialogue Dataset (CPsDD), containing 68K dialogues across 13 groups, 16 psychological problems, 13 causes, and 12 support focuses. Additionally, we introduce the Comprehensive Agent Dialogue Support System (CADSS), where a Profiler analyzes user characteristics, a Summarizer condenses dialogue history, a Planner selects strategies, and a Supporter generates empathetic responses. The experimental results of the Strategy Prediction and Emotional Support Conversation (ESC) tasks demonstrate that CADSS achieves state-of-the-art performance on both CPsDD and ESConv datasets.