PsyDraw: A Multi-Agent Multimodal System for Mental Health Screening in Left-Behind Children
作者: Yiqun Zhang, Xiaocui Yang, Xiaobai Li, Siyuan Yu, Yi Luan, Shi Feng, Daling Wang, Yifei Zhang
分类: cs.CL
发布日期: 2024-12-19
备注: preprint
💡 一句话要点
PsyDraw:一种多智能体多模态系统,用于留守儿童的心理健康筛查。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 留守儿童 心理健康筛查 房树人测试 多模态大语言模型 多智能体系统
📋 核心要点
- 留守儿童心理健康问题突出,但农村地区心理健康专业人员短缺,专家解读的房树人测试难以有效应用。
- PsyDraw利用多模态大语言模型构建多智能体系统,辅助分析房树人绘画,实现心理健康初步筛查。
- 实验表明,PsyDraw分析结果与专业评估高度一致,能有效识别需要专业关注的案例,具有实际应用价值。
📝 摘要(中文)
中国有超过6600万的留守儿童(LBCs),他们因父母外出务工而面临严重的心理健康挑战。对高危留守儿童进行早期筛查和识别至关重要,但由于心理健康专业人员严重短缺,尤其是在农村地区,这极具挑战性。房树人(HTP)测试显示儿童参与率较高,但其对专家解读的要求限制了其在资源匮乏地区的应用。为了应对这一挑战,我们提出PsyDraw,一个基于多模态大型语言模型的多智能体系统,旨在协助心理健康专业人员分析HTP绘画。该系统采用专门的智能体进行特征提取和心理学解释,分两个阶段运行:综合特征分析和专业报告生成。对290名小学生的HTP绘画评估显示,71.03%的分析结果与专业评估达到高度一致,26.21%为中度一致,仅2.41%为低度一致。该系统识别出31.03%的需要专业关注的案例,证明了其作为初步筛查工具的有效性。目前已在试点学校部署,PsyDraw有望在资源有限的地区支持心理健康专业人员,同时保持心理评估的高专业标准。
🔬 方法详解
问题定义:论文旨在解决留守儿童心理健康筛查中,专业人员短缺和传统房树人测试依赖专家解读的问题。现有方法难以在资源匮乏地区有效应用,导致高危儿童无法及时得到关注。
核心思路:利用多模态大型语言模型(MLLM)构建多智能体系统,模拟心理健康专家的分析过程。通过特征提取和心理学解释两个阶段,自动分析房树人绘画,降低对专业人员的依赖。
技术框架:PsyDraw系统包含两个主要阶段:1) 综合特征分析阶段:使用智能体提取房树人绘画的视觉特征,并结合儿童的背景信息。2) 专业报告生成阶段:利用另一智能体,基于提取的特征进行心理学解释,生成初步的筛查报告。整个系统通过多智能体协作,模拟专家分析流程。
关键创新:核心创新在于将多模态大语言模型应用于心理健康评估领域,并设计了多智能体协作框架。与传统方法相比,PsyDraw无需人工标注和专家解读,降低了使用门槛,提高了效率。
关键设计:具体的技术细节包括:针对房树人绘画特点设计的特征提取方法,例如颜色、线条、比例等;用于心理学解释的智能体的Prompt设计,使其能够模拟专家的思维方式;以及用于评估系统性能的一致性指标,例如与专家评估结果的相似度。
🖼️ 关键图片
📊 实验亮点
实验结果表明,PsyDraw系统对房树人绘画的分析结果与专业评估具有较高的一致性,71.03%的分析结果与专业评估达到高度一致,26.21%为中度一致,仅2.41%为低度一致。该系统能够识别出31.03%的需要专业关注的案例,证明了其作为初步筛查工具的有效性。
🎯 应用场景
PsyDraw可应用于资源匮乏地区的学校和社区,辅助心理健康专业人员进行留守儿童的心理健康筛查。该系统能够降低对专业人员的依赖,提高筛查效率,帮助及早发现需要关注的儿童,并为其提供相应的心理支持。未来,该系统还可扩展到其他心理评估场景,例如青少年心理健康筛查等。
📄 摘要(原文)
Left-behind children (LBCs), numbering over 66 million in China, face severe mental health challenges due to parental migration for work. Early screening and identification of at-risk LBCs is crucial, yet challenging due to the severe shortage of mental health professionals, especially in rural areas. While the House-Tree-Person (HTP) test shows higher child participation rates, its requirement for expert interpretation limits its application in resource-scarce regions. To address this challenge, we propose PsyDraw, a multi-agent system based on Multimodal Large Language Models that assists mental health professionals in analyzing HTP drawings. The system employs specialized agents for feature extraction and psychological interpretation, operating in two stages: comprehensive feature analysis and professional report generation. Evaluation of HTP drawings from 290 primary school students reveals that 71.03% of the analyzes achieved High Consistency with professional evaluations, 26.21% Moderate Consistency and only 2.41% Low Consistency. The system identified 31.03% of cases requiring professional attention, demonstrating its effectiveness as a preliminary screening tool. Currently deployed in pilot schools, \method shows promise in supporting mental health professionals, particularly in resource-limited areas, while maintaining high professional standards in psychological assessment.