Automating PTSD Diagnostics in Clinical Interviews: Leveraging Large Language Models for Trauma Assessments

📄 arXiv: 2405.11178v1 📥 PDF

作者: Sichang Tu, Abigail Powers, Natalie Merrill, Negar Fani, Sierra Carter, Stephen Doogan, Jinho D. Choi

分类: cs.CL

发布日期: 2024-05-18

期刊: SIGDAIL(2024)

DOI: 10.18653/v1/2024.sigdial-1.55


💡 一句话要点

利用大型语言模型自动诊断临床访谈中的创伤后应激障碍

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 创伤后应激障碍 大型语言模型 自动化诊断 临床访谈 心理健康 GPT-4 Llama-2

📋 核心要点

  1. 心理健康临床人员短缺限制了诊断和服务的可及性,亟需自动化解决方案。
  2. 论文提出利用大型语言模型(LLM)分析临床访谈内容,辅助PTSD的诊断评估。
  3. 实验结果表明,GPT-4和Llama-2等LLM在PTSD诊断验证方面表现出强大的潜力。

📝 摘要(中文)

心理健康领域临床人员的短缺对正式诊断和服务获取造成了重大挑战。本文旨在通过将定制的大型语言模型(LLM)集成到工作流程中来应对这一短缺,从而促进普通人群心理健康的公平性。尽管LLM已展示出其在临床决策中的能力,但它们在创伤后应激障碍(PTSD)等严重疾病中的应用仍未得到充分探索。因此,我们收集了411份临床医生管理的诊断访谈,并设计了一种新颖的方法来获取高质量数据。此外,我们构建了一个全面的框架,通过利用两种最先进的LLM(GPT-4和Llama-2)基于访谈内容自动进行PTSD诊断评估,并具有更广泛的临床诊断潜力。我们的结果表明,LLM在我们的数据集上进行了测试,在辅助临床医生进行诊断验证方面具有强大的前景。据我们所知,这是第一个基于临床医生管理的访谈完全自动化精神疾病评估的AI系统。

🔬 方法详解

问题定义:论文旨在解决心理健康领域临床医生短缺的问题,特别是针对创伤后应激障碍(PTSD)的诊断。现有方法依赖于耗时且资源密集的临床访谈,且诊断结果可能受到主观因素影响。因此,需要一种自动化的、客观的诊断方法来提高效率和可及性。

核心思路:论文的核心思路是利用大型语言模型(LLM)理解和分析临床医生进行的诊断访谈内容,从而自动评估患者是否符合PTSD的诊断标准。通过训练LLM识别与PTSD相关的症状和行为模式,可以辅助临床医生进行诊断验证,并提高诊断的准确性和效率。

技术框架:该框架主要包含以下几个阶段:1) 数据收集:收集临床医生管理的PTSD诊断访谈记录。2) 数据预处理:对访谈记录进行清洗和格式化,以便LLM能够有效处理。3) 模型训练:使用收集到的数据对LLM(GPT-4和Llama-2)进行微调,使其能够识别与PTSD相关的特征。4) 诊断评估:使用训练好的LLM分析新的访谈记录,并生成PTSD诊断评估报告。5) 结果验证:将LLM的诊断结果与临床医生的诊断结果进行比较,评估LLM的性能。

关键创新:该论文的关键创新在于首次提出了一个完全自动化的、基于临床医生访谈的PTSD诊断评估系统。与以往的研究不同,该系统无需人工特征工程或领域知识,而是直接利用LLM的强大语言理解能力进行诊断。此外,该研究还构建了一个高质量的PTSD诊断访谈数据集,为后续研究提供了宝贵资源。

关键设计:论文的关键设计包括:1) 选择GPT-4和Llama-2作为基础LLM,利用其强大的语言理解和生成能力。2) 使用临床医生管理的访谈记录作为训练数据,保证数据的质量和可靠性。3) 设计合适的评估指标,例如准确率、召回率和F1值,来评估LLM的诊断性能。4) 探索不同的微调策略和参数设置,以优化LLM的性能。

📊 实验亮点

该研究在PTSD诊断自动化方面取得了显著进展,通过利用GPT-4和Llama-2等大型语言模型,实现了对临床访谈记录的自动分析和诊断评估。实验结果表明,LLM在辅助临床医生进行诊断验证方面具有强大的潜力,为提高PTSD诊断的效率和准确性提供了新的途径。具体性能数据和对比基线未在摘要中明确给出,属于未知信息。

🎯 应用场景

该研究成果可应用于心理健康服务机构,辅助临床医生进行PTSD的诊断和评估,提高诊断效率和准确性。此外,该技术还可以扩展到其他精神疾病的诊断,并应用于远程医疗和在线心理咨询等场景,从而提高心理健康服务的可及性,尤其是在资源匮乏的地区。

📄 摘要(原文)

The shortage of clinical workforce presents significant challenges in mental healthcare, limiting access to formal diagnostics and services. We aim to tackle this shortage by integrating a customized large language model (LLM) into the workflow, thus promoting equity in mental healthcare for the general population. Although LLMs have showcased their capability in clinical decision-making, their adaptation to severe conditions like Post-traumatic Stress Disorder (PTSD) remains largely unexplored. Therefore, we collect 411 clinician-administered diagnostic interviews and devise a novel approach to obtain high-quality data. Moreover, we build a comprehensive framework to automate PTSD diagnostic assessments based on interview contents by leveraging two state-of-the-art LLMs, GPT-4 and Llama-2, with potential for broader clinical diagnoses. Our results illustrate strong promise for LLMs, tested on our dataset, to aid clinicians in diagnostic validation. To the best of our knowledge, this is the first AI system that fully automates assessments for mental illness based on clinician-administered interviews.