Using Large Language Models to Create Personalized Networks From Therapy Sessions

📄 arXiv: 2512.05836v1 📥 PDF

作者: Clarissa W. Ong, Hiba Arnaout, Kate Sheehan, Estella Fox, Eugen Owtscharow, Iryna Gurevych

分类: cs.AI

发布日期: 2025-12-05


💡 一句话要点

利用大型语言模型从治疗记录中构建个性化网络,辅助治疗方案制定。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 个性化网络 心理治疗 案例概念化 治疗计划 上下文学习 临床应用

📋 核心要点

  1. 现有个性化治疗方法依赖大量纵向数据构建个性化网络,但数据收集成本高昂,限制了其可扩展性。
  2. 本研究提出利用大型语言模型,从治疗记录中自动构建客户网络,辅助案例概念化和治疗方案制定。
  3. 实验结果表明,该方法生成的网络在临床效用和可解释性方面优于传统方法,并获得了专家的高度评价。

📝 摘要(中文)

本研究提出了一种端到端流程,利用大型语言模型(LLM)从77份治疗记录中自动生成客户网络,以支持案例概念化和治疗计划制定。研究人员标注了治疗记录中的3364个心理过程及其维度,并应用上下文学习联合识别心理过程及其维度,即使在少量训练样本下也取得了高性能。为了将这些过程组织成网络,研究引入了一种两步法,将它们分组为具有临床意义的聚类,并生成了聚类之间解释增强的关系。专家评估表明,该方法构建的网络在临床效用和可解释性方面优于直接提示方法,偏好度高达90%。此外,专家对网络的临床相关性、新颖性和有用性的评分在72-75%之间。该研究为使用LLM从治疗记录中创建临床相关网络提供了一个概念验证。该方法的优势包括从治疗过程中的客户话语进行自下而上的案例概念化和识别潜在主题。生成的网络可用于临床环境、监督和培训。未来的研究应考察这些网络是否能改善治疗效果,与其他治疗个性化方法(包括统计估计网络)相比。

🔬 方法详解

问题定义:现有心理治疗的个性化方法依赖于构建个性化网络,但构建这些网络通常需要大量的纵向数据,这在实际应用中往往难以实现。因此,如何利用有限的数据,高效地构建个性化网络,是本研究要解决的核心问题。现有方法的痛点在于数据依赖性强,难以扩展。

核心思路:本研究的核心思路是利用大型语言模型(LLM)的强大能力,从有限的治疗记录中提取关键的心理过程及其维度,并将其组织成具有临床意义的网络。通过LLM的上下文学习能力,即使在少量训练样本下也能实现高性能的心理过程识别。这种方法旨在降低数据依赖性,提高个性化网络构建的效率和可扩展性。

技术框架:该研究的整体框架包含以下几个主要步骤: 1. 数据标注:对治疗记录进行标注,标注心理过程及其对应的维度。 2. 心理过程识别:利用标注数据,通过上下文学习,训练LLM以识别治疗记录中的心理过程及其维度。 3. 聚类分析:将识别出的心理过程进行聚类,形成具有临床意义的聚类。 4. 关系生成:生成聚类之间的关系,并提供解释,形成最终的个性化网络。 5. 专家评估:邀请专家对生成的网络进行评估,评估其临床效用和可解释性。

关键创新:本研究的关键创新在于将大型语言模型应用于心理治疗的个性化网络构建。与传统的统计方法相比,该方法能够从有限的文本数据中提取更丰富的语义信息,并生成更具临床意义的网络。此外,该研究还提出了一种两步法,将心理过程聚类成临床上有意义的组,并生成解释增强的关系,提高了网络的可解释性。

关键设计:在心理过程识别阶段,研究人员采用了上下文学习的方法,利用少量标注数据训练LLM。在聚类分析阶段,研究人员采用了领域专家知识指导的聚类算法,以确保聚类的临床意义。在关系生成阶段,研究人员利用LLM生成聚类之间的关系,并提供解释,增强了网络的可解释性。具体的参数设置和损失函数等技术细节在论文中未详细说明。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该研究表明,利用大型语言模型可以有效地从治疗记录中构建个性化网络。专家评估结果显示,该方法构建的网络在临床效用和可解释性方面优于直接提示方法,偏好度高达90%。此外,专家对网络的临床相关性、新颖性和有用性的评分在72-75%之间。这些结果表明,该方法具有很高的临床应用潜力。

🎯 应用场景

该研究成果可应用于临床心理咨询、心理治疗的辅助诊断和治疗方案制定。生成的个性化网络可以帮助临床医生更好地理解患者的心理状态,识别潜在的主题,并制定更有效的治疗计划。此外,该方法还可以应用于心理治疗的培训和监督,帮助新手医生学习案例概念化和治疗计划制定。未来,该方法有望推广到其他医疗领域,例如疾病诊断和药物研发。

📄 摘要(原文)

Recent advances in psychotherapy have focused on treatment personalization, such as by selecting treatment modules based on personalized networks. However, estimating personalized networks typically requires intensive longitudinal data, which is not always feasible. A solution to facilitate scalability of network-driven treatment personalization is leveraging LLMs. In this study, we present an end-to-end pipeline for automatically generating client networks from 77 therapy transcripts to support case conceptualization and treatment planning. We annotated 3364 psychological processes and their corresponding dimensions in therapy transcripts. Using these data, we applied in-context learning to jointly identify psychological processes and their dimensions. The method achieved high performance even with a few training examples. To organize the processes into networks, we introduced a two-step method that grouped them into clinically meaningful clusters. We then generated explanation-augmented relationships between clusters. Experts found that networks produced by our multi-step approach outperformed those built with direct prompting for clinical utility and interpretability, with up to 90% preferring our approach. In addition, the networks were rated favorably by experts, with scores for clinical relevance, novelty, and usefulness ranging from 72-75%. Our findings provide a proof of concept for using LLMs to create clinically relevant networks from therapy transcripts. Advantages of our approach include bottom-up case conceptualization from client utterances in therapy sessions and identification of latent themes. Networks generated from our pipeline may be used in clinical settings and supervision and training. Future research should examine whether these networks improve treatment outcomes relative to other methods of treatment personalization, including statistically estimated networks.