Large Language Models-Enabled Digital Twins for Precision Medicine in Rare Gynecological Tumors
作者: Jacqueline Lammert, Nicole Pfarr, Leonid Kuligin, Sonja Mathes, Tobias Dreyer, Luise Modersohn, Patrick Metzger, Dyke Ferber, Jakob Nikolas Kather, Daniel Truhn, Lisa Christine Adams, Keno Kyrill Bressem, Sebastian Lange, Kristina Schwamborn, Martin Boeker, Marion Kiechle, Ulrich A. Schatz, Holger Bronger, Maximilian Tschochohei
分类: cs.CL, cs.AI, q-bio.QM, stat.ML
发布日期: 2024-08-31
备注: 20 pages, 2 figures, 3 tables, supplements, original article
期刊: npj Digit. Med. 8, 12 (2025)
DOI: 10.1038/s41746-025-01810-z
💡 一句话要点
利用大语言模型构建数字孪生,为罕见妇科肿瘤精准医疗提供支持
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大语言模型 数字孪生 精准医疗 罕见妇科肿瘤 个性化治疗
📋 核心要点
- 罕见妇科肿瘤由于其低发病率和高度异质性,缺乏明确的治疗指南,导致治疗效果不佳,预后较差。
- 利用大语言模型整合临床、生物标志物和文献数据,构建患者的数字孪生,从而为罕见妇科肿瘤患者提供个性化的治疗方案。
- 通过数字孪生系统,能够识别出传统方法可能遗漏的治疗方案,为患者提供更全面的治疗选择,改善患者预后。
📝 摘要(中文)
罕见妇科肿瘤(RGTs)由于其低发病率和异质性,给临床带来了重大挑战。缺乏明确的指南导致次优管理和不良预后。分子肿瘤委员会通过基于生物标志物(超越癌症类型)定制治疗方案,加速了有效疗法的应用。需要手动管理非结构化数据阻碍了生物标志物分析在治疗匹配中的有效利用。本研究探索了使用大型语言模型(LLM)构建数字孪生,以支持RGTs的精准医疗。我们的概念验证数字孪生系统整合了来自机构和已发表病例(n=21)的临床和生物标志物数据,以及来自文献的数据(n=655篇出版物,n=404,265名患者),为转移性子宫癌肉瘤创建了定制的治疗计划,识别出传统单源分析可能遗漏的治疗方案。基于LLM的数字孪生能够有效地模拟个体患者的病程轨迹。转向基于生物学而非基于器官的肿瘤定义,能够实现个性化护理,从而改善RGT管理,进而改善患者的治疗结果。
🔬 方法详解
问题定义:罕见妇科肿瘤(RGTs)由于其低发病率和异质性,临床治疗面临巨大挑战。现有方法依赖于基于器官的肿瘤定义,缺乏对个体患者生物学特征的深入理解,导致治疗方案不够精准,预后较差。此外,大量非结构化的临床数据和文献数据难以有效利用,阻碍了精准医疗的发展。
核心思路:本研究的核心思路是利用大语言模型(LLM)整合来自不同来源的临床数据、生物标志物数据和文献数据,构建患者的数字孪生。通过数字孪生,可以模拟个体患者的病程轨迹,并根据患者的生物学特征,推荐个性化的治疗方案。这种方法将肿瘤定义从基于器官转向基于生物学,从而实现更精准的治疗。
技术框架:该数字孪生系统主要包含以下几个模块:1) 数据收集模块:收集来自机构和已发表病例的临床和生物标志物数据,以及来自文献的数据。2) 数据处理模块:利用LLM对非结构化数据进行处理,提取关键信息,并将其转化为结构化数据。3) 数字孪生构建模块:基于结构化数据,构建患者的数字孪生,包括患者的病史、生物标志物信息、治疗方案等。4) 治疗方案推荐模块:基于数字孪生,利用LLM分析患者的生物学特征,并推荐个性化的治疗方案。
关键创新:该研究的关键创新在于将大语言模型应用于罕见妇科肿瘤的精准医疗。与传统方法相比,该方法能够更有效地整合来自不同来源的数据,并根据患者的生物学特征,推荐个性化的治疗方案。此外,该方法将肿瘤定义从基于器官转向基于生物学,从而实现更精准的治疗。
关键设计:论文中没有详细描述LLM的具体选择和训练细节,以及数字孪生构建和治疗方案推荐的具体算法。这些细节属于未知信息。但可以推测,LLM需要具备强大的自然语言处理能力和知识推理能力,能够从大量的非结构化数据中提取关键信息,并根据患者的生物学特征,推荐个性化的治疗方案。
🖼️ 关键图片
📊 实验亮点
该研究构建的数字孪生系统能够为转移性子宫癌肉瘤患者创建定制的治疗计划,并识别出传统单源分析可能遗漏的治疗方案。通过整合来自机构和文献的大量数据,该系统能够更全面地了解患者的病情,并提供更精准的治疗建议。虽然没有给出具体的性能指标,但该研究的概念验证表明,LLM在罕见肿瘤的精准医疗领域具有巨大的潜力。
🎯 应用场景
该研究成果可应用于罕见肿瘤的精准医疗领域,通过构建患者的数字孪生,为临床医生提供个性化的治疗方案建议,提高治疗效果,改善患者预后。未来,该技术还可扩展到其他疾病领域,为个性化医疗提供更强大的支持。
📄 摘要(原文)
Rare gynecological tumors (RGTs) present major clinical challenges due to their low incidence and heterogeneity. The lack of clear guidelines leads to suboptimal management and poor prognosis. Molecular tumor boards accelerate access to effective therapies by tailoring treatment based on biomarkers, beyond cancer type. Unstructured data that requires manual curation hinders efficient use of biomarker profiling for therapy matching. This study explores the use of large language models (LLMs) to construct digital twins for precision medicine in RGTs. Our proof-of-concept digital twin system integrates clinical and biomarker data from institutional and published cases (n=21) and literature-derived data (n=655 publications with n=404,265 patients) to create tailored treatment plans for metastatic uterine carcinosarcoma, identifying options potentially missed by traditional, single-source analysis. LLM-enabled digital twins efficiently model individual patient trajectories. Shifting to a biology-based rather than organ-based tumor definition enables personalized care that could advance RGT management and thus enhance patient outcomes.