Open Foundation Models in Healthcare: Challenges, Paradoxes, and Opportunities with GenAI Driven Personalized Prescription

📄 arXiv: 2502.04356v1 📥 PDF

作者: Mahdi Alkaeed, Sofiat Abioye, Adnan Qayyum, Yosra Magdi Mekki, Ilhem Berrou, Mohamad Abdallah, Ala Al-Fuqaha, Muhammad Bilal, Junaid Qadir

分类: cs.CL, cs.AI, cs.LG

发布日期: 2025-02-04


💡 一句话要点

探索开源大模型在医疗领域的潜力:以个性化处方为例

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 开源大模型 医疗保健 个性化处方 检索增强生成 人工智能基础模型

📋 核心要点

  1. 现有专有大型语言模型在医疗领域的应用受限于其封闭性,阻碍了学术研究和非商业应用的透明使用。
  2. 本文探索了开源LLM和AIFM在医疗保健领域的应用潜力,并以个性化处方为例进行了案例研究。
  3. 研究表明,结合检索增强生成(RAG)等技术,开源LLM在特定医疗任务中可以达到与专有模型相当的性能。

📝 摘要(中文)

为了应对OpenAI GPT-4等专有大型语言模型(LLM)的成功,人们越来越关注开发开放、非专有的LLM和人工智能基础模型(AIFM),以便在学术、科学和非商业应用中透明使用。尽管它们无法与专有产品的精细功能相媲美,但开放模型具有彻底改变医疗保健应用的巨大潜力。本文探讨了开源LLM和AIFM在开发医疗保健应用中的前景,并做出了两项关键贡献。首先,我们全面调研了当前最先进的开源医疗保健LLM和AIFM,并介绍了这些开放AIFM的分类,根据其在各种医疗保健任务中的效用进行分类。其次,为了评估开放LLM在医疗保健中的通用应用,我们提出了一个关于个性化处方的案例研究。由于其在提供量身定制的、患者特定的药物以显著改善治疗结果方面的关键作用,这项任务尤为重要。此外,我们比较了开源模型与专有模型在有和没有检索增强生成(RAG)设置下的性能。我们的研究结果表明,虽然不够精细,但当与RAG等基础技术结合使用时,开放LLM可以达到与专有模型相当的性能。此外,为了突出LLM赋能的个性化处方的临床意义,我们通过专家临床医生进行了主观评估。我们还阐述了与滥用强大的LLM和AIFM相关的伦理考量和潜在风险,强调需要在医疗保健中谨慎和负责任地实施。

🔬 方法详解

问题定义:论文旨在解决专有大型语言模型(LLM)在医疗保健领域应用受限的问题。现有方法依赖于封闭的专有模型,缺乏透明度,限制了学术研究和非商业应用的创新。个性化处方是医疗保健中的一个关键任务,需要根据患者的特定情况进行药物选择和剂量调整,现有方法可能无法充分利用LLM的潜力来提供更精准的处方建议。

核心思路:论文的核心思路是探索开源LLM和人工智能基础模型(AIFM)在医疗保健领域的应用潜力,并利用检索增强生成(RAG)等技术来提升开源模型的性能,使其能够与专有模型相媲美。通过开源模型,可以促进医疗保健领域的透明研究和创新,并降低应用成本。

技术框架:论文的技术框架主要包括以下几个部分:1) 对现有开源医疗保健LLM和AIFM进行全面调研和分类;2) 选择个性化处方作为案例研究,评估开源LLM在医疗保健中的通用应用;3) 比较开源模型和专有模型在有无RAG情况下的性能;4) 通过专家临床医生进行主观评估,验证LLM赋能的个性化处方的临床意义。

关键创新:论文的关键创新在于:1) 系统性地评估了开源LLM在医疗保健领域的潜力,并提供了一个开源医疗保健AIFM的分类体系;2) 证明了通过RAG等技术,开源LLM可以在个性化处方等关键医疗任务中达到与专有模型相当的性能;3) 强调了开源LLM在促进医疗保健领域透明研究和创新方面的作用。

关键设计:论文的关键设计包括:1) 针对个性化处方任务,设计了合适的RAG流程,包括检索相关医学知识和患者信息,并将其融入LLM的生成过程中;2) 选择了合适的开源LLM和专有LLM进行对比实验,并采用了客观指标和主观评估相结合的方式来评估模型性能;3) 考虑了伦理因素和潜在风险,强调了在医疗保健中负责任地使用LLM的重要性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

研究表明,在个性化处方任务中,结合检索增强生成(RAG)技术,开源LLM可以达到与专有模型相当的性能。专家临床医生的主观评估也验证了LLM赋能的个性化处方的临床意义。这表明开源模型在医疗领域具有巨大的应用潜力。

🎯 应用场景

该研究成果可应用于智能辅助诊疗、个性化健康管理、药物研发等领域。通过开源LLM,可以降低医疗机构采用人工智能技术的门槛,促进医疗服务的普及和提升。未来,结合患者的基因组信息、生活习惯等数据,可以实现更精准的个性化医疗。

📄 摘要(原文)

In response to the success of proprietary Large Language Models (LLMs) such as OpenAI's GPT-4, there is a growing interest in developing open, non-proprietary LLMs and AI foundation models (AIFMs) for transparent use in academic, scientific, and non-commercial applications. Despite their inability to match the refined functionalities of their proprietary counterparts, open models hold immense potential to revolutionize healthcare applications. In this paper, we examine the prospects of open-source LLMs and AIFMs for developing healthcare applications and make two key contributions. Firstly, we present a comprehensive survey of the current state-of-the-art open-source healthcare LLMs and AIFMs and introduce a taxonomy of these open AIFMs, categorizing their utility across various healthcare tasks. Secondly, to evaluate the general-purpose applications of open LLMs in healthcare, we present a case study on personalized prescriptions. This task is particularly significant due to its critical role in delivering tailored, patient-specific medications that can greatly improve treatment outcomes. In addition, we compare the performance of open-source models with proprietary models in settings with and without Retrieval-Augmented Generation (RAG). Our findings suggest that, although less refined, open LLMs can achieve performance comparable to proprietary models when paired with grounding techniques such as RAG. Furthermore, to highlight the clinical significance of LLMs-empowered personalized prescriptions, we perform subjective assessment through an expert clinician. We also elaborate on ethical considerations and potential risks associated with the misuse of powerful LLMs and AIFMs, highlighting the need for a cautious and responsible implementation in healthcare.