A Comprehensive Survey on the Trustworthiness of Large Language Models in Healthcare

作者: Manar Aljohani, Jun Hou, Sindhura Kommu, Xuan Wang

分类: cs.CY, cs.AI, cs.CL

发布日期: 2025-02-21 (更新: 2025-09-17)

💡 一句话要点

综述：医疗领域大语言模型的可信赖性评估与风险缓解

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 医疗健康 可信赖性 真实性 隐私保护 安全性 公平性

📋 核心要点

医疗LLM面临真实性、隐私、安全、鲁棒性、公平性和可解释性等多重挑战，现有评估方法缺乏系统性综述。
本综述旨在全面回顾现有方法和解决方案，分析各维度对医疗LLM可靠性和伦理部署的影响。
研究识别了现有方法的关键差距，并指出了多智能体协作、多模态推理等新兴范式带来的新挑战。

📝 摘要（中文）

大型语言模型（LLM）在医疗领域的应用前景广阔，有望提升临床决策、医学研究和患者护理水平。然而，将其整合到实际临床环境中引发了对可信赖性的严重担忧，尤其是在真实性、隐私、安全性、鲁棒性、公平性和可解释性等方面。这些维度对于确保LLM生成可靠、无偏见和符合伦理的输出至关重要。尽管研究人员最近开始开发基准和评估框架来评估LLM的可信赖性，但LLM在医疗保健领域的可信赖性仍未得到充分探索，缺乏提供全面理解和未来见解的系统性综述。本综述旨在弥补这一差距，全面回顾旨在降低关键信任维度风险的当前方法和解决方案。我们分析了每个维度如何影响医疗LLM的可靠性和伦理部署，综合了正在进行的研究工作，并确定了现有方法中的关键差距。我们还确定了新兴范式带来的新挑战，例如多智能体协作、多模态推理以及小型开源医疗模型的发展。我们的目标是指导未来的研究朝着更值得信赖、透明和临床上可行的LLM发展。

🔬 方法详解

问题定义：该论文旨在解决医疗领域大型语言模型（LLM）的可信赖性问题。现有方法在评估医疗LLM的真实性、隐私、安全性、鲁棒性、公平性和可解释性方面存在不足，缺乏系统性的综述和深入的分析。这些不足阻碍了医疗LLM在临床环境中的可靠和伦理部署。

核心思路：论文的核心思路是对现有关于医疗LLM可信赖性的研究进行全面的梳理和分析，从真实性、隐私、安全性、鲁棒性、公平性和可解释性六个关键维度入手，识别现有方法的优点和不足，并探讨新兴技术范式带来的新挑战。通过系统性的综述，为未来的研究提供指导，促进更值得信赖、透明和临床上可行的医疗LLM的发展。

技术框架：该综述论文的技术框架主要包括以下几个阶段：1) 文献收集：系统性地收集关于医疗LLM可信赖性的相关研究论文。2) 维度划分：将可信赖性分解为真实性、隐私、安全性、鲁棒性、公平性和可解释性六个关键维度。3) 方法分析：针对每个维度，分析现有评估方法和解决方案的优缺点。4) 挑战识别：识别新兴技术范式（如多智能体协作、多模态推理）带来的新挑战。5) 未来展望：为未来的研究方向提供建议和指导。

关键创新：该综述的关键创新在于其系统性和全面性。它首次对医疗LLM的可信赖性问题进行了全面的梳理和分析，并从多个维度深入探讨了现有方法的不足和新兴技术带来的挑战。与以往的研究相比，该综述不仅提供了更全面的视角，还为未来的研究方向提供了更清晰的指导。

关键设计：该综述的关键设计在于其维度划分和方法分析。通过将可信赖性分解为六个关键维度，可以更清晰地识别现有方法在不同方面的优缺点。针对每个维度，论文详细分析了现有评估方法和解决方案的技术细节，并探讨了其局限性。此外，论文还关注了新兴技术范式对医疗LLM可信赖性的影响，并提出了相应的研究方向。

🖼️ 关键图片

📊 实验亮点

该综述全面分析了医疗LLM在真实性、隐私、安全性、鲁棒性、公平性和可解释性等方面的挑战，并对现有方法进行了深入评估。研究识别了现有方法的关键差距，并指出了多智能体协作、多模态推理等新兴范式带来的新挑战，为未来的研究提供了宝贵的参考。

🎯 应用场景

该研究成果可应用于指导医疗LLM的开发和评估，帮助研究人员和开发者构建更值得信赖、安全可靠的医疗AI系统。其潜在应用领域包括辅助诊断、药物研发、个性化治疗、患者健康管理等，有望提升医疗服务的质量和效率，并改善患者的健康状况。

📄 摘要（原文）

The application of large language models (LLMs) in healthcare holds significant promise for enhancing clinical decision-making, medical research, and patient care. However, their integration into real-world clinical settings raises critical concerns around trustworthiness, particularly around dimensions of truthfulness, privacy, safety, robustness, fairness, and explainability. These dimensions are essential for ensuring that LLMs generate reliable, unbiased, and ethically sound outputs. While researchers have recently begun developing benchmarks and evaluation frameworks to assess LLM trustworthiness, the trustworthiness of LLMs in healthcare remains underexplored, lacking a systematic review that provides a comprehensive understanding and future insights. This survey addresses that gap by providing a comprehensive review of current methodologies and solutions aimed at mitigating risks across key trust dimensions. We analyze how each dimension affects the reliability and ethical deployment of healthcare LLMs, synthesize ongoing research efforts, and identify critical gaps in existing approaches. We also identify emerging challenges posed by evolving paradigms, such as multi-agent collaboration, multi-modal reasoning, and the development of small open-source medical models. Our goal is to guide future research toward more trustworthy, transparent, and clinically viable LLMs.

A Comprehensive Survey on the Trustworthiness of Large Language Models in Healthcare

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理