The Impact of Foundational Models on Patient-Centric e-Health Systems

📄 arXiv: 2507.21882v1 📥 PDF

作者: Elmira Onagh, Alireza Davoodi, Maleknaz Nayebi

分类: cs.AI, cs.SE

发布日期: 2025-07-29

备注: Paper published in COMPSAC 2025


💡 一句话要点

利用大型语言模型评估以患者为中心的电子健康系统中人工智能的成熟度

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 电子健康 人工智能成熟度 患者中心 Gartner模型

📋 核心要点

  1. 现有以患者为中心的电子健康系统缺乏对人工智能应用成熟度的系统性评估,难以衡量其可信度和实际效果。
  2. 本研究利用大型语言模型自动提取并分析电子健康应用的功能特征,并根据Gartner模型评估其人工智能成熟度。
  3. 实验结果表明,大多数应用仍处于人工智能整合的初级阶段,高级应用占比很小,揭示了该领域的发展潜力。

📝 摘要(中文)

随着人工智能(AI)日益融入医疗技术,理解人工智能在以患者为中心的应用中的成熟度,对于评估其可信度、透明度和实际影响至关重要。本研究调查了116个以患者为中心的医疗应用中人工智能特征整合的程度和成熟度。我们使用大型语言模型(LLM)提取关键的功能特征,然后将这些特征分类到Gartner人工智能成熟度模型的不同阶段。结果表明,超过86.21%的应用仍处于人工智能整合的早期阶段,只有13.79%的应用展示了高级的人工智能整合。

🔬 方法详解

问题定义:论文旨在评估当前以患者为中心的电子健康系统中人工智能技术的应用成熟度。现有方法缺乏对大量应用进行系统性评估的有效手段,难以全面了解人工智能在医疗领域的实际应用水平和发展趋势。

核心思路:论文的核心思路是利用大型语言模型(LLM)的强大文本理解和信息提取能力,自动从大量的电子健康应用描述中提取关键的功能特征,然后根据预定义的成熟度模型(Gartner模型)对这些应用进行分类和评估。这种方法能够高效地对大量应用进行分析,并提供关于人工智能应用成熟度的宏观视角。

技术框架:整体流程包括以下几个主要阶段:1) 数据收集:收集116个以患者为中心的电子健康应用的描述信息。2) 特征提取:使用大型语言模型从应用描述中提取关键的功能特征。3) 成熟度评估:根据Gartner人工智能成熟度模型,将提取的特征映射到不同的成熟度阶段。4) 结果分析:统计各个成熟度阶段的应用数量和比例,分析人工智能在电子健康领域的应用现状。

关键创新:该研究的关键创新在于将大型语言模型应用于电子健康应用的人工智能成熟度评估。传统方法依赖于人工分析,效率低下且难以规模化。利用LLM可以自动化特征提取和分类过程,大大提高了评估效率和覆盖范围。

关键设计:论文的关键设计包括:1) 选择合适的大型语言模型,并针对电子健康应用领域进行微调,以提高特征提取的准确性。2) 精心设计特征提取的提示词(prompt),引导LLM提取与人工智能成熟度相关的关键信息。3) 采用Gartner人工智能成熟度模型作为评估框架,该模型具有广泛的认可度和应用价值。

📊 实验亮点

实验结果显示,在116个以患者为中心的电子健康应用中,超过86.21%的应用仍处于人工智能整合的早期阶段,只有13.79%的应用展示了高级的人工智能整合。这一数据清晰地揭示了当前电子健康领域人工智能应用的发展瓶颈和未来潜力。

🎯 应用场景

该研究成果可应用于医疗健康领域的政策制定、技术投资和产品开发。通过了解人工智能在电子健康系统中的应用现状和成熟度,可以指导资源分配,促进人工智能技术在医疗领域的健康发展,并为患者提供更智能、更有效的医疗服务。

📄 摘要(原文)

As Artificial Intelligence (AI) becomes increasingly embedded in healthcare technologies, understanding the maturity of AI in patient-centric applications is critical for evaluating its trustworthiness, transparency, and real-world impact. In this study, we investigate the integration and maturity of AI feature integration in 116 patient-centric healthcare applications. Using Large Language Models (LLMs), we extracted key functional features, which are then categorized into different stages of the Gartner AI maturity model. Our results show that over 86.21\% of applications remain at the early stages of AI integration, while only 13.79% demonstrate advanced AI integration.