Patients Speak, AI Listens: LLM-based Analysis of Online Reviews Uncovers Key Drivers for Urgent Care Satisfaction

📄 arXiv: 2503.20981v1 📥 PDF

作者: Xiaoran Xu, Zhaoqian Xue, Chi Zhang, Jhonatan Medri, Junjie Xiong, Jiayan Zhou, Jin Jin, Yongfeng Zhang, Siyuan Ma, Lingyao Li

分类: cs.CL, cs.AI, cs.SI

发布日期: 2025-03-26


💡 一句话要点

利用LLM分析在线评论,揭示影响急诊医疗满意度的关键因素

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 在线评论分析 急诊医疗满意度 情感分析 提示工程

📋 核心要点

  1. 传统调查方法在急诊医疗满意度研究中存在局限性,难以覆盖广泛人群和细粒度信息。
  2. 利用大型语言模型分析在线评论,提取用户对急诊医疗各方面的细粒度情感倾向。
  3. 研究发现人际因素和运营效率是影响患者满意度的关键因素,人口密度也存在一定关联。

📝 摘要(中文)

本研究旨在通过分析公众对急诊医疗机构的评价,促进社区医疗发展。传统调查方法在范围、时间和空间覆盖上存在局限性。通过在线评论或社交媒体进行众包提供了一种有价值的途径来获取此类见解。借助大型语言模型(LLM)的最新进展,从评论中提取细微的感知成为可能。本研究收集了DMV和佛罗里达地区的Google Maps评论,并使用GPT模型进行提示工程,以分析急诊医疗机构基于方面的 sentiment。首先,分析了各个方面的地理空间模式,包括人际因素、运营效率、技术质量、财务和设施。接下来,确定了人口普查区组(CBG)级别的特征,这些特征是公众认知差异的基础,包括人口密度、收入中位数、基尼指数、租金收入比、贫困线下家庭比率、无保险率和失业率。结果表明,人际因素和运营效率是急诊医疗患者满意度的最强决定因素,而技术质量、财务和设施在多元模型中调整后未显示出显着的独立影响。在社会经济和人口因素中,只有人口密度显示出与患者评分的显着但适度的关联,而其余因素未显示出显着的相关性。总的来说,这项研究强调了众包在揭示对居民重要的关键因素方面的潜力,并为利益相关者提供有价值的见解,以提高公众对急诊医疗的满意度。

🔬 方法详解

问题定义:本研究旨在解决如何有效且全面地了解公众对急诊医疗服务的满意度问题。传统调查方法存在覆盖范围有限、耗时耗力等痛点,难以捕捉到用户真实、细致的反馈。

核心思路:利用在线评论作为众包数据源,借助大型语言模型(LLM)强大的文本理解和情感分析能力,从海量评论中提取用户对急诊医疗服务的各个方面的评价,并分析这些评价与社会经济因素之间的关系。

技术框架:整体流程包括:1) 数据收集:收集DMV和佛罗里达地区的Google Maps上关于急诊医疗机构的评论;2) 情感分析:使用GPT模型进行提示工程,提取评论中关于人际因素、运营效率、技术质量、财务和设施等方面的 sentiment;3) 地理空间分析:分析各个方面的地理空间分布模式;4) 回归分析:建立多元回归模型,分析人口密度、收入中位数等社会经济因素与患者评分之间的关系。

关键创新:本研究的关键创新在于将大型语言模型应用于分析在线评论,从而能够高效、大规模地提取用户对急诊医疗服务的细粒度情感倾向。与传统调查方法相比,该方法具有更高的效率和更广的覆盖范围。

关键设计:研究中使用了GPT模型进行情感分析,通过prompt engineering来引导模型提取特定方面的情感。回归分析中,采用了多元回归模型,并对多个社会经济因素进行了控制,以确保结果的可靠性。具体参数设置和模型结构细节未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

研究结果表明,人际因素和运营效率是影响急诊医疗患者满意度的最重要因素。技术质量、财务和设施的影响不显著。在社会经济因素中,只有人口密度与患者评分存在显著但适度的关联。这些发现为改进急诊医疗服务提供了重要依据。

🎯 应用场景

该研究成果可应用于改进急诊医疗服务质量,提升患者满意度。医疗机构可以根据分析结果,有针对性地改善人际沟通、优化运营流程,从而提升整体服务水平。政府部门也可以利用这些信息,制定更合理的医疗政策,促进社区医疗发展。

📄 摘要(原文)

Investigating the public experience of urgent care facilities is essential for promoting community healthcare development. Traditional survey methods often fall short due to limited scope, time, and spatial coverage. Crowdsourcing through online reviews or social media offers a valuable approach to gaining such insights. With recent advancements in large language models (LLMs), extracting nuanced perceptions from reviews has become feasible. This study collects Google Maps reviews across the DMV and Florida areas and conducts prompt engineering with the GPT model to analyze the aspect-based sentiment of urgent care. We first analyze the geospatial patterns of various aspects, including interpersonal factors, operational efficiency, technical quality, finances, and facilities. Next, we determine Census Block Group(CBG)-level characteristics underpinning differences in public perception, including population density, median income, GINI Index, rent-to-income ratio, household below poverty rate, no insurance rate, and unemployment rate. Our results show that interpersonal factors and operational efficiency emerge as the strongest determinants of patient satisfaction in urgent care, while technical quality, finances, and facilities show no significant independent effects when adjusted for in multivariate models. Among socioeconomic and demographic factors, only population density demonstrates a significant but modest association with patient ratings, while the remaining factors exhibit no significant correlations. Overall, this study highlights the potential of crowdsourcing to uncover the key factors that matter to residents and provide valuable insights for stakeholders to improve public satisfaction with urgent care.