Improving Zero-shot ADL Recognition with Large Language Models through Event-based Context and Confidence
作者: Michele Fiori, Gabriele Civitarese, Marco Colussi, Claudio Bettini
分类: cs.CV, cs.DC
发布日期: 2026-01-13
💡 一句话要点
提出基于事件上下文和置信度的大语言模型零样本ADL识别方法
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 零样本学习 活动识别 大语言模型 事件分割 置信度估计 智能家居 物联网
📋 核心要点
- 现有基于时间分割的零样本ADL识别方法与LLM的上下文推理能力不匹配,限制了识别性能。
- 本文提出基于事件的分割方法,并设计了一种新的置信度估计方法,以提升LLM在ADL识别中的准确性和可靠性。
- 实验表明,该方法在复杂数据集上优于基于时间的LLM方法和有监督方法,且置信度度量能有效区分正确和错误预测。
📝 摘要(中文)
本文提出了一种改进的零样本活动日常生活(ADL)识别方法,该方法利用大语言模型(LLM)处理来自智能家居物联网传感设备的数据。与现有基于时间分割的方法不同,本文采用基于事件的分割,更好地与LLM的上下文推理能力对齐。此外,本文还提出了一种新的预测置信度估计方法。实验结果表明,在复杂的真实数据集上,基于事件的分割始终优于基于时间的LLM方法,甚至超越了有监督的数据驱动方法,即使使用相对较小的LLM(例如,Gemma 3 27B)。所提出的置信度度量能够有效区分正确和错误的预测。
🔬 方法详解
问题定义:论文旨在解决智能家居环境中,利用物联网传感器数据进行零样本活动日常生活(ADL)识别的问题。现有方法主要依赖于基于时间的分割,这种分割方式无法有效捕捉ADL事件的上下文信息,导致大语言模型(LLM)难以进行准确的推理和识别。此外,现有方法缺乏对预测结果置信度的评估,难以判断预测的可靠性。
核心思路:论文的核心思路是利用基于事件的分割来更好地捕捉ADL事件的上下文信息,从而提升LLM的推理能力。同时,设计一种新的置信度估计方法,用于评估LLM预测结果的可靠性。通过事件驱动的方式,使LLM能够更好地理解ADL的发生过程,并结合置信度评估,提高ADL识别的准确性和鲁棒性。
技术框架:整体框架包含以下几个主要步骤:1) 数据采集:从智能家居环境中的物联网传感器收集数据。2) 事件分割:使用基于事件的分割算法将传感器数据分割成不同的事件片段。3) LLM推理:将事件片段输入到LLM中,利用LLM的上下文推理能力进行ADL识别。4) 置信度估计:使用提出的置信度估计方法评估LLM预测结果的可靠性。5) 结果输出:输出ADL识别结果以及相应的置信度。
关键创新:论文的关键创新点在于:1) 提出了基于事件的分割方法,能够更好地捕捉ADL事件的上下文信息,从而提升LLM的推理能力。2) 设计了一种新的置信度估计方法,用于评估LLM预测结果的可靠性,从而提高ADL识别的准确性和鲁棒性。
关键设计:事件分割的具体算法未知,论文重点在于强调事件分割相对于时间分割的优势。置信度估计方法的具体细节也未知,但其目标是量化LLM预测的可靠程度。使用的LLM可以是Gemma 3 27B等,具体参数设置未知。
🖼️ 关键图片
📊 实验亮点
实验结果表明,基于事件的分割方法在复杂的真实数据集上始终优于基于时间的LLM方法,甚至超越了有监督的数据驱动方法,即使使用相对较小的LLM(例如,Gemma 3 27B)。此外,所提出的置信度度量能够有效区分正确和错误的预测,为ADL识别结果的可靠性提供了保障。具体的性能提升数据未知。
🎯 应用场景
该研究成果可应用于智能家居、医疗健康、老年人照护等领域。通过准确识别用户的日常活动,可以提供个性化的健康建议、安全预警和能源管理服务。例如,在老年人照护方面,可以监测老年人的活动状态,及时发现异常情况并发出警报,从而保障老年人的安全和健康。该技术还有助于提升智能家居的智能化水平,使其能够更好地理解用户的需求并提供相应的服务。
📄 摘要(原文)
Unobtrusive sensor-based recognition of Activities of Daily Living (ADLs) in smart homes by processing data collected from IoT sensing devices supports applications such as healthcare, safety, and energy management. Recent zero-shot methods based on Large Language Models (LLMs) have the advantage of removing the reliance on labeled ADL sensor data. However, existing approaches rely on time-based segmentation, which is poorly aligned with the contextual reasoning capabilities of LLMs. Moreover, existing approaches lack methods for estimating prediction confidence. This paper proposes to improve zero-shot ADL recognition with event-based segmentation and a novel method for estimating prediction confidence. Our experimental evaluation shows that event-based segmentation consistently outperforms time-based LLM approaches on complex, realistic datasets and surpasses supervised data-driven methods, even with relatively small LLMs (e.g., Gemma 3 27B). The proposed confidence measure effectively distinguishes correct from incorrect predictions.