Improving Zero-shot ADL Recognition with Large Language Models through Event-based Context and Confidence

作者: Michele Fiori, Gabriele Civitarese, Marco Colussi, Claudio Bettini

分类: cs.CV, cs.DC

发布日期: 2026-01-13

💡 一句话要点

提出基于事件上下文和置信度的大语言模型零样本ADL识别方法

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 零样本学习 活动识别 大语言模型 事件分割 置信度估计 智能家居 物联网

📋 核心要点

现有基于时间分割的零样本ADL识别方法与LLM的上下文推理能力不匹配，限制了识别性能。
本文提出基于事件的分割方法，并设计了一种新的置信度估计方法，以提升LLM在ADL识别中的准确性和可靠性。
实验表明，该方法在复杂数据集上优于基于时间的LLM方法和有监督方法，且置信度度量能有效区分正确和错误预测。

📝 摘要（中文）

本文提出了一种改进的零样本活动日常生活（ADL）识别方法，该方法利用大语言模型（LLM）处理来自智能家居物联网传感设备的数据。与现有基于时间分割的方法不同，本文采用基于事件的分割，更好地与LLM的上下文推理能力对齐。此外，本文还提出了一种新的预测置信度估计方法。实验结果表明，在复杂的真实数据集上，基于事件的分割始终优于基于时间的LLM方法，甚至超越了有监督的数据驱动方法，即使使用相对较小的LLM（例如，Gemma 3 27B）。所提出的置信度度量能够有效区分正确和错误的预测。

🔬 方法详解

问题定义：论文旨在解决智能家居环境中，利用物联网传感器数据进行零样本活动日常生活（ADL）识别的问题。现有方法主要依赖于基于时间的分割，这种分割方式无法有效捕捉ADL事件的上下文信息，导致大语言模型（LLM）难以进行准确的推理和识别。此外，现有方法缺乏对预测结果置信度的评估，难以判断预测的可靠性。

核心思路：论文的核心思路是利用基于事件的分割来更好地捕捉ADL事件的上下文信息，从而提升LLM的推理能力。同时，设计一种新的置信度估计方法，用于评估LLM预测结果的可靠性。通过事件驱动的方式，使LLM能够更好地理解ADL的发生过程，并结合置信度评估，提高ADL识别的准确性和鲁棒性。

技术框架：整体框架包含以下几个主要步骤：1) 数据采集：从智能家居环境中的物联网传感器收集数据。2) 事件分割：使用基于事件的分割算法将传感器数据分割成不同的事件片段。3) LLM推理：将事件片段输入到LLM中，利用LLM的上下文推理能力进行ADL识别。4) 置信度估计：使用提出的置信度估计方法评估LLM预测结果的可靠性。5) 结果输出：输出ADL识别结果以及相应的置信度。

关键创新：论文的关键创新点在于：1) 提出了基于事件的分割方法，能够更好地捕捉ADL事件的上下文信息，从而提升LLM的推理能力。2) 设计了一种新的置信度估计方法，用于评估LLM预测结果的可靠性，从而提高ADL识别的准确性和鲁棒性。

关键设计：事件分割的具体算法未知，论文重点在于强调事件分割相对于时间分割的优势。置信度估计方法的具体细节也未知，但其目标是量化LLM预测的可靠程度。使用的LLM可以是Gemma 3 27B等，具体参数设置未知。

🖼️ 关键图片

📊 实验亮点

实验结果表明，基于事件的分割方法在复杂的真实数据集上始终优于基于时间的LLM方法，甚至超越了有监督的数据驱动方法，即使使用相对较小的LLM（例如，Gemma 3 27B）。此外，所提出的置信度度量能够有效区分正确和错误的预测，为ADL识别结果的可靠性提供了保障。具体的性能提升数据未知。

🎯 应用场景

该研究成果可应用于智能家居、医疗健康、老年人照护等领域。通过准确识别用户的日常活动，可以提供个性化的健康建议、安全预警和能源管理服务。例如，在老年人照护方面，可以监测老年人的活动状态，及时发现异常情况并发出警报，从而保障老年人的安全和健康。该技术还有助于提升智能家居的智能化水平，使其能够更好地理解用户的需求并提供相应的服务。

📄 摘要（原文）

Unobtrusive sensor-based recognition of Activities of Daily Living (ADLs) in smart homes by processing data collected from IoT sensing devices supports applications such as healthcare, safety, and energy management. Recent zero-shot methods based on Large Language Models (LLMs) have the advantage of removing the reliance on labeled ADL sensor data. However, existing approaches rely on time-based segmentation, which is poorly aligned with the contextual reasoning capabilities of LLMs. Moreover, existing approaches lack methods for estimating prediction confidence. This paper proposes to improve zero-shot ADL recognition with event-based segmentation and a novel method for estimating prediction confidence. Our experimental evaluation shows that event-based segmentation consistently outperforms time-based LLM approaches on complex, realistic datasets and surpasses supervised data-driven methods, even with relatively small LLMs (e.g., Gemma 3 27B). The proposed confidence measure effectively distinguishes correct from incorrect predictions.

Improving Zero-shot ADL Recognition with Large Language Models through Event-based Context and Confidence

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理