Keep the Lights On, Keep the Lengths in Check: Plug-In Adversarial Detection for Time-Series LLMs in Energy Forecasting

📄 arXiv: 2512.12154v1 📥 PDF

作者: Hua Ma, Ruoxi Sun, Minhui Xue, Xingliang Yuan, Carsten Rudolph, Surya Nepal, Ling Liu

分类: cs.CR, cs.LG

发布日期: 2025-12-13


💡 一句话要点

提出即插即用的对抗样本检测框架,保障能源预测中时间序列LLM的安全性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 时间序列预测 大语言模型 对抗样本检测 能源互联网 可变长度输入

📋 核心要点

  1. 时间序列LLM在能源预测中面临对抗样本攻击的威胁,现有方法难以有效检测全局扰动和处理可变长度输入。
  2. 该论文提出一种即插即用的检测框架,通过对输入序列进行采样并分析预测一致性来识别对抗样本。
  3. 实验结果表明,该方法在多个能源数据集和不同攻击场景下均表现出强大的检测性能,具有实际应用价值。

📝 摘要(中文)

精确的时间序列预测对于低碳电力系统的规划和运营至关重要。新兴的时间序列大语言模型(TS-LLM)无需任务特定的重新训练即可提供这种能力,并迅速成为能源互联网(IoE)生态系统中的关键组件。然而,实际部署受到对抗样本(AEs)这一关键漏洞的困扰。检测这些AEs具有挑战性,因为(i)对抗扰动在整个输入序列上进行优化,并利用全局时间依赖性,这使得局部检测方法无效,并且(ii)与具有固定输入维度的传统预测模型不同,TS-LLM接受可变长度的序列,增加了复杂性。为了解决这些挑战,我们提出了一种即插即用的检测框架,该框架利用TS-LLM自身的可变长度输入能力。我们的方法使用采样诱导的差异作为检测信号。给定一个输入序列,我们生成多个缩短的变体,并通过测量其预测的一致性来检测AEs:良性序列在采样下倾向于产生稳定的预测,而对抗序列显示出较低的预测相似性,因为为完整长度序列优化的扰动不能可靠地转移到较短的、结构不同的子样本。我们在三个能源数据集上评估了我们的方法:ETTh2 (电力变压器温度)、NI (小时能源消耗)和Consumption (小时电力消耗和生产)。经验结果证实了在黑盒和白盒攻击场景中强大的检测性能,突出了其作为实际能源系统中TS-LLM预测的可靠保障的实用性。

🔬 方法详解

问题定义:论文旨在解决时间序列大语言模型(TS-LLM)在能源预测应用中,容易受到对抗样本攻击的问题。现有的对抗样本检测方法通常针对固定长度的输入,并且无法有效检测利用全局时间依赖性的对抗扰动。此外,TS-LLM接受可变长度的输入序列,进一步增加了对抗样本检测的难度。

核心思路:论文的核心思路是利用TS-LLM自身的可变长度输入能力,通过对输入序列进行采样,生成多个不同长度的子序列,并观察这些子序列的预测结果的一致性。如果输入序列是良性的,那么不同长度的子序列应该产生相对一致的预测结果。相反,如果输入序列是对抗样本,那么由于对抗扰动是针对原始序列进行优化的,当序列长度发生变化时,扰动的效果会减弱或失效,导致预测结果的不一致性。

技术框架:该方法是一个即插即用的检测框架,可以应用于任何TS-LLM。其主要流程如下:1) 对输入序列进行采样,生成多个不同长度的子序列。2) 使用TS-LLM对每个子序列进行预测。3) 计算不同子序列预测结果之间的相似度,例如使用余弦相似度。4) 将相似度作为检测信号,如果相似度低于某个阈值,则认为输入序列是对抗样本。

关键创新:该方法最重要的创新点在于利用了TS-LLM自身的可变长度输入能力,通过采样诱导的预测差异来检测对抗样本。与传统的对抗样本检测方法相比,该方法不需要对TS-LLM进行任何修改,并且可以有效检测利用全局时间依赖性的对抗扰动。

关键设计:关键设计包括:1) 采样策略:如何选择子序列的长度和位置?论文可能采用了随机采样或滑动窗口采样等策略。2) 相似度度量:如何衡量不同子序列预测结果之间的相似度?论文可能采用了余弦相似度、欧氏距离等度量方法。3) 阈值设定:如何设定相似度阈值来区分良性样本和对抗样本?论文可能采用了统计方法或机器学习方法来自动设定阈值。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在ETTh2、NI和Consumption三个能源数据集上,对TimeGPT、TimesFM和TimeLLM三个TS-LLM均表现出强大的对抗样本检测能力。在黑盒和白盒攻击场景下,该方法均能有效识别对抗样本,且具有较低的误报率。具体性能数据(例如检测准确率、召回率等)需要在论文中查找。

🎯 应用场景

该研究成果可广泛应用于能源互联网、智能电网等领域,保障基于时间序列LLM的能源预测系统的安全性。通过有效检测对抗样本,可以防止恶意攻击者篡改预测结果,从而避免对电力系统的规划和运营造成不良影响。该方法还可推广到其他时间序列预测任务中,例如金融预测、交通预测等。

📄 摘要(原文)

Accurate time-series forecasting is increasingly critical for planning and operations in low-carbon power systems. Emerging time-series large language models (TS-LLMs) now deliver this capability at scale, requiring no task-specific retraining, and are quickly becoming essential components within the Internet-of-Energy (IoE) ecosystem. However, their real-world deployment is complicated by a critical vulnerability: adversarial examples (AEs). Detecting these AEs is challenging because (i) adversarial perturbations are optimized across the entire input sequence and exploit global temporal dependencies, which renders local detection methods ineffective, and (ii) unlike traditional forecasting models with fixed input dimensions, TS-LLMs accept sequences of variable length, increasing variability that complicates detection. To address these challenges, we propose a plug-in detection framework that capitalizes on the TS-LLM's own variable-length input capability. Our method uses sampling-induced divergence as a detection signal. Given an input sequence, we generate multiple shortened variants and detect AEs by measuring the consistency of their forecasts: Benign sequences tend to produce stable predictions under sampling, whereas adversarial sequences show low forecast similarity, because perturbations optimized for a full-length sequence do not transfer reliably to shorter, differently-structured subsamples. We evaluate our approach on three representative TS-LLMs (TimeGPT, TimesFM, and TimeLLM) across three energy datasets: ETTh2 (Electricity Transformer Temperature), NI (Hourly Energy Consumption), and Consumption (Hourly Electricity Consumption and Production). Empirical results confirm strong and robust detection performance across both black-box and white-box attack scenarios, highlighting its practicality as a reliable safeguard for TS-LLM forecasting in real-world energy systems.