Large Language Model-Based Framework for Explainable Cyberattack Detection in Automatic Generation Control Systems

作者: Muhammad Sharshar, Ahmad Mohammad Saber, Davor Svetinovic, Amr M. Youssef, Deepa Kundur, Ehab F. El-Saadany

分类: cs.CR, cs.AI, eess.SY

发布日期: 2025-07-29 (更新: 2025-08-26)

备注: Accepted Paper

💡 一句话要点

提出基于大语言模型的网络攻击可解释检测框架，用于自动发电控制系统

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 智能电网安全 虚假数据注入攻击 自动发电控制 大语言模型 可解释性AI

📋 核心要点

现有智能电网攻击检测模型决策过程不透明，限制了操作员信任和实际应用。
提出混合框架，结合轻量级机器学习攻击检测和大型语言模型生成的自然语言解释。
实验表明，该框架在保证实时检测的同时，提供了可解释且准确的攻击解释。

📝 摘要（中文）

智能电网日益增长的数字化提高了运行效率，但也引入了新的网络安全漏洞，例如针对自动发电控制（AGC）系统的虚假数据注入攻击（FDIA）。虽然机器学习（ML）和深度学习（DL）模型在检测此类攻击方面显示出前景，但其不透明的决策过程限制了操作员的信任和实际应用。本文提出了一种混合框架，该框架集成了基于轻量级ML的攻击检测与由大型语言模型（LLM）生成的自然语言解释。LightGBM等分类器实现了高达95.13%的攻击检测准确率，推理延迟仅为0.004秒。在检测到网络攻击后，系统调用LLM，包括GPT-3.5 Turbo、GPT-4 Turbo和GPT-4o mini，以生成对该事件的人工可读解释。在100个测试样本上进行评估，采用20-shot prompting的GPT-4o mini在识别攻击目标方面实现了93%的准确率，在估计攻击幅度方面实现了0.075 pu的平均绝对误差，在估计攻击发生时间方面实现了2.19秒的平均绝对误差（MAE）。这些结果表明，所提出的框架有效地平衡了实时检测与可解释的、高保真解释，满足了智能电网网络安全中对可操作AI的关键需求。

🔬 方法详解

问题定义：论文旨在解决智能电网中自动发电控制（AGC）系统面临的虚假数据注入攻击（FDIA）检测问题。现有基于机器学习和深度学习的攻击检测方法虽然有效，但其决策过程缺乏透明度，难以让操作员理解攻击原因和影响，从而降低了信任度，限制了实际应用。

核心思路：论文的核心思路是将轻量级的机器学习模型（如LightGBM）用于快速、准确的攻击检测，并利用大型语言模型（LLM）生成对检测结果的自然语言解释。通过这种混合方法，既能保证实时性，又能提供可解释性，从而提高操作员的信任度。

技术框架：该框架包含两个主要模块：攻击检测模块和解释生成模块。攻击检测模块使用LightGBM等轻量级机器学习模型，基于智能电网的实时数据进行攻击检测。一旦检测到攻击，系统将相关数据输入到解释生成模块。解释生成模块使用大型语言模型（如GPT-3.5 Turbo、GPT-4 Turbo和GPT-4o mini），通过prompting技术生成对攻击事件的自然语言解释，包括攻击目标、攻击幅度、攻击发生时间等信息。

关键创新：该论文的关键创新在于将大型语言模型引入到智能电网的网络安全领域，用于生成可解释的攻击解释。与传统的黑盒模型相比，该框架能够提供更深入的攻击理解，帮助操作员更好地应对网络安全威胁。此外，论文还探索了不同的LLM和prompting策略，以提高解释的准确性和可靠性。

关键设计：论文使用了LightGBM作为攻击检测模型，因为它具有训练速度快、推理延迟低等优点，适合于实时应用。在解释生成模块中，论文采用了20-shot prompting策略，即在prompt中提供20个攻击案例及其解释，以引导LLM生成更准确的解释。此外，论文还针对不同的LLM进行了参数调优，以获得最佳的解释效果。

🖼️ 关键图片

📊 实验亮点

实验结果表明，LightGBM分类器实现了高达95.13%的攻击检测准确率，推理延迟仅为0.004秒。采用20-shot prompting的GPT-4o mini在识别攻击目标方面实现了93%的准确率，在估计攻击幅度方面实现了0.075 pu的平均绝对误差，在估计攻击发生时间方面实现了2.19秒的平均绝对误差（MAE）。这些结果表明，该框架在保证实时检测的同时，提供了高保真、可解释的攻击解释。

🎯 应用场景

该研究成果可应用于智能电网的网络安全监控系统，帮助电力公司实时检测和理解网络攻击，提高电网的安全性。此外，该框架也可推广到其他关键基础设施的网络安全领域，例如交通运输、金融服务等，具有广泛的应用前景和实际价值。未来，该研究可以进一步探索如何利用LLM进行攻击预测和防御，提升网络安全的主动性。

📄 摘要（原文）

The increasing digitization of smart grids has improved operational efficiency but also introduced new cybersecurity vulnerabilities, such as False Data Injection Attacks (FDIAs) targeting Automatic Generation Control (AGC) systems. While machine learning (ML) and deep learning (DL) models have shown promise in detecting such attacks, their opaque decision-making limits operator trust and real-world applicability. This paper proposes a hybrid framework that integrates lightweight ML-based attack detection with natural language explanations generated by Large Language Models (LLMs). Classifiers such as LightGBM achieve up to 95.13% attack detection accuracy with only 0.004 s inference latency. Upon detecting a cyberattack, the system invokes LLMs, including GPT-3.5 Turbo, GPT-4 Turbo, and GPT-4o mini, to generate human-readable explanation of the event. Evaluated on 100 test samples, GPT-4o mini with 20-shot prompting achieved 93% accuracy in identifying the attack target, a mean absolute error of 0.075 pu in estimating attack magnitude, and 2.19 seconds mean absolute error (MAE) in estimating attack onset. These results demonstrate that the proposed framework effectively balances real-time detection with interpretable, high-fidelity explanations, addressing a critical need for actionable AI in smart grid cybersecurity.

Large Language Model-Based Framework for Explainable Cyberattack Detection in Automatic Generation Control Systems

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理