APIOT: Autonomous Vulnerability Management Across Bare-Metal Industrial OT Networks
作者: Adel ElZemity, Budi Arief, Shujun Li, Calvin Brierley, Yichao Wang, Yuxiang Huang, James Pope, Haoxiang Li, George Oikonomou
分类: cs.CR, cs.AI
发布日期: 2026-05-04
💡 一句话要点
APIOT:实现裸机工业OT网络漏洞自主管理的框架
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 工业物联网安全 自主渗透测试 大型语言模型 裸机OT设备 漏洞管理
📋 核心要点
- 现有自主渗透测试方法难以应用于裸机OT设备,因为裸机OT缺乏LLM熟悉的shell和文件系统。
- APIOT框架通过让LLM直接基于协议字段和解析器语义进行推理,实现了对裸机OT设备的自主攻击和修复。
- 实验结果表明,APIOT在异构IIoT拓扑的Zephyr RTOS固件上实现了90%的攻击-修复周期成功率。
📝 摘要(中文)
裸机工控技术(OT)设备,特别是运行Modbus/TCP和CoAP的微控制器,一直未能受到自主安全攻击的保护。现有的自主渗透测试研究主要针对Linux和Web系统,这些系统的shell和文件系统对于LLM代理来说是熟悉的。裸机OT既没有这些,因此代理必须直接基于协议字段和解析器语义进行推理。这需要新的行动空间设计和运行时控制,并引发关于协议级漏洞利用推理及其部署范围的新研究问题。我们提出了APIOT(用于工业OT的自主紫队),这是第一个大型语言模型(LLM)框架,展示了对裸机OT设备的自主攻击和修复,实现了完整的发现->利用->修补->验证周期,无需逐步的人工干预。我们在异构工业物联网(IIoT)拓扑结构的Zephyr RTOS固件上实施并评估了这个框架。通过跨越五个前沿LLM、三个网络拓扑、两个损伤级别以及引导与非引导条件的290次实验运行,APIOT在完整的攻击-修复周期中实现了90.0%的任务成功率。我们发现运行时治理层(我们称之为监督者)是一个关键的工程变量:没有它,代理会表现出系统的退化模式,包括重复循环、缺少崩溃验证和侦察死锁。总之,这些发现具有超出我们测试平台的两个含义。攻击者专业知识不再是裸机OT利用的约束性因素,防御者的威胁模型现在必须假设能够针对工业固件执行自主发现-修复周期的LLM增强型对手。
🔬 方法详解
问题定义:现有自主渗透测试方法主要针对Linux和Web系统,无法直接应用于裸机OT设备。裸机OT设备缺乏LLM代理熟悉的shell和文件系统,使得代理难以进行漏洞发现和利用。因此,需要一种新的方法,使LLM代理能够直接基于协议字段和解析器语义进行推理,从而实现对裸机OT设备的自主攻击和修复。
核心思路:APIOT的核心思路是构建一个基于LLM的自主紫队框架,该框架能够自动执行漏洞发现、利用、修补和验证的完整周期,而无需人工干预。该框架通过设计新的行动空间和运行时控制,使LLM代理能够直接与裸机OT设备进行交互,并基于协议字段和解析器语义进行推理。
技术框架:APIOT框架包含以下主要模块:1) LLM代理:负责制定攻击和修复策略;2) 行动空间:定义了LLM代理可以执行的操作,例如发送网络请求、解析协议字段等;3) 运行时治理层(监督者):负责监控LLM代理的行为,防止出现重复循环、缺少崩溃验证和侦察死锁等问题;4) 目标环境:包含裸机OT设备和网络拓扑。整个流程包括:LLM代理首先进行漏洞发现,然后利用漏洞进行攻击,接着进行漏洞修补,最后进行验证,确保漏洞已被成功修复。
关键创新:APIOT最重要的技术创新点在于它首次实现了对裸机OT设备的自主攻击和修复,而无需人工干预。与现有方法相比,APIOT能够直接基于协议字段和解析器语义进行推理,从而克服了裸机OT设备缺乏shell和文件系统的限制。此外,APIOT还引入了运行时治理层(监督者),用于监控LLM代理的行为,防止出现退化模式。
关键设计:APIOT的关键设计包括:1) 行动空间的设计:行动空间需要包含足够的操作,以便LLM代理能够与裸机OT设备进行交互,并执行攻击和修复任务;2) 运行时治理层(监督者)的设计:监督者需要能够有效地监控LLM代理的行为,并及时干预,防止出现退化模式;3) LLM的选择和训练:选择合适的LLM,并对其进行训练,使其能够理解协议字段和解析器语义,并制定有效的攻击和修复策略。
🖼️ 关键图片
📊 实验亮点
APIOT在异构IIoT拓扑的Zephyr RTOS固件上进行了评估,通过290次实验运行,在完整的攻击-修复周期中实现了90.0%的任务成功率。实验结果表明,运行时治理层(监督者)是APIOT的关键组件,能够有效防止LLM代理出现退化模式,提高攻击和修复的成功率。
🎯 应用场景
APIOT可应用于工业控制系统(ICS)的安全评估和渗透测试,帮助企业发现和修复潜在的安全漏洞。该研究成果还可用于开发自动化安全防御系统,提高工业控制系统的安全性。未来,APIOT有望成为工业物联网安全领域的重要工具,降低工控系统遭受攻击的风险。
📄 摘要(原文)
Bare-metal operational technology (OT) devices -- especially the microcontrollers running Modbus/TCP and CoAP at the base of industrial control systems -- have remained outside the reach of autonomous security attacks. Prior autonomous pentesting studies target Linux and web systems, whose shells and filesystems are familiar to LLM agents. Bare-metal OT has neither, so agents must reason directly over protocol fields and parser semantics. This requires new action-space designs and runtime controls, and opens new research questions about protocol-level exploit reasoning and its deployment envelope. We present APIOT (Autonomous Purple-teaming for Industrial OT), the first large language model (LLM) framework demonstrating an autonomous attack and remediation of bare-metal OT devices, achieving the full discovery -> exploitation -> patching -> verification cycle without step-by-step human intervention. We implemented and evaluated this framework on Zephyr RTOS firmware across heterogeneous industrial IoT (IIoT) topologies. Through 290 experiment runs spanning five frontier LLMs, three network topologies, two impairment levels, and guided versus unguided conditions, APIOT achieved a mission success rate of 90.0% on the full attack-remediation cycle. We found that the runtime governance layer (which we call an overseer) is a critical engineering variable: without it, agents exhibit systematic degenerate patterns, including repetition loops, missing crash verification, and reconnaissance deadlocks. Together, these findings carry two implications beyond our testbed. Attacker expertise is no longer the binding constraint on bare-metal OT exploitation, and defender threat models must now assume LLM-augmented adversaries capable of executing autonomous discovery-through-remediation cycles against industrial firmware.