In-Context Autonomous Network Incident Response: An End-to-End Large Language Model Agent Approach

📄 arXiv: 2602.13156v1 📥 PDF

作者: Yiran Gao, Kim Hammar, Tao Li

分类: cs.CR, cs.AI

发布日期: 2026-02-13

备注: 2026 AAAI Summer Symposium on Human-Aware AI Agents for the Cyber Battlefield


💡 一句话要点

提出基于LLM的端到端Agent,用于自主网络事件响应,无需手工建模。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 网络安全 事件响应 自主Agent 上下文学习

📋 核心要点

  1. 现有网络事件响应系统依赖手工建模的模拟器,无法有效利用原始系统日志的语义信息。
  2. 论文提出一种基于大型语言模型的端到端agent,通过上下文学习实现自主事件响应规划。
  3. 实验结果表明,该agent在事件恢复速度上优于现有前沿LLM,提升高达23%。

📝 摘要(中文)

快速演进的网络攻击需要能够自主学习和适应不断变化的威胁的事件响应系统。先前的工作广泛探索了强化学习方法,该方法涉及通过大量事件模拟来学习响应策略。虽然这种方法可能有效,但它需要手工建模模拟器,并抑制来自原始系统日志和警报的有用语义。为了解决这些限制,我们建议利用大型语言模型(LLM)的预训练安全知识和上下文学习,为事件响应规划创建一个端到端agent解决方案。具体来说,我们的agent将感知、推理、规划和行动四种功能集成到一个轻量级LLM(14b模型)中。通过微调和思维链推理,我们的LLM agent能够处理系统日志并推断底层网络状态(感知),更新其对攻击模型的推测(推理),模拟不同响应策略下的后果(规划),并生成有效的响应(行动)。通过将LLM模拟的结果与实际观察结果进行比较,LLM agent反复改进其攻击推测和相应的响应,从而展示了上下文适应。我们的agent方法无需建模,并且可以在通用硬件上运行。当在文献中报告的事件日志上进行评估时,我们的agent实现的恢复速度比前沿LLM快23%。

🔬 方法详解

问题定义:现有网络事件响应系统依赖于强化学习方法,需要手工构建复杂的模拟环境来训练响应策略。这种方法不仅耗时耗力,而且难以捕捉真实网络环境的复杂性和动态性,同时忽略了系统日志中蕴含的丰富语义信息。因此,如何构建一个能够自主学习、适应变化的网络威胁,并有效利用系统日志信息的事件响应系统是一个亟待解决的问题。

核心思路:论文的核心思路是利用大型语言模型(LLM)强大的预训练知识和上下文学习能力,构建一个端到端的agent,直接从原始系统日志中学习并生成响应策略。通过将感知、推理、规划和行动集成到同一个LLM中,agent可以模拟不同响应策略的效果,并根据实际观察结果不断优化其攻击推测和响应策略,从而实现自主适应。

技术框架:该agent的整体架构包含四个主要模块:感知模块负责处理系统日志,推断网络状态;推理模块负责更新对攻击模型的推测;规划模块负责模拟不同响应策略的后果;行动模块负责生成有效的响应。这四个模块集成在一个14b的LLM中,通过微调和思维链推理实现。agent通过比较LLM模拟的结果与实际观察结果,不断迭代优化攻击推测和响应策略。

关键创新:该论文最重要的技术创新在于利用LLM的上下文学习能力,构建了一个无需手工建模的端到端agent。与传统的强化学习方法相比,该agent可以直接从原始系统日志中学习,避免了手工建模带来的偏差和局限性。此外,该agent还能够通过模拟不同响应策略的效果,并根据实际观察结果进行迭代优化,从而实现自主适应。

关键设计:论文的关键设计包括:1) 使用14b的LLM作为agent的核心;2) 通过微调和思维链推理增强LLM的感知、推理、规划和行动能力;3) 设计了一种迭代优化机制,通过比较LLM模拟的结果与实际观察结果,不断改进攻击推测和响应策略。具体的参数设置、损失函数和网络结构等技术细节在论文中未详细描述,属于未知信息。

📊 实验亮点

实验结果表明,该agent在事件恢复速度上优于现有前沿LLM,提升高达23%。该agent能够在通用硬件上运行,无需昂贵的计算资源,具有较强的实用性。此外,该agent无需手工建模,可以快速部署到新的网络环境中,具有良好的可扩展性。

🎯 应用场景

该研究成果可应用于自动化网络安全运营中心(SOC),实现对网络攻击事件的快速响应和自动化处理。该agent可以帮助安全分析师快速识别攻击类型、评估潜在风险,并制定有效的应对策略,从而提高网络安全防御能力,降低安全事件造成的损失。未来,该技术有望应用于更复杂的网络安全场景,例如云安全、物联网安全等。

📄 摘要(原文)

Rapidly evolving cyberattacks demand incident response systems that can autonomously learn and adapt to changing threats. Prior work has extensively explored the reinforcement learning approach, which involves learning response strategies through extensive simulation of the incident. While this approach can be effective, it requires handcrafted modeling of the simulator and suppresses useful semantics from raw system logs and alerts. To address these limitations, we propose to leverage large language models' (LLM) pre-trained security knowledge and in-context learning to create an end-to-end agentic solution for incident response planning. Specifically, our agent integrates four functionalities, perception, reasoning, planning, and action, into one lightweight LLM (14b model). Through fine-tuning and chain-of-thought reasoning, our LLM agent is capable of processing system logs and inferring the underlying network state (perception), updating its conjecture of attack models (reasoning), simulating consequences under different response strategies (planning), and generating an effective response (action). By comparing LLM-simulated outcomes with actual observations, the LLM agent repeatedly refines its attack conjecture and corresponding response, thereby demonstrating in-context adaptation. Our agentic approach is free of modeling and can run on commodity hardware. When evaluated on incident logs reported in the literature, our agent achieves recovery up to 23% faster than those of frontier LLMs.