MA-IDS: Multi-Agent RAG Framework for IoT Network Intrusion Detection with an Experience Library

📄 arXiv: 2604.05458v1 📥 PDF

作者: Md Shamimul Islam, Luis G. Jaimes, Ayesha S. Dina

分类: cs.CR, cs.AI

发布日期: 2026-04-07

备注: Preprint. Submitted to IEEE conference


💡 一句话要点

提出MA-IDS:一种基于多Agent RAG框架的物联网入侵检测系统,具备经验库。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 物联网安全 入侵检测系统 大型语言模型 检索增强生成 多Agent系统

📋 核心要点

  1. 现有网络入侵检测系统在检测零日攻击和提供可解释性方面存在不足,尤其是在资源受限的物联网环境中。
  2. MA-IDS利用多Agent架构和检索增强生成技术,通过构建经验库来增强LLM的推理能力,实现持续学习。
  3. 实验表明,MA-IDS在物联网入侵检测数据集上取得了显著的性能提升,并提供了规则级别的可解释性。

📝 摘要(中文)

网络入侵检测系统(NIDS)面临诸多限制。基于签名的方法对已知攻击模式有效,但难以检测零日攻击,并且经常遗漏先前已知攻击的修改变体。许多机器学习方法的可解释性有限。由于资源约束和异构协议,这些挑战在物联网环境中变得更加严峻。为了解决这些问题,我们提出了MA-IDS,一种多Agent入侵检测系统,它结合了大型语言模型(LLM)和检索增强生成(RAG),用于推理驱动的入侵检测。该框架通过一个持久的、自构建的经验库来支持LLM推理。两个专门的Agent通过基于FAISS的向量数据库进行协作:流量分类Agent在每次推理前检索过去的错误规则,以及错误分析Agent将错误分类转换为人类可读的检测规则,存储以供将来检索,从而实现通过外部知识积累的持续学习,而无需修改底层语言模型。在NF-BoT-IoT和NF-ToN-IoT基准数据集上评估,MA-IDS实现了89.75%和85.22%的宏F1分数,比零样本基线提高了超过72和80个百分点,分别提高了17%和4.96%。这些结果与SVM具有竞争力,同时为每个分类决策提供规则级别的解释,表明检索增强推理为物联网网络的可解释、自改进入侵检测提供了一条原则性的道路。

🔬 方法详解

问题定义:论文旨在解决物联网环境中网络入侵检测系统(NIDS)面临的挑战,包括难以检测零日攻击、可解释性差以及资源受限等问题。现有的基于签名的方法和传统的机器学习方法在这些方面都存在明显的局限性。

核心思路:论文的核心思路是利用大型语言模型(LLM)的推理能力,结合检索增强生成(RAG)技术,构建一个多Agent系统,通过一个持久的、自构建的经验库来不断学习和改进入侵检测规则。这种方法旨在提高检测准确率,同时提供可解释的决策依据。

技术框架:MA-IDS框架包含两个主要Agent:流量分类Agent和错误分析Agent。流量分类Agent负责利用LLM和经验库进行流量分类,在每次推理前检索相关的错误规则。错误分析Agent负责将分类错误转化为人类可读的检测规则,并存储到经验库中。两个Agent通过基于FAISS的向量数据库进行协作,实现知识的共享和积累。整体流程包括流量数据输入、流量分类Agent推理、错误分析Agent规则生成和经验库更新。

关键创新:该方法最重要的创新点在于构建了一个自学习的经验库,通过检索增强生成技术,使LLM能够利用外部知识进行推理,从而实现持续学习和改进。与传统的入侵检测方法相比,MA-IDS无需修改底层语言模型,而是通过外部知识的积累来提高检测性能。

关键设计:经验库的设计是关键。它存储了过去错误分类的规则,并使用FAISS进行向量索引,以便快速检索。错误分析Agent将错误分类转化为人类可读的规则,这些规则被表示为向量并存储在经验库中。流量分类Agent在推理前,会检索与当前流量数据最相关的规则,并将其作为上下文提供给LLM,以提高分类准确率。具体的参数设置和损失函数信息未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

MA-IDS在NF-BoT-IoT和NF-ToN-IoT基准数据集上取得了显著的性能提升。在NF-BoT-IoT数据集上,MA-IDS的宏F1分数为89.75%,比零样本基线提高了超过72个百分点。在NF-ToN-IoT数据集上,MA-IDS的宏F1分数为85.22%,比零样本基线提高了超过80个百分点。这些结果与SVM等传统机器学习方法具有竞争力,同时提供了规则级别的可解释性。

🎯 应用场景

MA-IDS可应用于各种物联网网络安全场景,例如智能家居、工业控制系统和智能城市基础设施。该系统能够提高物联网设备的安全性和可靠性,降低遭受网络攻击的风险,并为安全分析人员提供可解释的入侵检测结果,从而更好地理解和应对安全威胁。未来,该技术有望扩展到其他安全领域,例如恶意软件分析和漏洞挖掘。

📄 摘要(原文)

Network Intrusion Detection Systems (NIDS) face important limitations. Signature-based methods are effective for known attack patterns, but they struggle to detect zero-day attacks and often miss modified variants of previously known attacks, while many machine learning approaches offer limited interpretability. These challenges become even more severe in IoT environments because of resource constraints and heterogeneous protocols. To address these issues, we propose MA-IDS, a Multi-Agent Intrusion Detection System that combines Large Language Models (LLMs) with Retrieval Augmented Generation (RAG) for reasoning-driven intrusion detection. The proposed framework grounds LLM reasoning through a persistent, self-building Experience Library. Two specialized agents collaborate through a FAISS-based vector database: a Traffic Classification Agent that retrieves past error rules before each inference, and an Error Analysis Agent that converts misclassifications into human-readable detection rules stored for future retrieval, enabling continual learning through external knowledge accumulation, without modifying the underlying language model. Evaluated on NF-BoT-IoT and NF-ToN-IoT benchmark datasets, MA-IDS achieves Macro F1-Scores of 89.75% and 85.22%, improving over zero-shot baselines of 17% and 4.96% by more than 72 and 80 percentage points. These results are competitive with SVM while providing rule-level explanations for every classification decision, demonstrating that retrieval-augmented reasoning offers a principled path toward explainable, self-improving intrusion detection for IoT networks.