Microskill Architecture: A Modular Skill-Driven Framework for AI-Native Code Generation

📄 arXiv: 2606.05720v1 📥 PDF

作者: Mohammad Zare, Omid Abdolrahmani

分类: cs.SE, cs.AI

发布日期: 2026-06-04


💡 一句话要点

提出MicroSkill架构以解决AI原生代码生成中的上下文管理问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: AI原生开发 代码生成 模块化设计 知识封装 动态路由 自学习机制 上下文管理

📋 核心要点

  1. 现有方法在处理上下文窗口时容易丧失中间序列信息,导致准确性和效率下降。
  2. MicroSkill架构通过将知识划分为原子化的技能胶囊,动态选择与任务相关的胶囊来优化上下文管理。
  3. 实验证明MicroSkill在令牌消耗、编译成功率和架构合规性方面显著提升,展示了其自学习能力。

📝 摘要(中文)

大型语言模型和AI编码代理已经重塑了软件开发,但实现完全AI原生系统面临结构性挑战,尤其是在管理上下文窗口时容易丧失准确性和效率。本文提出MicroSkill架构,这是一种模块化设计范式,灵感来源于微服务,应用于知识封装而非服务分解。该架构将知识划分为原子化、明确范围的技能胶囊,并通过动态路由器选择与任务语义相关的胶囊。通过对一个包含十五个复杂特性的企业内容管理系统的实证案例研究,MicroSkill将令牌消耗减少超过90%,几乎将首次编译成功率翻倍,完全消除了架构违规,并通过自学习机制实现了七个新技能胶囊的自主提取和注册。这些发现表明,MicroSkill架构为构建更高效、更可靠且能够随时间演变的AI原生开发系统提供了可扩展的基础。

🔬 方法详解

问题定义:本文旨在解决在大型语言模型中管理上下文窗口时的结构性挑战,现有方法在注入完整项目文档和代码时容易导致信息丢失和令牌成本上升。

核心思路:MicroSkill架构采用模块化设计,灵感来源于微服务,将知识封装为原子化的技能胶囊,动态路由器根据任务选择相关胶囊,从而提高上下文管理的效率和准确性。

技术框架:该架构包括知识胶囊的创建、动态路由选择和上下文分配三个主要模块。知识胶囊封装特定技能,动态路由器根据任务需求选择合适的胶囊,优化上下文使用。

关键创新:MicroSkill架构的最大创新在于其将知识划分为小型、明确的技能胶囊,并通过动态路由优化上下文分配,这与传统方法的整体输入方式形成鲜明对比。

关键设计:在设计中,采用了基于语义相关性的约束优化模型来进行上下文分配,同时设定了令牌预算以控制资源使用,确保系统的高效性和可扩展性。

📊 实验亮点

实验结果显示,MicroSkill架构将令牌消耗减少超过90%,首次编译成功率几乎翻倍,完全消除了架构违规,并通过自学习机制实现了七个新技能胶囊的自主提取和注册,展现出显著的性能提升。

🎯 应用场景

MicroSkill架构具有广泛的潜在应用场景,特别是在需要高效代码生成和管理的复杂软件开发环境中。其模块化设计使得系统能够灵活适应不同的开发需求,提升开发效率和代码质量,未来可能在企业级软件开发、自动化测试和智能编程助手等领域发挥重要作用。

📄 摘要(原文)

Large language models and AI coding agents have reshaped software development, but the path to fully AI-native systems faces structural challenges. Chief among them is managing context windows without losing accuracy or efficiency. When developers inject full project documentation and code into a model's memory, the model loses mid-sequence information, token costs spiral, and architecture drifts. This paper presents MicroSkill Architecture: a modular design paradigm inspired by microservices, applied to knowledge encapsulation instead of service decomposition. Instead of feeding an agent the entire codebase, the architecture partitions knowledge into atomic, sharply scoped skill capsules, and a dynamic router selects only semantically relevant capsules for the task. We formally model context allocation as constrained optimization over semantic relevance subject to a token budget. An empirical case study an enterprise content management system with fifteen complex features shows that MicroSkill cuts token consumption by over 90%, nearly doubles first-try compilation success rates, eliminates architectural violations entirely, and enables autonomous extraction and registration of seven new skill capsules via a self-learning mechanism. These findings suggest MicroSkill Architecture offers a scalable foundation for building AI-native development systems that are more efficient, more reliable, and capable of evolving over time.