ATLAS: A Layered Constraint-Guided Framework for Structured Artifact Generation in LLM-Assisted MDE
作者: Tong Ma, Hui Lai, Hui Wang, Zhenhu Tian, Chaochao Li, Fengjie Xu, Ling Fang
分类: cs.SE, cs.AI
发布日期: 2026-04-07
💡 一句话要点
ATLAS:一种分层约束引导框架,用于LLM辅助的MDE中结构化工件生成
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: LLM 模型驱动工程 结构化生成 约束引导 AUTOSAR
📋 核心要点
- 现有方法难以保证LLM生成结构化工程工件时满足严格的模式、领域规则和审计需求。
- ATLAS框架将生成过程置于模型驱动的工作流中,分离领域表示、约束编译和生成后验证,实现约束引导的生成。
- 实验表明,ATLAS在AUTOSAR工件生成中能有效保证结构有效性,并将高级故障转化为可诊断对象。
📝 摘要(中文)
ATLAS是一个约束引导的生成框架,用于生成结构化的工程工件,这些工件必须满足显式的模式、领域规则和审计需求。ATLAS没有将大型语言模型视为独立的生成器,而是将生成过程置于模型驱动的工作流中,该工作流分离了领域表示、约束编译和生成后验证。ATLAS结合了三个组件:元模型集成阶段构建领域实体和关系的类型化表示;在本研究中,它在权威的AUTOSAR元模型资产上运行。集成约束模型(ICM)将异构需求编译为两个操作层:生成时结构约束和生成后语义/逻辑义务。约束引导、验证支持的生成(CVG)然后结合了第一层约束解码、第二层后端验证和审计引导的修复。在AUTOSAR实例化中,这些第二层义务通过SHACL/SMT风格的检查来实现,说明了相同的ICM如何连接到特定领域的验证后端。我们在单文件和多文件规模的AUTOSAR工件生成上评估了ATLAS。在评估的AUTOSAR环境中,ATLAS始终生成模式有效的单文件输出,并在多文件规模上保持完美的文件完整性和XSD有效性,而SHACL/SMT检查和结果分析继续暴露残留的系统级缺陷。因此,经验结果表明这是一种有界自动化:ATLAS确保了结构有效性,并将更高级别的故障转化为生成工作流中显式的、可诊断的对象。
🔬 方法详解
问题定义:现有方法在利用大型语言模型(LLM)生成结构化工程工件时,难以同时满足显式的模式、领域规则和审计需求。直接使用LLM进行生成,容易产生不符合规范的输出,导致后续验证和集成困难。现有方法缺乏对生成过程的有效约束和验证机制,难以保证生成工件的质量和可靠性。
核心思路:ATLAS的核心思路是将LLM的生成过程嵌入到一个模型驱动的框架中,通过显式地表示领域知识、编译约束条件,并在生成前后进行验证,从而引导LLM生成符合规范的结构化工件。这种方法将生成过程分解为多个可控的阶段,使得每个阶段都可以针对特定目标进行优化和验证。
技术框架:ATLAS框架包含三个主要组件:1) 元模型集成阶段:构建领域实体和关系的类型化表示,例如使用AUTOSAR元模型。2) 集成约束模型(ICM):将异构需求编译为两个操作层,包括生成时结构约束(Layer 1)和生成后语义/逻辑义务(Layer 2)。3) 约束引导、验证支持的生成(CVG):结合Layer 1约束解码、Layer 2后端验证和审计引导的修复。
关键创新:ATLAS的关键创新在于其分层约束引导的生成框架,它将约束条件分为生成时结构约束和生成后语义/逻辑义务,并分别采用不同的机制进行处理。这种分层约束机制能够更有效地引导LLM生成符合规范的结构化工件,并提高生成过程的可靠性和可控性。此外,ATLAS还通过集成领域特定的验证后端(如SHACL/SMT检查)来实现对生成工件的语义和逻辑验证。
关键设计:ATLAS的关键设计包括:1) 使用元模型来显式地表示领域知识,从而为生成过程提供结构化的指导。2) 将约束条件编译为两个操作层,分别在生成时和生成后进行应用,从而实现更精细的约束控制。3) 集成领域特定的验证后端,从而对生成工件进行语义和逻辑验证。4) 采用审计引导的修复机制,从而在发现错误时能够自动进行修复。
🖼️ 关键图片
📊 实验亮点
ATLAS在AUTOSAR工件生成任务上进行了评估,实验结果表明,ATLAS能够始终生成模式有效的单文件输出,并在多文件规模上保持完美的文件完整性和XSD有效性。虽然SHACL/SMT检查和结果分析仍然暴露了一些残留的系统级缺陷,但ATLAS有效地确保了结构有效性,并将高级故障转化为可诊断的对象,从而实现了有界自动化。
🎯 应用场景
ATLAS框架可应用于各种需要生成结构化工程工件的领域,例如汽车电子、航空航天、软件工程等。它可以帮助工程师自动化生成符合规范的设计文档、配置文件、代码等,从而提高开发效率和质量。此外,ATLAS还可以用于验证现有工件的合规性,从而确保系统的可靠性和安全性。未来,ATLAS有望与更多的领域知识库和验证工具集成,从而实现更广泛的应用。
📄 摘要(原文)
ATLAS is a constraint-guided generation framework for structured engineering artifacts whose outputs must satisfy explicit schemas, domain rules, and audit requirements. Rather than treating a large language model as a standalone generator, ATLAS places generation inside a model-driven workflow that separates domain representation, constraint compilation, and post-generation validation. ATLAS combines three components. A metamodel-integration stage builds a typed representation of domain entities and relations; in this study, it operates over authoritative AUTOSAR meta-model assets. An Integrated Constraint Model (ICM) compiles heterogeneous requirements into two operational layers: generation-time structural constraints and post-generation semantic/logical obligations. Constraint-Guided, Validation-Backed Generation (CVG) then combines Layer~1 constrained decoding, Layer~2 backend validation, and audit-guided repair. In the AUTOSAR instantiation, these Layer~2 obligations are realized through SHACL/SMT-style checks, illustrating how the same ICM can be connected to domain-specific validation backends. We evaluate ATLAS on AUTOSAR artifact generation at both single-file and multi-file scales. In the evaluated AUTOSAR setting, ATLAS consistently produces schema-valid single-file outputs and preserves perfect file completeness and XSD validity at multi-file scale, while SHACL/SMT checks and result analysis continue to expose residual system-level defects. The empirical picture is therefore one of bounded automation: ATLAS secures structural validity and turns higher-level failures into explicit, diagnosable objects within the generation workflow.