A Solver-Aided Hierarchical Language for LLM-Driven CAD Design

📄 arXiv: 2502.09819v1 📥 PDF

作者: Benjamin T. Jones, Felix Hähnlein, Zihan Zhang, Maaz Ahmad, Vladimir Kim, Adriana Schulz

分类: cs.CV, cs.AI, cs.GR, cs.LG, cs.PL

发布日期: 2025-02-13


💡 一句话要点

提出AIDL:一种求解器辅助的分层语言,用于LLM驱动的CAD设计

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: CAD设计 大型语言模型 领域特定语言 几何约束求解器 生成式设计

📋 核心要点

  1. 现有LLM在CAD设计中生成程序几何体时,由于缺乏空间推理能力和长程规划能力而面临挑战。
  2. 论文提出了一种名为AIDL的求解器辅助分层DSL,将空间推理需求转移到几何约束求解器,从而简化LLM的设计流程。
  3. 实验表明,在少样本学习中,AIDL在视觉效果和对象可处理性方面均优于OpenSCAD等现有方法。

📝 摘要(中文)

大型语言模型(LLM)在解决各种结构化和非结构化生成任务方面取得了巨大成功,但它们在计算机辅助设计(CAD)中生成程序几何体时却面临挑战。这些困难源于缺乏空间推理能力,以及需要引导模型通过复杂的、长期的规划来生成复杂的几何体。我们通过引入一种求解器辅助的分层领域特定语言(DSL)AIDL,利用LLM实现生成式CAD设计,该语言将空间推理需求转移到几何约束求解器。此外,我们表明,在少样本情况下,AIDL甚至优于具有训练数据(OpenSCAD)的语言,无论是在生成更接近提示的视觉结果方面,还是在创建更易于后处理和推理的对象方面。

🔬 方法详解

问题定义:LLM在CAD设计中生成复杂几何体时面临挑战。现有的方法,例如直接使用LLM生成CAD代码(如OpenSCAD),往往难以进行精确的空间推理和长程规划,导致生成结果不准确,难以控制,并且难以进行后处理和修改。这些问题限制了LLM在CAD领域的应用。

核心思路:论文的核心思路是利用领域特定语言(DSL)来简化LLM生成CAD模型的过程,并结合几何约束求解器来处理空间推理。通过将复杂的几何约束求解任务交给专门的求解器,LLM只需要生成高级的、描述性的指令,从而降低了LLM的负担,提高了生成结果的准确性和可控性。

技术框架:该方法的核心是AIDL(A Solver-Aided Hierarchical Language),它是一种分层的DSL,允许用户以高级的方式描述CAD模型。整个流程包括:1) 用户提供自然语言描述;2) LLM将自然语言描述翻译成AIDL代码;3) AIDL代码被几何约束求解器解析,生成最终的CAD模型。这种分层结构使得LLM可以专注于高层次的语义理解和规划,而将底层的几何计算交给求解器。

关键创新:最重要的创新点在于AIDL的设计,它是一种专门为CAD设计量身定制的DSL,能够有效地表达几何约束和设计意图。与直接使用通用编程语言(如Python)或现有的CAD语言(如OpenSCAD)相比,AIDL更加简洁、易于理解,并且更易于LLM生成。此外,结合几何约束求解器,使得AIDL能够处理复杂的空间关系,从而生成更准确、更可靠的CAD模型。

关键设计:AIDL采用分层结构,允许用户以不同的抽象级别描述CAD模型。例如,用户可以先描述模型的整体结构,然后再逐步细化每个部分的细节。AIDL还支持参数化设计,允许用户通过调整参数来修改模型的形状和尺寸。此外,AIDL与几何约束求解器紧密集成,允许用户定义各种几何约束,例如点到线的距离、角度关系等。这些约束被求解器用来生成满足约束条件的CAD模型。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在少样本学习条件下,AIDL在生成视觉上更接近prompt的CAD模型以及生成更易于后处理和推理的对象方面,均优于使用OpenSCAD的LLM。具体来说,AIDL能够生成更符合用户意图的几何形状,并且生成的CAD模型更容易进行修改和优化。这些结果表明,AIDL是一种有效的LLM驱动的CAD设计方法。

🎯 应用场景

该研究成果可应用于自动化CAD设计、定制化产品设计、建筑设计等领域。通过结合LLM和几何约束求解器,可以实现更加智能、高效的CAD设计流程,降低设计成本,缩短设计周期。未来,该方法有望应用于更广泛的工程设计领域,例如机械设计、电子设计等。

📄 摘要(原文)

Large language models (LLMs) have been enormously successful in solving a wide variety of structured and unstructured generative tasks, but they struggle to generate procedural geometry in Computer Aided Design (CAD). These difficulties arise from an inability to do spatial reasoning and the necessity to guide a model through complex, long range planning to generate complex geometry. We enable generative CAD Design with LLMs through the introduction of a solver-aided, hierarchical domain specific language (DSL) called AIDL, which offloads the spatial reasoning requirements to a geometric constraint solver. Additionally, we show that in the few-shot regime, AIDL outperforms even a language with in-training data (OpenSCAD), both in terms of generating visual results closer to the prompt and creating objects that are easier to post-process and reason about.