Towards High-Fidelity CAD Generation via LLM-Driven Program Generation and Text-Based B-Rep Primitive Grounding

📄 arXiv: 2603.11831v1 📥 PDF

作者: Jiahao Li, Qingwang Zhang, Qiuyu Chen, Guozhan Qiu, Yunzhong Lou, Xiangdong Zhou

分类: cs.CV

发布日期: 2026-03-12

备注: preprint


💡 一句话要点

FutureCAD:提出基于LLM驱动程序生成和文本B-Rep基元接地的CAD高保真生成框架

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: CAD生成 大型语言模型 B-Rep 文本查询 几何基元 参数化建模 强化学习

📋 核心要点

  1. 现有CAD生成方法在参数化建模和B-Rep合成之间存在割裂,无法有效处理复杂工业产品的设计。
  2. FutureCAD利用LLM生成CadQuery脚本,并通过文本查询机制和BRepGround实现几何基元的精确选择和定位。
  3. 通过构建真实CAD模型数据集,并结合监督微调和强化学习,FutureCAD显著提升了CAD生成的性能。

📝 摘要(中文)

计算机辅助设计(CAD)生成领域近年来取得了显著进展。现有方法通常分为参数化CAD建模和直接边界表示(B-Rep)合成两大类。在现代基于特征的CAD系统中,参数化建模和B-Rep本质上是相互交织的,因为高级参数化操作(例如,圆角和倒角)需要显式选择B-Rep几何基元,并且B-Rep本身是从参数化操作派生的。因此,这种范式差距仍然是限制人工智能驱动的复杂工业产品CAD建模的关键因素。本文提出FutureCAD,一种新颖的文本到CAD框架,它利用大型语言模型(LLM)和一个B-Rep接地转换器(BRepGround)来实现高保真CAD生成。我们的方法生成可执行的CadQuery脚本,并引入了一种基于文本的查询机制,使LLM能够通过自然语言指定几何选择,然后BRepGround将其接地到目标基元。为了训练我们的框架,我们构建了一个包含真实CAD模型的新数据集。对于LLM,我们应用监督微调(SFT)来建立基本的CAD生成能力,然后进行强化学习(RL)来提高泛化能力。实验表明,FutureCAD实现了最先进的CAD生成性能。

🔬 方法详解

问题定义:现有CAD生成方法,如参数化建模和直接B-Rep合成,彼此独立,无法有效结合。在现代CAD系统中,参数化建模和B-Rep是紧密关联的,高级参数化操作依赖于对B-Rep几何基元的选择。因此,如何弥合参数化建模和B-Rep合成之间的鸿沟,实现复杂工业产品的AI驱动CAD建模,是一个关键问题。

核心思路:FutureCAD的核心思路是利用大型语言模型(LLM)生成可执行的CadQuery脚本,并通过文本查询机制,使LLM能够以自然语言指定几何选择。然后,使用B-Rep接地转换器(BRepGround)将这些文本描述的几何选择映射到具体的B-Rep基元上。这种方法将参数化建模和B-Rep合成结合起来,实现了高保真CAD生成。

技术框架:FutureCAD框架包含以下主要模块:1) LLM:负责生成CadQuery脚本,并使用文本查询机制指定几何选择。2) BRepGround:负责将LLM生成的文本描述的几何选择映射到具体的B-Rep基元上。3) 数据集:包含真实CAD模型,用于训练LLM和BRepGround。4) 训练策略:采用监督微调(SFT)和强化学习(RL)相结合的训练策略,提高LLM的CAD生成能力和泛化能力。

关键创新:FutureCAD的关键创新在于引入了文本查询机制和BRepGround,实现了LLM对B-Rep几何基元的精确选择和定位。这使得LLM能够生成更精确、更符合设计意图的CAD模型。与现有方法相比,FutureCAD能够更好地处理复杂工业产品的CAD建模。

关键设计:BRepGround的具体网络结构未知,但其核心功能是将文本描述的几何选择映射到具体的B-Rep基元。LLM的训练采用了监督微调(SFT)和强化学习(RL)相结合的策略。SFT用于建立基本的CAD生成能力,RL用于提高泛化能力。数据集的构建也至关重要,需要包含足够多的真实CAD模型,以保证模型的训练效果。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

FutureCAD通过实验验证了其在CAD生成方面的优越性能,达到了最先进的水平。具体的性能数据和对比基线在论文中给出,表明FutureCAD在生成CAD模型的准确性和效率方面均有显著提升。通过引入文本查询机制和BRepGround,FutureCAD能够更好地理解设计意图,生成更符合要求的CAD模型。

🎯 应用场景

FutureCAD具有广泛的应用前景,可用于自动化产品设计、定制化产品制造、逆向工程等领域。该研究成果有助于提高CAD设计的效率和质量,降低设计成本,并促进人工智能在工业设计领域的应用。未来,该技术有望应用于更复杂的CAD建模任务,并与其他AI技术相结合,实现更智能化的设计流程。

📄 摘要(原文)

The field of Computer-Aided Design (CAD) generation has made significant progress in recent years. Existing methods typically fall into two separate categorie: parametric CAD modeling and direct boundary representation (B-Rep) synthesis. In modern feature-based CAD systems, parametric modeling and B-Rep are inherently intertwined, as advanced parametric operations (e.g., fillet and chamfer) require explicit selection of B-Rep geometric primitives, and the B-Rep itself is derived from parametric operations. Consequently, this paradigm gap remains a critical factor limiting AI-driven CAD modeling for complex industrial product design. This paper present FutureCAD, a novel text-to-CAD framework that leverages large language models (LLMs) and a B-Rep grounding transformer (BRepGround) for high-fidelity CAD generation. Our method generates executable CadQuery scripts, and introduces a text-based query mechanism that enables the LLM to specify geometric selections via natural language, which BRepGround then grounds to the target primitives. To train our framework, we construct a new dataset comprising real-world CAD models. For the LLM, we apply supervised fine-tuning (SFT) to establish fundamental CAD generation capabilities, followed by reinforcement learning (RL) to improve generalization. Experiments show that FutureCAD achieves state-of-the-art CAD generation performance.