Towards High-Fidelity CAD Generation via LLM-Driven Program Generation and Text-Based B-Rep Primitive Grounding

作者: Jiahao Li, Qingwang Zhang, Qiuyu Chen, Guozhan Qiu, Yunzhong Lou, Xiangdong Zhou

分类: cs.CV

发布日期: 2026-03-12

备注: preprint

💡 一句话要点

FutureCAD：提出基于LLM驱动程序生成和文本B-Rep基元接地的CAD高保真生成框架

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: CAD生成 大型语言模型 B-Rep 文本查询 几何基元 参数化建模 强化学习

📋 核心要点

现有CAD生成方法在参数化建模和B-Rep合成之间存在割裂，无法有效处理复杂工业产品的设计。
FutureCAD利用LLM生成CadQuery脚本，并通过文本查询机制和BRepGround实现几何基元的精确选择和定位。
通过构建真实CAD模型数据集，并结合监督微调和强化学习，FutureCAD显著提升了CAD生成的性能。

📝 摘要（中文）

计算机辅助设计(CAD)生成领域近年来取得了显著进展。现有方法通常分为参数化CAD建模和直接边界表示(B-Rep)合成两大类。在现代基于特征的CAD系统中，参数化建模和B-Rep本质上是相互交织的，因为高级参数化操作(例如，圆角和倒角)需要显式选择B-Rep几何基元，并且B-Rep本身是从参数化操作派生的。因此，这种范式差距仍然是限制人工智能驱动的复杂工业产品CAD建模的关键因素。本文提出FutureCAD，一种新颖的文本到CAD框架，它利用大型语言模型(LLM)和一个B-Rep接地转换器(BRepGround)来实现高保真CAD生成。我们的方法生成可执行的CadQuery脚本，并引入了一种基于文本的查询机制，使LLM能够通过自然语言指定几何选择，然后BRepGround将其接地到目标基元。为了训练我们的框架，我们构建了一个包含真实CAD模型的新数据集。对于LLM，我们应用监督微调(SFT)来建立基本的CAD生成能力，然后进行强化学习(RL)来提高泛化能力。实验表明，FutureCAD实现了最先进的CAD生成性能。

🔬 方法详解

问题定义：现有CAD生成方法，如参数化建模和直接B-Rep合成，彼此独立，无法有效结合。在现代CAD系统中，参数化建模和B-Rep是紧密关联的，高级参数化操作依赖于对B-Rep几何基元的选择。因此，如何弥合参数化建模和B-Rep合成之间的鸿沟，实现复杂工业产品的AI驱动CAD建模，是一个关键问题。

核心思路：FutureCAD的核心思路是利用大型语言模型(LLM)生成可执行的CadQuery脚本，并通过文本查询机制，使LLM能够以自然语言指定几何选择。然后，使用B-Rep接地转换器(BRepGround)将这些文本描述的几何选择映射到具体的B-Rep基元上。这种方法将参数化建模和B-Rep合成结合起来，实现了高保真CAD生成。

技术框架：FutureCAD框架包含以下主要模块：1) LLM：负责生成CadQuery脚本，并使用文本查询机制指定几何选择。2) BRepGround：负责将LLM生成的文本描述的几何选择映射到具体的B-Rep基元上。3) 数据集：包含真实CAD模型，用于训练LLM和BRepGround。4) 训练策略：采用监督微调(SFT)和强化学习(RL)相结合的训练策略，提高LLM的CAD生成能力和泛化能力。

关键创新：FutureCAD的关键创新在于引入了文本查询机制和BRepGround，实现了LLM对B-Rep几何基元的精确选择和定位。这使得LLM能够生成更精确、更符合设计意图的CAD模型。与现有方法相比，FutureCAD能够更好地处理复杂工业产品的CAD建模。

关键设计：BRepGround的具体网络结构未知，但其核心功能是将文本描述的几何选择映射到具体的B-Rep基元。LLM的训练采用了监督微调(SFT)和强化学习(RL)相结合的策略。SFT用于建立基本的CAD生成能力，RL用于提高泛化能力。数据集的构建也至关重要，需要包含足够多的真实CAD模型，以保证模型的训练效果。

🖼️ 关键图片

📊 实验亮点

FutureCAD通过实验验证了其在CAD生成方面的优越性能，达到了最先进的水平。具体的性能数据和对比基线在论文中给出，表明FutureCAD在生成CAD模型的准确性和效率方面均有显著提升。通过引入文本查询机制和BRepGround，FutureCAD能够更好地理解设计意图，生成更符合要求的CAD模型。

🎯 应用场景

FutureCAD具有广泛的应用前景，可用于自动化产品设计、定制化产品制造、逆向工程等领域。该研究成果有助于提高CAD设计的效率和质量，降低设计成本，并促进人工智能在工业设计领域的应用。未来，该技术有望应用于更复杂的CAD建模任务，并与其他AI技术相结合，实现更智能化的设计流程。

📄 摘要（原文）

The field of Computer-Aided Design (CAD) generation has made significant progress in recent years. Existing methods typically fall into two separate categorie: parametric CAD modeling and direct boundary representation (B-Rep) synthesis. In modern feature-based CAD systems, parametric modeling and B-Rep are inherently intertwined, as advanced parametric operations (e.g., fillet and chamfer) require explicit selection of B-Rep geometric primitives, and the B-Rep itself is derived from parametric operations. Consequently, this paradigm gap remains a critical factor limiting AI-driven CAD modeling for complex industrial product design. This paper present FutureCAD, a novel text-to-CAD framework that leverages large language models (LLMs) and a B-Rep grounding transformer (BRepGround) for high-fidelity CAD generation. Our method generates executable CadQuery scripts, and introduces a text-based query mechanism that enables the LLM to specify geometric selections via natural language, which BRepGround then grounds to the target primitives. To train our framework, we construct a new dataset comprising real-world CAD models. For the LLM, we apply supervised fine-tuning (SFT) to establish fundamental CAD generation capabilities, followed by reinforcement learning (RL) to improve generalization. Experiments show that FutureCAD achieves state-of-the-art CAD generation performance.

Towards High-Fidelity CAD Generation via LLM-Driven Program Generation and Text-Based B-Rep Primitive Grounding

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理