Draw it like Euclid: Teaching transformer models to generate CAD profiles using ruler and compass construction steps

📄 arXiv: 2601.09428v1 📥 PDF

作者: Siyi Li, Joseph G. Lambourne, Longfei Zhang, Pradeep Kumar Jayaraman, Karl. D. D. Willis

分类: cs.LG, cs.GR

发布日期: 2026-01-14


💡 一句话要点

提出基于几何构造步骤的CAD轮廓生成方法,提升Transformer模型性能

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: CAD轮廓生成 几何构造 Transformer模型 参数化设计 强化学习

📋 核心要点

  1. 现有CAD轮廓生成方法缺乏可解释性和参数化编辑能力,难以满足设计师的需求。
  2. 该方法通过引入一系列几何构造步骤,将设计意图显式地编码到模型中,实现可控的CAD轮廓生成。
  3. 实验结果表明,该方法能够有效提高CAD轮廓的生成质量,并且可以通过强化学习进一步优化。

📝 摘要(中文)

本文提出了一种生成计算机辅助设计(CAD)轮廓的新方法,该方法通过一系列简单的几何构造步骤,包括曲线偏移、旋转和相交等操作。这些序列从设计师提供的几何图形开始,逐步构建最终轮廓的点和曲线。实验表明,在设计师的输入几何图形和最终轮廓之间添加构造步骤,可以提高生成质量,类似于语言模型中引入思维链。与参数化CAD模型中的约束类似,构造序列将建模形状的自由度降低到一小组参数值,设计师可以调整这些参数值,并使用构造的几何图形以浮点精度进行参数化编辑。此外,我们还表明,将强化学习应用于构造序列可以进一步提高各种指标,包括一些未明确优化的指标。

🔬 方法详解

问题定义:现有的CAD轮廓生成方法通常是直接从输入几何图形预测最终轮廓,缺乏中间步骤的解释性,难以进行参数化编辑和控制。设计师需要一种更直观、可控的CAD轮廓生成方法,能够像欧几里得几何作图一样,通过一系列简单的几何构造步骤逐步构建最终轮廓。

核心思路:本文的核心思路是将CAD轮廓生成过程分解为一系列简单的几何构造步骤,例如曲线偏移、旋转和相交等。通过这些步骤,模型可以逐步构建最终轮廓,同时保留了设计意图的显式表示。这种方法类似于语言模型中的思维链,可以提高生成质量和可解释性。

技术框架:该方法使用Transformer模型作为核心生成器,输入是设计师提供的初始几何图形,输出是一系列几何构造步骤。每个步骤包括操作类型(例如偏移、旋转、相交)和参数值。模型通过预测这些步骤,逐步构建最终的CAD轮廓。整个流程可以看作是一个序列到序列的生成过程。

关键创新:该方法最重要的创新点在于引入了几何构造步骤作为中间表示,将CAD轮廓生成过程分解为一系列可解释的操作。这与传统的直接预测方法不同,使得模型能够更好地理解设计意图,并生成更精确、可控的轮廓。此外,该方法还结合了强化学习,进一步优化生成结果。

关键设计:在具体实现上,论文使用了标准的Transformer架构,并针对几何构造步骤的特点进行了优化。例如,使用了特定的嵌入方式来表示几何图形和操作类型。损失函数包括两部分:一部分是交叉熵损失,用于训练模型预测正确的操作类型和参数值;另一部分是强化学习奖励,用于优化生成结果的质量。具体参数设置和网络结构细节在论文中有详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在CAD轮廓生成任务上取得了显著的性能提升。与直接预测方法相比,该方法能够生成更精确、更符合设计意图的轮廓。此外,通过强化学习的优化,该方法在多个指标上都取得了进一步的提升,包括轮廓的平滑度、对称性和整体美观度。具体数据未知。

🎯 应用场景

该研究成果可应用于各种CAD设计领域,例如机械设计、建筑设计、服装设计等。它可以帮助设计师更高效地创建复杂的CAD轮廓,并提供更灵活的参数化编辑能力。未来,该方法有望与人工智能设计工具集成,实现更智能化的CAD设计流程。

📄 摘要(原文)

We introduce a new method of generating Computer Aided Design (CAD) profiles via a sequence of simple geometric constructions including curve offsetting, rotations and intersections. These sequences start with geometry provided by a designer and build up the points and curves of the final profile step by step. We demonstrate that adding construction steps between the designer's input geometry and the final profile improves generation quality in a similar way to the introduction of a chain of thought in language models. Similar to the constraints in a parametric CAD model, the construction sequences reduce the degrees of freedom in the modeled shape to a small set of parameter values which can be adjusted by the designer, allowing parametric editing with the constructed geometry evaluated to floating point precision. In addition we show that applying reinforcement learning to the construction sequences gives further improvements over a wide range of metrics, including some which were not explicitly optimized.