CADMorph: Geometry-Driven Parametric CAD Editing via a Plan-Generate-Verify Loop

📄 arXiv: 2512.11480v2 📥 PDF

作者: Weijian Ma, Shizhao Sun, Ruiyu Wang, Jiang Bian

分类: cs.CV

发布日期: 2025-12-12 (更新: 2026-01-05)

备注: NeurIPS 2025


💡 一句话要点

CADMorph:提出基于几何驱动的参数化CAD编辑框架,实现高效的CAD模型迭代设计。

🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: CAD模型编辑 参数化设计 几何驱动 扩散模型 掩码预测

📋 核心要点

  1. 几何驱动的参数化CAD编辑面临结构保持、语义有效性和形状保真度三大挑战,且数据稀缺。
  2. CADMorph通过计划-生成-验证循环,利用预训练的P2S和MPP模型,有效解决上述挑战。
  3. 实验表明,CADMorph优于GPT-4o等基线方法,并支持迭代编辑和逆向工程等应用。

📝 摘要(中文)

计算机辅助设计(CAD)模型以参数化构造序列及其可见几何形状两种耦合形式编码对象。在迭代设计过程中,对几何形状的调整不可避免地需要同步编辑底层参数序列,这被称为几何驱动的参数化CAD编辑。该任务要求:1)保持原始序列的结构,2)确保每次编辑的语义有效性,3)维持对目标形状的高保真度,所有这些都在稀缺的编辑数据三元组下进行。我们提出了CADMorph,一个迭代的计划-生成-验证框架,在推理过程中协调预训练的领域特定基础模型:一个参数到形状(P2S)的潜在扩散模型和一个掩码参数预测(MPP)模型。在计划阶段,来自P2S模型的交叉注意力图精确定位需要修改的段,并提供编辑掩码。然后,MPP模型在生成阶段用语义上有效的编辑填充这些掩码。在验证过程中,P2S模型将每个候选序列嵌入到形状潜在空间中,测量其与目标形状的距离,并选择最接近的一个。这三个阶段利用了预训练先验中固有的几何意识和设计知识,从而分别解决了结构保持、语义有效性和形状保真度。此外,P2S和MPP模型都在没有三元组数据的情况下进行训练,绕过了数据稀缺的瓶颈。CADMorph超越了GPT-4o和专门的CAD基线,并支持迭代编辑和逆向工程增强等下游应用。

🔬 方法详解

问题定义:论文旨在解决几何驱动的参数化CAD编辑问题。现有方法在数据稀缺的情况下,难以同时保证编辑后的CAD模型在结构、语义和形状上的有效性。具体来说,直接修改参数序列可能导致模型结构破坏或语义无效,而简单地拟合目标形状又可能忽略原始设计的意图。

核心思路:CADMorph的核心思路是利用预训练的参数到形状(P2S)和掩码参数预测(MPP)模型,构建一个迭代的“计划-生成-验证”框架。通过预训练模型学习到的几何意识和设计知识,在编辑过程中保持结构、语义和形状的有效性。这种方法避免了对大量三元组数据的依赖。

技术框架:CADMorph框架包含三个主要阶段:计划、生成和验证。在计划阶段,P2S模型的交叉注意力图用于定位需要修改的参数段,并生成编辑掩码。在生成阶段,MPP模型利用掩码信息,预测并填充语义上有效的参数编辑。在验证阶段,P2S模型将每个候选序列嵌入到形状潜在空间,并选择与目标形状距离最近的序列。

关键创新:CADMorph的关键创新在于将预训练的P2S和MPP模型集成到一个迭代的编辑框架中。P2S模型负责形状生成和验证,MPP模型负责参数编辑。这种设计允许框架在数据稀缺的情况下,利用预训练模型学习到的先验知识,实现有效的几何驱动的参数化CAD编辑。与现有方法相比,CADMorph不需要大量的三元组数据,并且能够更好地保持模型的结构和语义。

关键设计:P2S模型采用潜在扩散模型,将参数序列映射到形状潜在空间。MPP模型采用掩码参数预测,用于生成语义上有效的参数编辑。框架使用交叉注意力机制来定位需要修改的参数段。验证阶段使用形状潜在空间中的距离度量来评估候选序列与目标形状的相似度。P2S和MPP模型均在大量CAD数据上进行预训练,以学习几何意识和设计知识。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,CADMorph在几何驱动的参数化CAD编辑任务中优于GPT-4o和专门的CAD基线方法。CADMorph能够生成更高质量的编辑结果,更好地保持模型的结构和语义,并实现更高的形状保真度。此外,CADMorph在迭代编辑和逆向工程增强等下游应用中也表现出良好的性能。

🎯 应用场景

CADMorph可应用于CAD模型的迭代设计、逆向工程增强、以及自动化设计流程等领域。通过该方法,设计师可以更加高效地修改和优化CAD模型,同时保证模型的结构和语义有效性。该研究有望推动CAD技术的发展,并为制造业、建筑业等领域带来实际价值。

📄 摘要(原文)

A Computer-Aided Design (CAD) model encodes an object in two coupled forms: a parametric construction sequence and its resulting visible geometric shape. During iterative design, adjustments to the geometric shape inevitably require synchronized edits to the underlying parametric sequence, called geometry-driven parametric CAD editing. The task calls for 1) preserving the original sequence's structure, 2) ensuring each edit's semantic validity, and 3) maintaining high shape fidelity to the target shape, all under scarce editing data triplets. We present CADMorph, an iterative plan-generate-verify framework that orchestrates pretrained domain-specific foundation models during inference: a parameter-to-shape (P2S) latent diffusion model and a masked-parameter-prediction (MPP) model. In the planning stage, cross-attention maps from the P2S model pinpoint the segments that need modification and offer editing masks. The MPP model then infills these masks with semantically valid edits in the generation stage. During verification, the P2S model embeds each candidate sequence in shape-latent space, measures its distance to the target shape, and selects the closest one. The three stages leverage the inherent geometric consciousness and design knowledge in pretrained priors, and thus tackle structure preservation, semantic validity, and shape fidelity respectively. Besides, both P2S and MPP models are trained without triplet data, bypassing the data-scarcity bottleneck. CADMorph surpasses GPT-4o and specialized CAD baselines, and supports downstream applications such as iterative editing and reverse-engineering enhancement.