CADReview: Automatically Reviewing CAD Programs with Error Detection and Correction

📄 arXiv: 2505.22304v1 📥 PDF

作者: Jiali Chen, Xusen Hei, HongFei Liu, Yuancheng Wei, Zikun Deng, Jiayuan Xie, Yi Cai, Li Qing

分类: cs.CV

发布日期: 2025-05-28

备注: ACL 2025 main conference

DOI: 10.18653/v1/2025.acl-long.489


💡 一句话要点

提出ReCAD框架,自动检测并修正CAD程序错误,提升3D对象设计质量。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: CAD程序审查 错误检测与纠正 多模态学习 3D对象设计 计算机辅助设计

📋 核心要点

  1. 现有方法难以识别CAD程序中的多个几何组件和执行空间几何操作,导致CAD程序审查任务中出现不准确的问题。
  2. ReCAD框架通过有效地检测程序错误并提供错误纠正反馈,从而实现CAD程序的自动审查和修复。
  3. 通过在CADReview数据集上的大量实验,证明ReCAD显著优于现有的多模态大型语言模型,展现了其在设计应用中的巨大潜力。

📝 摘要(中文)

计算机辅助设计(CAD)在通过几何指令(即CAD程序)进行3D对象原型设计中至关重要。在实际设计流程中,设计人员通常需要花费大量时间进行审查和改进,通过将原型与参考图像进行比较。为了弥合这一差距,我们引入了CAD审查任务,以自动检测和纠正潜在错误,确保构建的3D对象与参考图像之间的一致性。然而,最近先进的多模态大型语言模型(MLLM)难以识别CAD程序中的多个几何组件并执行空间几何操作,导致审查不准确。在本文中,我们提出了CAD程序修复器(ReCAD)框架,以有效地检测程序错误并提供有关错误纠正的有用反馈。此外,我们创建了一个数据集CADReview,包含超过20K的程序-图像对,具有用于CAD审查任务的各种错误。大量实验表明,我们的ReCAD明显优于现有的MLLM,这在设计应用中显示出巨大的潜力。

🔬 方法详解

问题定义:论文旨在解决CAD程序审查中,现有方法难以准确识别几何组件和执行空间几何操作的问题。设计人员需要花费大量时间手动审查和修改CAD程序,效率低下。现有的大型多模态模型(MLLM)在处理复杂的CAD程序时,无法保证3D对象与参考图像的一致性,存在审查不准确的痛点。

核心思路:论文的核心思路是构建一个专门的CAD程序修复器(ReCAD)框架,该框架能够有效地检测CAD程序中的错误,并提供关于如何纠正这些错误的反馈。通过学习CAD程序和对应图像之间的关系,ReCAD能够识别不一致之处,并给出修改建议,从而实现CAD程序的自动审查和修复。

技术框架:ReCAD框架的具体架构未知,但可以推断其包含以下主要模块/阶段:1) CAD程序编码器:将CAD程序转换为模型可理解的表示形式。2) 图像编码器:提取参考图像的视觉特征。3) 错误检测模块:比较CAD程序表示和图像特征,识别潜在错误。4) 错误纠正模块:基于检测到的错误,生成修改建议。5) 反馈模块:将修改建议以易于理解的方式呈现给用户。

关键创新:论文的关键创新在于提出了ReCAD框架,这是一个专门为CAD程序审查任务设计的解决方案。与通用MLLM相比,ReCAD更专注于几何组件的识别和空间几何操作的理解,从而提高了审查的准确性。此外,CADReview数据集的构建也为该领域的研究提供了宝贵资源。

关键设计:由于论文细节未知,无法提供具体的参数设置、损失函数、网络结构等技术细节。但可以推测,CAD程序编码器可能采用Transformer或其他序列模型,图像编码器可能使用卷积神经网络(CNN),错误检测模块可能使用相似度度量或分类器,错误纠正模块可能使用生成模型或规则引擎。损失函数可能包括重建损失、对比损失或分类损失。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,ReCAD框架在CAD审查任务中显著优于现有的多模态大型语言模型。具体性能数据和提升幅度未知,但论文强调ReCAD在检测程序错误和提供纠正反馈方面的有效性,证明了其在设计应用中的巨大潜力。CADReview数据集的发布也为后续研究提供了基准。

🎯 应用场景

该研究成果可应用于各种3D对象设计领域,例如建筑设计、机械设计、产品设计等。通过自动审查和修复CAD程序,可以显著提高设计效率,减少人为错误,并确保设计结果与预期一致。未来,该技术有望集成到CAD软件中,为设计师提供智能化的辅助设计工具。

📄 摘要(原文)

Computer-aided design (CAD) is crucial in prototyping 3D objects through geometric instructions (i.e., CAD programs). In practical design workflows, designers often engage in time-consuming reviews and refinements of these prototypes by comparing them with reference images. To bridge this gap, we introduce the CAD review task to automatically detect and correct potential errors, ensuring consistency between the constructed 3D objects and reference images. However, recent advanced multimodal large language models (MLLMs) struggle to recognize multiple geometric components and perform spatial geometric operations within the CAD program, leading to inaccurate reviews. In this paper, we propose the CAD program repairer (ReCAD) framework to effectively detect program errors and provide helpful feedback on error correction. Additionally, we create a dataset, CADReview, consisting of over 20K program-image pairs, with diverse errors for the CAD review task. Extensive experiments demonstrate that our ReCAD significantly outperforms existing MLLMs, which shows great potential in design applications.