CME-CAD: Heterogeneous Collaborative Multi-Expert Reinforcement Learning for CAD Code Generation

作者: Ke Niu, Haiyang Yu, Zhuofan Chen, Zhengtao Yao, Weitao Jia, Xiaodong Ge, Jingqun Tang, Benlei Cui, Bin Li, Xiangyang Xue

分类: cs.CV

发布日期: 2025-12-29

💡 一句话要点

提出CME-CAD异构协作多专家强化学习框架，用于高精度可编辑CAD代码生成。

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: CAD代码生成 强化学习 多专家系统 异构协作 工业设计

📋 核心要点

现有方法重建的3D模型通常不可编辑且精度不足，难以满足工业设计对精度和可编辑性的严格要求。
CME-CAD通过异构多专家协作学习，结合各模型的优势，提升CAD代码生成模型的精度和可编辑性。
论文构建了包含17,299个实例的CADExpert基准数据集，为CAD代码生成研究提供了数据支撑。

📝 摘要（中文）

本文提出了一种用于CAD代码生成的新型训练范式——异构协作多专家强化学习(CME-CAD)。该方法集成了多种模型的互补优势，促进协作学习，提高模型生成精确、兼容约束且完全可编辑的CAD模型的能力。我们提出了一个两阶段训练过程：多专家微调(MEFT)和多专家强化学习(MERL)。此外，我们还提出了CADExpert，一个包含17,299个实例的开源基准，包括正交投影和精确的尺寸标注、专家生成的思维链(CoT)过程、可执行的CADQuery代码和渲染的3D模型。

🔬 方法详解

问题定义：现有方法在从草图重建3D模型时，生成的模型通常是非可编辑的，并且精度有限，无法满足工业设计中对模型精度和可编辑性的严格要求。此外，依赖文本或图像输入的现有方法通常需要大量的人工标注，限制了它们在工业环境中的可扩展性和适用性。

核心思路：CME-CAD的核心思路是利用异构多专家模型的互补优势，通过协作学习来提高CAD代码生成模型的性能。不同的专家模型可能擅长不同的方面，例如几何推理、约束求解或代码生成。通过将这些专家模型集成在一起，可以充分利用它们的优势，从而生成更精确、更符合约束且更易于编辑的CAD模型。

技术框架：CME-CAD的整体框架包含两个主要阶段：多专家微调(MEFT)和多专家强化学习(MERL)。在MEFT阶段，使用CADExpert数据集对各个专家模型进行微调，使其具备基本的CAD代码生成能力。在MERL阶段，使用强化学习来进一步优化专家模型的协作策略，使其能够更好地协同工作，生成高质量的CAD代码。

关键创新：CME-CAD的关键创新在于提出了异构协作多专家强化学习的训练范式。与传统的单模型方法相比，CME-CAD能够更好地利用不同模型的优势，从而提高CAD代码生成模型的性能。此外，CADExpert数据集的构建也为CAD代码生成研究提供了重要的资源。

关键设计：MEFT阶段使用交叉熵损失函数来训练专家模型，使其能够准确地预测CAD代码的下一个token。MERL阶段使用策略梯度方法来优化专家模型的协作策略，奖励函数的设计考虑了模型的精度、约束满足度和可编辑性。具体的网络结构和参数设置在论文中有详细描述，但此处未提供具体数值。

🖼️ 关键图片

📊 实验亮点

论文提出了CADExpert基准数据集，包含17,299个实例，为CAD代码生成研究提供了数据支撑。实验结果表明，CME-CAD在CAD代码生成任务上取得了显著的性能提升，相较于现有方法，生成的CAD模型精度更高，可编辑性更强。具体的性能指标和对比结果在论文中有详细描述，但此处未提供具体数值。

🎯 应用场景

CME-CAD在工业设计领域具有广泛的应用前景。它可以用于自动化生成高精度、可编辑的CAD模型，从而提高设计效率，降低设计成本。此外，CME-CAD还可以用于辅助设计师进行创新设计，例如，通过生成不同的设计方案，帮助设计师探索更多的可能性。未来，CME-CAD有望成为工业设计领域的重要工具。

📄 摘要（原文）

Computer-Aided Design (CAD) is essential in industrial design, but the complexity of traditional CAD modeling and workflows presents significant challenges for automating the generation of high-precision, editable CAD models. Existing methods that reconstruct 3D models from sketches often produce non-editable and approximate models that fall short of meeting the stringent requirements for precision and editability in industrial design. Moreover, the reliance on text or image-based inputs often requires significant manual annotation, limiting their scalability and applicability in industrial settings. To overcome these challenges, we propose the Heterogeneous Collaborative Multi-Expert Reinforcement Learning (CME-CAD) paradigm, a novel training paradigm for CAD code generation. Our approach integrates the complementary strengths of these models, facilitating collaborative learning and improving the model's ability to generate accurate, constraint-compatible, and fully editable CAD models. We introduce a two-stage training process: Multi-Expert Fine-Tuning (MEFT), and Multi-Expert Reinforcement Learning (MERL). Additionally, we present CADExpert, an open-source benchmark consisting of 17,299 instances, including orthographic projections with precise dimension annotations, expert-generated Chain-of-Thought (CoT) processes, executable CADQuery code, and rendered 3D models.

CME-CAD: Heterogeneous Collaborative Multi-Expert Reinforcement Learning for CAD Code Generation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理