Synthesis4AD: Synthetic Anomalies are All You Need for 3D Anomaly Detection

📄 arXiv: 2604.04658 📥 PDF

作者: Yihan Sun, Yuqi Cheng, Junjie Zu, Yuxiang Tan, Guoyang Xie, Yucheng Wang, Yunkang Cao, Weiming Shen

分类: cs.CV

发布日期: 2026-04-07


💡 一句话要点

Synthesis4AD:利用合成异常数据提升3D异常检测性能

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 3D异常检测 合成数据 数据增强 多模态学习 工业质检

📋 核心要点

  1. 工业3D异常检测面临异常样本稀缺和长尾分布的挑战,限制了模型性能。
  2. Synthesis4AD利用可控合成引擎MPAS生成高保真合成异常数据,并结合MLLM实现知识驱动的异常数据生成。
  3. 通过空间分布归一化和几何保真数据增强,提高了模型在非结构化点云上的鲁棒性和泛化能力,实验结果SOTA。

📝 摘要(中文)

工业3D异常检测的性能受到异常样本稀缺和长尾分布的根本限制。为了解决这一挑战,我们提出了Synthesis4AD,这是一个端到端的范例,它利用大规模、高保真的合成异常来学习更具区分性的3D异常检测表示。Synthesis4AD的核心是3D-DefectStudio,这是一个建立在可控合成引擎MPAS之上的软件平台,它在更高维度的支持原语的指导下注入几何上逼真的缺陷,同时生成精确的点级异常掩码。此外,Synthesis4AD还整合了一个多模态大型语言模型(MLLM),以解释产品设计信息并自动将其转换为可执行的异常合成指令,从而实现可扩展的、知识驱动的异常数据生成。为了提高下游检测器在非结构化点云上的鲁棒性和泛化能力,Synthesis4AD进一步引入了一个基于空间分布归一化和几何保真数据增强的训练流程,从而减轻了Point Transformer架构对绝对坐标的敏感性,并改善了在真实数据变化下的特征学习。大量的实验表明,在Real3D-AD、MulSen-AD和一个真实的工业零件数据集上,该方法达到了最先进的性能。所提出的合成方法MPAS和交互式系统3D-DefectStudio将在此URL上公开发布。

🔬 方法详解

问题定义:论文旨在解决工业3D异常检测中,由于异常样本数据稀缺和长尾分布导致的模型训练不足的问题。现有方法难以有效学习到区分正常和异常样本的鲁棒特征,泛化能力受限。

核心思路:论文的核心思路是利用合成数据来扩充训练集,弥补真实异常样本的不足。通过可控的合成引擎生成逼真的异常样本,并利用多模态大语言模型指导合成过程,实现知识驱动的异常数据生成。

技术框架:Synthesis4AD包含三个主要组成部分:1) 3D-DefectStudio:基于MPAS的可控合成引擎,用于生成几何逼真的缺陷和精确的异常掩码。2) MLLM:用于解释产品设计信息,并将其转化为可执行的异常合成指令。3) 训练流程:包含空间分布归一化和几何保真数据增强,以提高模型鲁棒性和泛化能力。

关键创新:论文的关键创新在于提出了一种可控的、知识驱动的3D异常数据合成方法。与以往的简单数据增强方法不同,该方法能够生成具有几何真实感的异常样本,并利用MLLM实现对异常类型的精确控制。

关键设计:MPAS引擎通过高维支持原语引导缺陷的几何形状,保证合成缺陷的真实性。空间分布归一化用于消除点云坐标系的绝对依赖,提高模型对不同坐标系下的点云的泛化能力。几何保真数据增强则模拟了真实场景中的各种数据变化,进一步提升模型的鲁棒性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,Synthesis4AD在Real3D-AD、MulSen-AD和真实的工业零件数据集上均取得了最先进的性能。相较于现有方法,该方法能够显著提高异常检测的准确率和召回率,尤其是在异常样本稀缺的情况下,性能提升更为明显。

🎯 应用场景

该研究成果可广泛应用于工业制造领域的质量检测、缺陷识别和产品安全保障。通过合成异常数据,可以有效提升3D异常检测模型的性能,降低误判率,提高生产效率和产品质量。未来,该方法有望扩展到其他领域,如医疗影像分析、自动驾驶等。

📄 摘要(原文)

Industrial 3D anomaly detection performance is fundamentally constrained by the scarcity and long-tailed distribution of abnormal samples. To address this challenge, we propose Synthesis4AD, an end-to-end paradigm that leverages large-scale, high-fidelity synthetic anomalies to learn more discriminative representations for 3D anomaly detection. At the core of Synthesis4AD is 3D-DefectStudio, a software platform built upon the controllable synthesis engine MPAS, which injects geometrically realistic defects guided by higher-dimensional support primitives while simultaneously generating accurate point-wise anomaly masks. Furthermore, Synthesis4AD incorporates a multimodal large language model (MLLM) to interpret product design information and automatically translate it into executable anomaly synthesis instructions, enabling scalable and knowledge-driven anomalous data generation. To improve the robustness and generalization of the downstream detector on unstructured point clouds, Synthesis4AD further introduces a training pipeline based on spatial-distribution normalization and geometry-faithful data augmentations, which alleviates the sensitivity of Point Transformer architectures to absolute coordinates and improves feature learning under realistic data variations. Extensive experiments demonstrate state-of-the-art performance on Real3D-AD, MulSen-AD, and a real-world industrial parts dataset. The proposed synthesis method MPAS and the interactive system 3D-DefectStudio will be publicly released atthis https URL.