Boundary-Constrained Diffusion Models for Floorplan Generation: Balancing Realism and Diversity
作者: Leonardo Stoppani, Davide Bacciu, Shahab Mokarizadeh
分类: cs.LG, cs.CV
发布日期: 2026-02-02
备注: Accepted at ESANN 2026
💡 一句话要点
提出边界约束扩散模型,平衡平面图生成中的真实性和多样性
🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting)
关键词: 平面图生成 扩散模型 多样性评分 边界约束 交叉注意力 几何一致性 建筑设计 生成模型
📋 核心要点
- 现有平面图生成方法过度依赖感知指标(如FID),导致生成结果多样性不足,无法满足实际设计需求。
- 论文提出多样性评分(DS)来量化布局多样性,并引入边界交叉注意力(BCA)模块以提升几何一致性。
- 实验表明,BCA能有效提升边界贴合度,但长时间训练会造成多样性崩溃,揭示了真实性和多样性之间的权衡。
📝 摘要(中文)
扩散模型在自动平面图生成领域日益流行,能够根据用户定义的约束生成高度逼真的布局。然而,优化诸如Fréchet Inception Distance (FID)等感知指标会导致设计多样性受限。为了解决这个问题,我们提出了多样性评分(DS),这是一种量化固定约束下布局多样性的指标。此外,为了提高几何一致性,我们引入了边界交叉注意力(BCA)模块,该模块能够以建筑边界为条件。实验表明,BCA显著提高了边界依从性,而长时间的训练会导致FID无法诊断的多样性崩溃,揭示了真实性和多样性之间的关键权衡。超出分布的评估进一步证明了模型对数据集先验的依赖,强调了生成系统需要在建筑设计任务中显式地平衡保真度、多样性和泛化能力。
🔬 方法详解
问题定义:现有基于扩散模型的平面图生成方法,虽然在生成真实感方面表现出色,但过度优化FID等感知指标,导致生成结果的多样性严重不足。这限制了其在实际建筑设计中的应用,因为设计师通常需要探索多种不同的设计方案。此外,现有方法在处理建筑边界约束时,几何一致性方面仍有提升空间。
核心思路:论文的核心思路是显式地平衡生成结果的真实性和多样性。一方面,通过引入新的多样性评分(DS)指标,来量化生成结果的多样性,从而能够更好地监控和控制训练过程。另一方面,通过引入边界交叉注意力(BCA)模块,来增强模型对建筑边界的感知能力,从而提高生成结果的几何一致性。
技术框架:整体框架基于扩散模型,主要包含以下几个模块:1) 前向扩散过程:逐步向平面图布局中添加噪声,将其转化为纯噪声;2) 逆向扩散过程:从纯噪声出发,逐步去除噪声,最终生成平面图布局。在这个过程中,BCA模块被集成到逆向扩散过程中,用于增强模型对建筑边界的感知能力。同时,使用DS指标来监控生成结果的多样性。
关键创新:论文的关键创新点在于:1) 提出了多样性评分(DS)指标,用于量化平面图布局的多样性;2) 引入了边界交叉注意力(BCA)模块,用于增强模型对建筑边界的感知能力,提高几何一致性。3) 揭示了在平面图生成中,真实性和多样性之间存在着权衡关系,长时间训练可能会导致多样性崩溃。
关键设计:BCA模块的设计是关键。它通过交叉注意力机制,将建筑边界的信息融入到扩散模型的逆向扩散过程中。具体来说,BCA模块接收两个输入:一个是扩散模型中间层的特征图,另一个是建筑边界的编码表示。然后,BCA模块计算特征图和边界编码之间的注意力权重,并将边界信息融入到特征图中,从而增强模型对边界的感知能力。DS指标的计算方式是,对于一批生成的平面图布局,计算它们之间的平均距离(例如,使用Hausdorff距离)。距离越大,表示布局的多样性越高。
🖼️ 关键图片
📊 实验亮点
实验结果表明,引入BCA模块后,平面图生成结果的边界贴合度显著提高。同时,通过使用多样性评分(DS)指标,发现长时间训练会导致多样性崩溃,而FID指标无法有效检测到这种现象。这表明,在平面图生成中,需要显式地平衡真实性和多样性,不能仅仅依赖于FID等感知指标。
🎯 应用场景
该研究成果可应用于建筑设计、室内设计、游戏场景生成等领域。通过平衡生成结果的真实性和多样性,可以帮助设计师快速生成多种不同的设计方案,并提高设计效率。此外,该研究提出的多样性评分指标,也可以用于评估其他生成模型的性能,并指导模型的训练。
📄 摘要(原文)
Diffusion models have become widely popular for automated floorplan generation, producing highly realistic layouts conditioned on user-defined constraints. However, optimizing for perceptual metrics such as the Fréchet Inception Distance (FID) causes limited design diversity. To address this, we propose the Diversity Score (DS), a metric that quantifies layout diversity under fixed constraints. Moreover, to improve geometric consistency, we introduce a Boundary Cross-Attention (BCA) module that enables conditioning on building boundaries. Our experiments show that BCA significantly improves boundary adherence, while prolonged training drives diversity collapse undiagnosed by FID, revealing a critical trade-off between realism and diversity. Out-Of-Distribution evaluations further demonstrate the models' reliance on dataset priors, emphasizing the need for generative systems that explicitly balance fidelity, diversity, and generalization in architectural design tasks.