LInK: Learning Joint Representations of Design and Performance Spaces through Contrastive Learning for Mechanism Synthesis

📄 arXiv: 2405.20592v2 📥 PDF

作者: Amin Heyrani Nobari, Akash Srivastava, Dan Gutfreund, Kai Xu, Faez Ahmed

分类: cs.LG, cs.AI

发布日期: 2024-05-31 (更新: 2024-10-04)

期刊: Transactions on Machine Learning Research, 2835-885, 2024

🔗 代码/项目: GITHUB


💡 一句话要点

LInK:通过对比学习设计与性能空间联合表示,用于机构综合

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 机构综合 对比学习 逆向设计 联合表示 优化算法

📋 核心要点

  1. 现有机构综合方法在处理复杂逆问题时,面临非线性和可行空间小的挑战,导致求解精度和效率不足。
  2. LInK通过对比学习构建设计与性能空间的联合表示,结合优化技术,实现快速准确的机构检索和参数优化。
  3. 实验表明,LInK在现有和更具挑战性的基准测试中,显著优于现有方法,误差降低28倍,耗时减少20倍。

📝 摘要(中文)

本文提出LInK,一个新颖的框架,它集成了性能和设计空间的对比学习与优化技术,以解决工程设计中具有离散和连续变量的复杂逆问题。我们专注于平面连杆机构的路径综合问题。通过利用多模态和变换不变的对比学习框架,LInK学习了一种联合表示,该表示捕获了机构的复杂物理和设计表示,从而能够从超过1000万个机构的庞大数据集中快速检索。这种方法通过分层无约束非线性优化算法的warm start提高了精度,将传统优化的鲁棒性与现代深度学习方法的速度和适应性相结合。在现有基准上的结果表明,LInK优于现有方法,与最先进的方法相比,误差减少了28倍,同时在现有基准上花费的时间减少了20倍。此外,我们引入了一个更具挑战性的基准,名为LINK ABC,它涉及合成跟踪英文字母大写字母轨迹的连杆机构,这是一个逆向设计基准任务,由于大的非线性和微小的可行空间,现有方法难以解决。我们的结果表明,LInK不仅推动了机构设计领域的发展,而且拓宽了对比学习和优化在其他工程领域中的适用性。代码和数据可在https://github.com/ahnobari/LInK公开获取。

🔬 方法详解

问题定义:论文旨在解决平面连杆机构的路径综合问题,即根据期望的运动轨迹反向设计机构参数。现有方法,如传统的优化算法,在面对复杂轨迹(例如英文字母)时,由于高度非线性和狭小的可行解空间,容易陷入局部最优或收敛速度慢。

核心思路:论文的核心在于学习机构设计空间(例如连杆长度)和性能空间(例如运动轨迹)的联合表示。通过对比学习,将相似的机构设计和性能映射到嵌入空间的相近位置,从而实现快速检索和参数初始化。这种联合表示能够捕捉机构的复杂物理特性和设计约束。

技术框架:LInK框架包含两个主要阶段:1) 对比学习阶段:使用包含大量机构设计和对应性能的数据集,训练一个多模态对比学习模型,学习设计空间和性能空间的联合嵌入。2) 优化阶段:利用对比学习得到的嵌入向量作为优化算法的warm start,加速优化过程,并提高求解精度。该优化算法采用分层无约束非线性优化策略。

关键创新:LInK的关键创新在于将对比学习引入机构综合领域,构建了设计与性能空间的联合表示。这种联合表示能够有效捕捉机构的复杂物理特性,并克服传统优化方法在处理复杂逆问题时的局限性。此外,warm start策略结合了深度学习的快速检索能力和传统优化的鲁棒性。

关键设计:对比学习采用多模态和变换不变的损失函数,鼓励模型学习对机构设计和性能的本质特征。具体而言,正样本对由同一机构的设计和性能组成,负样本对由不同机构的设计和性能组成。优化阶段采用分层优化策略,首先优化机构的整体结构,然后逐步优化细节参数。网络结构细节和超参数设置在论文中有详细描述(未知)。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

LInK在现有基准测试中,与最先进的方法相比,误差降低了28倍,耗时减少了20倍。在更具挑战性的LINK ABC基准测试中,LInK能够成功合成跟踪英文字母大写字母轨迹的连杆机构,而现有方法难以解决。这些结果表明,LInK在机构综合领域具有显著的性能优势。

🎯 应用场景

LInK框架具有广泛的应用前景,可应用于机器人、自动化设备、医疗器械等领域。例如,可以用于设计具有特定运动轨迹的机器人关节,或用于开发能够精确执行复杂手术的医疗器械。此外,该方法还可以推广到其他工程设计领域,例如航空航天、汽车工程等。

📄 摘要(原文)

In this paper, we introduce LInK, a novel framework that integrates contrastive learning of performance and design space with optimization techniques for solving complex inverse problems in engineering design with discrete and continuous variables. We focus on the path synthesis problem for planar linkage mechanisms. By leveraging a multimodal and transformation-invariant contrastive learning framework, LInK learns a joint representation that captures complex physics and design representations of mechanisms, enabling rapid retrieval from a vast dataset of over 10 million mechanisms. This approach improves precision through the warm start of a hierarchical unconstrained nonlinear optimization algorithm, combining the robustness of traditional optimization with the speed and adaptability of modern deep learning methods. Our results on an existing benchmark demonstrate that LInK outperforms existing methods with 28 times less error compared to a state of the art approach while taking 20 times less time on an existing benchmark. Moreover, we introduce a significantly more challenging benchmark, named LINK ABC, which involves synthesizing linkages that trace the trajectories of English capital alphabets, an inverse design benchmark task that existing methods struggle with due to large nonlinearities and tiny feasible space. Our results demonstrate that LInK not only advances the field of mechanism design but also broadens the applicability of contrastive learning and optimization to other areas of engineering. The code and data are publicly available at https://github.com/ahnobari/LInK.