PhysEDA: Physics-Aware Learning Framework for Efficient EDA With Manhattan Distance Decay

📄 arXiv: 2605.10547v1 📥 PDF

作者: Zetao Yang

分类: cs.LG

发布日期: 2026-05-11

备注: 9 pages, 4 figures, plus appendix. Code and data to be released upon publication


💡 一句话要点

提出PhysEDA框架:通过曼哈顿距离衰减先验实现高效EDA任务建模

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 电子设计自动化 物理感知学习 线性注意力 强化学习 归纳偏置 集成电路设计

📋 核心要点

  1. 现有EDA模型受限于Transformer的二次复杂度,且因缺乏物理约束,易在小样本下过拟合统计噪声,忽视了电路设计的底层物理规律。
  2. 提出PhysEDA框架,将曼哈顿距离指数衰减作为归纳偏置,通过物理结构化线性注意力(PSLA)和基于势能的奖励塑造(PBRS)解决计算与学习难题。
  3. 实验表明,该方法在多个EDA任务中显著提升了跨尺度迁移能力,并大幅降低了推理延迟与内存占用,验证了物理先验在EDA任务中的有效性。

📝 摘要(中文)

电子设计自动化(EDA)涵盖了集成电路的布局、布线、时序分析及功耗完整性验证。尽管Transformer和强化学习(RL)在EDA任务中展现出潜力,但仍面临两大瓶颈:标准注意力机制的二次复杂度限制了扩展性,且数据稀缺导致模型易过拟合统计噪声,并放大与底层物理规律相悖的长程相关性。本文观察到EDA任务具有物理先验——即成对的电气与布线交互随曼哈顿距离呈指数衰减。据此,我们提出了PhysEDA框架,包含两个核心组件:物理结构化线性注意力(PSLA),将可分离的曼哈顿衰减作为乘性偏置融入线性注意力核,将复杂度降至线性;基于势能的奖励塑造(PBRS),利用相同核构建物理势能,在稀疏奖励的强化学习中提供稠密信号,并保持最优策略不变。在去耦电容放置、宏单元放置及IR压降预测三个场景中,PhysEDA实现了56.8%的零样本跨尺度迁移提升,并在100x100网格上实现了14倍推理加速与98.5%的内存节省。

🔬 方法详解

问题定义:EDA任务中,电路组件间的电气交互具有空间局部性,但现有深度学习模型(如Transformer)忽略了这一物理特性,导致计算复杂度高(二次方)且在稀疏数据下难以捕捉真实的物理相关性,容易产生非物理的预测结果。

核心思路:论文引入“曼哈顿距离衰减”作为统一的归纳偏置。通过将物理规律显式嵌入模型架构与训练过程,既能通过数学简化降低计算复杂度,又能通过物理约束引导模型学习更鲁棒的特征表示。

技术框架:PhysEDA包含两个核心模块:一是PSLA,通过将曼哈顿距离衰减项融入线性注意力核,实现从O(N²)到O(N)的复杂度优化;二是PBRS,利用该物理核构建势能函数,为强化学习提供稠密的奖励信号,加速策略收敛。

关键创新:最重要的创新在于将物理先验转化为数学算子(乘性偏置),实现了计算效率与物理一致性的统一。PSLA通过可分离核设计,避免了全注意力矩阵的显式计算;PBRS则利用策略不变性定理,确保了奖励塑造不会改变最优策略。

关键设计:核心技术细节包括:将曼哈顿距离指数衰减函数作为注意力机制的乘性偏置;在强化学习中,将势能函数定义为基于距离的核函数,通过势能差分构建奖励,从而在不引入偏差的前提下缓解稀疏奖励问题。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

PhysEDA在三个典型EDA任务中表现优异:在100x100网格规模下,推理速度提升14倍,内存占用降低98.5%;在零样本跨尺度迁移任务中,性能提升达56.8%;此外,PBRS在稀疏奖励的去耦电容放置(DPP)任务中额外带来了10.8%的性能增益,证明了物理先验对复杂优化问题的强力支撑。

🎯 应用场景

该研究适用于集成电路设计中的布局规划(Placement)、布线优化(Routing)及功耗完整性分析(Power Integrity)。其高效的推理能力和跨尺度迁移特性,使其在处理大规模芯片设计、加速设计迭代周期以及提升复杂电路的物理验证准确性方面具有显著的工业应用价值。

📄 摘要(原文)

Electronic design automation (EDA) addresses placement, routing, timing analysis, and power-integrity verification for integrated circuits. Learning methods -- attention (Transformer) and reinforcement learning (RL) -- have recently emerged on EDA tasks, yet face two common bottlenecks: vanilla attention's quadratic complexity limits scaling, and data-scarce models overfit statistical noise and amplify weak long-range correlations against the underlying physics. We observe that EDA tasks share a physical prior -- pairwise electrical and routing interactions decay exponentially along Manhattan distance -- and integrate it as a unified inductive bias into both architecture and training. We propose PhysEDA, comprising two components Physics-Structured Linear Attention (PSLA) folds the separable Manhattan decay into the linear-attention kernel as a multiplicative bias, reducing complexity from quadratic to linear; Potential-Based Reward Shaping (PBRS) constructs a physical potential from the same kernel, providing dense reward signal under sparse RL while preserving the optimal policy via the policy-invariance theorem. Across three EDA scenarios -- decoupling-capacitor placement, macro placement, and IR-drop prediction -- PhysEDA improves zero-shot cross-scale transfer by 56.8% and achieves 14x inference speedup with 98.5% memory savings on 100x100 grids; PBRS adds another 10.8% in sparse-reward DPP.