ZNO: Stable Rational Neural Operators in the Z-Domain for Discrete-Time Dynamic
作者: Xianli Zhu, Jia Yin
分类: cs.LG, math.NA
发布日期: 2026-05-04
💡 一句话要点
提出Z域神经算子(ZNO),用于稳定地学习离散时间动态系统。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 神经算子 离散时间系统 系统辨识 Z域 稳定性
📋 核心要点
- 现有神经算子主要针对连续时间系统,而忽略了大量本质上是离散时间的系统辨识问题。
- ZNO通过在Z域直接参数化稳定低秩MIMO有理滤波器,确保学习到的离散时间系统具有稳定性。
- 实验表明,ZNO在具有近单位圆极点的稳定有理离散时间系统辨识中表现出色,尤其是在长记忆场景下。
📝 摘要(中文)
本文提出了一种Z域神经算子(ZNO),它是一种因果神经算子,其层是直接在$z$平面参数化的稳定低秩多输入多输出(MIMO)有理滤波器。ZNO解决了现有算子学习方法的局限性,这些方法主要针对连续时间问题,而大量的系统辨识问题本质上是离散时间的。$z$域形式将稳定性表示为单位圆盘极点约束,并使学习到的离散时间极点可以直接读取。该模型在一个$z$域有理递归层中结合了低秩通道混合、平滑稳定极点重参数化、因果递归和一个可选的短有限脉冲响应(FIR)分支。在受控的离散系统辨识实验中,当目标动态是具有靠近单位圆的轻阻尼极点的稳定有理系统时,ZNO的优势最为明显。在匹配的参数预算下,ZNO并非完全占优;然而,通过验证选择的配置,相同的架构可以在受控任务中实现最低的平均误差。在近单位圆/长记忆动态的五个难度等级的扫描中,ZNO在从短(约10步)到长(约100-200步)的记忆范围内具有最低的平均误差。在五个公共非线性系统辨识基准上,ZNO与神经算子和状态空间基线相比具有竞争力,在动态与稳定有理离散时间滤波器对齐的基准上实现了最低的平均误差,而经典或状态空间基线在某些系统上仍然是首选。这些结果表明,ZNO是稳定有理离散时间动态系统的强大模型,尤其是在近单位圆和长记忆范围内,但不能作为专门系统辨识方法的通用替代品。
🔬 方法详解
问题定义:论文旨在解决离散时间动态系统的辨识问题,现有神经算子方法大多针对连续时间系统,无法很好地处理离散时间系统,尤其是在系统具有接近单位圆的极点时,容易出现不稳定的情况。此外,现有方法难以直接解释学习到的系统参数,例如极点位置等。
核心思路:论文的核心思路是在Z域直接对神经算子进行参数化,利用Z域的特性来保证系统的稳定性。具体来说,通过将神经算子的层设计为稳定低秩MIMO有理滤波器,并直接在z平面上进行参数化,从而将稳定性约束转化为单位圆盘极点约束。这样可以确保学习到的系统是稳定的,并且可以直接读取学习到的离散时间极点。
技术框架:ZNO模型由多个Z域有理递归层组成。每一层包含以下几个关键组件:低秩通道混合(用于降低参数量)、平滑稳定极点重参数化(确保极点位于单位圆内)、因果递归(保证系统的因果性)以及可选的短FIR分支(用于增强模型的表达能力)。整个模型通过最小化预测误差进行训练。
关键创新:ZNO的关键创新在于将神经算子直接在Z域进行参数化,并利用Z域的特性来保证系统的稳定性。与传统的时域或频域方法相比,ZNO可以直接学习离散时间系统的极点和零点,并且可以方便地施加稳定性约束。此外,ZNO还采用了低秩分解和光滑重参数化等技术来提高模型的效率和稳定性。
关键设计:ZNO的关键设计包括:1) 使用低秩分解来减少参数量,提高模型的泛化能力;2) 使用光滑重参数化来确保极点位于单位圆内,避免训练过程中出现不稳定的情况;3) 使用因果递归来保证系统的因果性;4) 可选的短FIR分支可以增强模型的表达能力,使其能够更好地拟合复杂的动态系统。损失函数通常采用均方误差或类似的度量。
🖼️ 关键图片
📊 实验亮点
实验结果表明,ZNO在受控的离散系统辨识任务中,尤其是在目标动态具有靠近单位圆的轻阻尼极点时,表现出显著的优势。在五个难度等级的近单位圆/长记忆动态扫描中,ZNO在从短(约10步)到长(约100-200步)的记忆范围内均实现了最低的平均误差。在五个公共非线性系统辨识基准上,ZNO也与神经算子和状态空间基线相比具有竞争力。
🎯 应用场景
ZNO可应用于各种离散时间动态系统的建模和控制,例如机器人控制、信号处理、金融建模和气候预测等。该方法尤其适用于需要精确建模系统动态特性,并保证系统稳定性的场景。ZNO的未来发展方向包括探索更高效的Z域参数化方法,以及将其应用于更复杂的非线性系统。
📄 摘要(原文)
We introduce the Z-Domain Neural Operator (ZNO), a causal neural operator whose layers are stable low-rank multiple-input multiple-output (MIMO) rational filters parameterized directly in the $z$-plane. ZNO addresses a limitation of existing operator learning methods, many of which are primarily tailored for continuous-time problems, while a large class of system-identification problems is intrinsically discrete-time. The $z$-domain form expresses stability as a unit-disk pole constraint and makes learned discrete-time poles directly readable. The model combines low-rank channel mixing, smooth stable pole reparameterization, causal recurrence, and an optional short finite impulse response (FIR) branch in a single $z$-domain rational recurrent layer. Across controlled discrete system-identification experiments, ZNO's advantage is most evident when the target dynamics are stable rational systems with lightly damped poles near the unit circle. Under matched parameter budgets, ZNO is not uniformly dominant; however, with validation-selected configurations, the same architecture can achieve the lowest mean error across the controlled tasks. A five-bin difficulty sweep over near-unit-circle / long-memory dynamics shows that ZNO has the lowest mean error across memory regimes, from short (approximately 10 steps) to long (approximately 100-200 steps). On five public nonlinear system-identification benchmarks, ZNO is competitive with neural operator and state-space baselines, achieving the lowest mean error on benchmarks whose dynamics align with stable rational discrete-time filters, while classical or state-space baselines remain preferable on some systems. These results position ZNO as a strong model for stable rational discrete-time dynamics, especially in near-unit-circle and long-memory regimes, but not as a universal replacement for specialized system-identification methods.