Learning mechanical systems from real-world data using discrete forced Lagrangian dynamics

📄 arXiv: 2505.20370v1 📥 PDF

作者: Martine Dyring Hansen, Elena Celledoni, Benjamin Kwanen Tapley

分类: eess.SY, cs.LG

发布日期: 2025-05-26


💡 一句话要点

提出基于离散强制拉格朗日动力学的机械系统学习方法,仅需位置数据。

🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)

关键词: 机械系统学习 离散拉格朗日动力学 数据驱动建模 运动捕捉 系统辨识

📋 核心要点

  1. 现有机械系统建模方法通常需要速度数据,但在许多实际场景中,仅能获取位置信息,限制了其应用。
  2. 该论文利用离散拉格朗日-达朗贝尔原理,将动力学分解为保守和非保守部分,并用神经网络学习。
  3. 实验表明,该方法在人体运动数据和图像序列潜在空间中,能有效重建和分离动力学,优于基线。

📝 摘要(中文)

本文提出了一种数据驱动方法,用于直接从位置测量数据中学习机械系统的运动方程,而无需访问速度数据。这在系统辨识任务中尤为重要,因为在这些任务中,通常只有位置信息可用,例如运动捕捉、像素数据或低分辨率跟踪。我们的方法利用离散拉格朗日-达朗贝尔原理和强制离散欧拉-拉格朗日方程来构建系统动力学的物理模型。我们将动力学分解为保守分量和非保守分量,并使用前馈神经网络分别学习它们。在没有外力的情况下,我们的方法简化为作用原理的变分离散化,自然地保留了底层哈密顿系统的辛结构。我们在各种合成和真实世界数据集上验证了我们的方法,证明了其相对于基线方法的有效性。特别是,我们将我们的模型应用于(1)测量的人体运动数据和(2)通过在图像序列上训练的自编码器获得的潜在嵌入。我们证明了我们可以忠实地重建和分离保守动力学和强制动力学,从而产生可解释且物理上一致的预测。

🔬 方法详解

问题定义:论文旨在解决仅利用位置数据学习机械系统运动方程的问题。现有方法通常依赖于速度数据,这在许多实际应用中是不可行的,例如运动捕捉、基于图像的跟踪等。因此,如何仅从位置数据中准确地建模机械系统的动力学是一个重要的挑战。

核心思路:核心思路是利用离散拉格朗日-达朗贝尔原理和强制离散欧拉-拉格朗日方程,构建一个物理上合理的系统动力学模型。通过将动力学分解为保守和非保守分量,并分别使用神经网络学习,可以有效地处理复杂系统的动力学建模问题。

技术框架:整体框架包括以下几个主要步骤:1) 数据采集:获取机械系统的位置数据。2) 动力学分解:将系统动力学分解为保守分量和非保守分量。3) 模型学习:使用前馈神经网络分别学习保守分量和非保守分量。4) 模型验证:在合成和真实世界数据集上验证模型的有效性。

关键创新:关键创新在于将离散拉格朗日-达朗贝尔原理应用于数据驱动的机械系统建模,并提出了一种将动力学分解为保守和非保守分量的方法。这种方法允许仅使用位置数据来学习系统的运动方程,而无需显式地计算速度。与传统的基于数值微分的方法相比,该方法更加稳定和准确。

关键设计:论文中使用了前馈神经网络来学习保守和非保守动力学分量。损失函数的设计旨在最小化预测位置与真实位置之间的差异。此外,论文还考虑了在没有外力的情况下,如何保证模型的辛结构,这对于长期动力学预测至关重要。具体的网络结构和超参数设置可能需要根据具体应用进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该方法在人体运动数据和图像序列的潜在嵌入上进行了验证,结果表明该方法能够忠实地重建和分离保守动力学和强制动力学。与基线方法相比,该方法能够产生更准确和物理上一致的预测。具体的性能提升数据未知,但论文强调了其在真实世界数据上的有效性。

🎯 应用场景

该研究成果可广泛应用于机器人控制、运动捕捉、虚拟现实、生物力学等领域。例如,可以利用该方法从人体运动数据中学习运动规律,从而实现更自然的人机交互。此外,该方法还可以用于预测复杂机械系统的行为,例如飞行器的姿态控制和车辆的运动规划。

📄 摘要(原文)

We introduce a data-driven method for learning the equations of motion of mechanical systems directly from position measurements, without requiring access to velocity data. This is particularly relevant in system identification tasks where only positional information is available, such as motion capture, pixel data or low-resolution tracking. Our approach takes advantage of the discrete Lagrange-d'Alembert principle and the forced discrete Euler-Lagrange equations to construct a physically grounded model of the system's dynamics. We decompose the dynamics into conservative and non-conservative components, which are learned separately using feed-forward neural networks. In the absence of external forces, our method reduces to a variational discretization of the action principle naturally preserving the symplectic structure of the underlying Hamiltonian system. We validate our approach on a variety of synthetic and real-world datasets, demonstrating its effectiveness compared to baseline methods. In particular, we apply our model to (1) measured human motion data and (2) latent embeddings obtained via an autoencoder trained on image sequences. We demonstrate that we can faithfully reconstruct and separate both the conservative and forced dynamics, yielding interpretable and physically consistent predictions.