STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching

📄 arXiv: 2603.08478v1 📥 PDF

作者: Prakrut Kotecha, Ganga Nair B, Shishir Kolathaya

分类: cs.RO, cs.LG

发布日期: 2026-03-09

备注: 9 pages, 7 figures


💡 一句话要点

提出STRIDE框架以解决不确定环境下的机器人动态建模问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 动态建模 机器人技术 拉格朗日神经网络 条件流匹配 不确定性处理 物理一致性 深度学习

📋 核心要点

  1. 现有方法在复杂交互效应的建模上存在不足,无法有效处理不确定环境中的动态变化。
  2. STRIDE框架通过将刚体力学与随机交互效应分离,采用LNN和CFM联合建模,提升了模型的物理一致性和复杂性处理能力。
  3. 实验表明,STRIDE在多个复杂系统上表现出色,显著降低了长时间预测和接触力预测的误差,提升了模型的可靠性。

📝 摘要(中文)

在不规则环境中运行的机器人系统面临着来自间歇性接触、摩擦变异和未建模顺应性等因素带来的显著不确定性。尽管近期的无模型方法表现出色,但许多应用场景仍需支持规划、约束处理和在线适应的预测模型。本文提出了STRIDE,一个动态学习框架,明确将保守的刚体力学与不确定的随机非保守交互效应分离。结构化部分采用拉格朗日神经网络(LNN)建模,以保持能量一致的惯性动态,而残余交互力则通过条件流匹配(CFM)来捕捉多模态交互现象。通过联合端到端训练,模型在保持物理结构的同时,能够表示复杂的随机行为。实验结果显示,与确定性残余基线相比,长时间预测误差降低20%,接触力预测误差降低30%。

🔬 方法详解

问题定义:本文旨在解决在不确定环境中,机器人动态建模的复杂性和不确定性问题。现有的模型往往无法有效捕捉复杂的交互效应,导致预测不准确。

核心思路:STRIDE框架通过将保守的刚体力学与随机的非保守交互效应分开建模,采用拉格朗日神经网络(LNN)和条件流匹配(CFM)相结合的方法,以保持物理一致性并捕捉复杂的随机行为。

技术框架:STRIDE的整体架构包括两个主要模块:一是使用LNN建模的刚体力学部分,二是通过CFM建模的残余交互力部分。两者通过端到端的联合训练进行优化,确保模型在动态变化下的适应性。

关键创新:STRIDE的主要创新在于将传统的刚体力学与现代的深度学习方法相结合,形成了一种新的动态建模方式。这种方法能够有效捕捉复杂的交互现象,同时保持物理一致性,克服了现有方法的局限性。

关键设计:在设计上,LNN部分采用了能量一致性约束,确保模型在物理上合理;CFM部分则通过条件概率分布建模多模态交互现象,增强了模型的灵活性和适应性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,STRIDE在多个复杂系统上实现了长时间预测误差降低20%和接触力预测误差降低30%的显著提升,相较于传统的确定性残余基线,表现出更高的可靠性和准确性。

🎯 应用场景

STRIDE框架具有广泛的应用潜力,尤其适用于需要高精度动态建模的机器人系统,如自主驾驶、服务机器人和工业自动化等领域。其在不确定环境中的可靠性和适应性将推动机器人技术的进一步发展和应用。

📄 摘要(原文)

Robotic systems operating in unstructured environments must operate under significant uncertainty arising from intermittent contacts, frictional variability, and unmodeled compliance. While recent model-free approaches have demonstrated impressive performance, many deployment settings still require predictive models that support planning, constraint handling, and online adaptation. Analytical rigid-body models provide strong physical structure but often fail to capture complex interaction effects, whereas purely data-driven models may violate physical consistency, exhibit data bias, and accumulate long-horizon drift. In this work, we propose STRIDE, a dynamics learning framework that explicitly separates conservative rigid-body mechanics from uncertain, effectively stochastic non-conservative interaction effects. The structured component is modeled using a Lagrangian Neural Network (LNN) to preserve energy-consistent inertial dynamics, while residual interaction forces are represented using Conditional Flow Matching (CFM) to capture multi-modal interaction phenomena. The two components are trained jointly end-to-end, enabling the model to retain physical structure while representing complex stochastic behavior. We evaluate STRIDE on systems of increasing complexity, including a pendulum, the Unitree Go1 quadruped, and the Unitree G1 humanoid. Results show 20% reduction in long-horizon prediction error and 30% reduction in contact force prediction error compared to deterministic residual baselines, supporting more reliable model-based control in uncertain robotic environments.