Muscle Synergy Priors Enhance Biomechanical Fidelity in Predictive Musculoskeletal Locomotion Simulation

📄 arXiv: 2603.10474v1 📥 PDF

作者: Ilseung Park, Eunsik Choi, Jangwhan Ahn, Jooeun Ahn

分类: cs.LG, cs.NE, cs.RO

发布日期: 2026-03-11

备注: 12 pages, 5 figures


💡 一句话要点

利用肌肉协同先验知识提升预测性肌肉骨骼运动仿真的生物力学保真度

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 肌肉协同 肌肉骨骼仿真 强化学习 生物力学 运动控制

📋 核心要点

  1. 现有肌肉骨骼仿真方法难以模拟高维神经肌肉控制下的人类运动,面临生物力学保真度不足的挑战。
  2. 该论文提出一种基于肌肉协同先验知识的强化学习框架,通过低维协同基约束控制,提升仿真结果的生理合理性。
  3. 实验表明,该方法在不同速度、坡度和地形下生成稳定步态,并提高了关节运动学、动力学和地面反作用力的生物力学保真度。

📝 摘要(中文)

人类的运动源于高维神经肌肉控制,这使得预测性肌肉骨骼仿真充满挑战。本文提出了一种生理学驱动的强化学习框架,该框架利用肌肉协同来约束控制。我们从少量地面行走试验的逆向肌肉骨骼分析中提取了一个低维协同基,并将其用作肌肉驱动的三维模型的动作空间,该模型在不同的速度、坡度和不平坦地形上进行训练。由此产生的控制器在0.7-1.8米/秒的速度和±6°的坡度上产生了稳定的步态,并重现了关节角度、关节力矩和地面反作用力的条件依赖性调制。与无约束控制器相比,协同约束控制减少了非生理性的膝关节运动学,并将膝关节力矩曲线保持在实验范围内。在各种条件下,模拟的垂直地面反作用力与人类测量值高度相关,并且肌肉激活时间主要落在受试者间的变异性范围内。这些结果表明,将神经生理学结构嵌入强化学习可以提高预测性人类运动仿真的生物力学保真度和泛化能力,且只需有限的实验数据。

🔬 方法详解

问题定义:现有的肌肉骨骼运动仿真方法,尤其是在预测性仿真中,难以准确模拟人类复杂且高维的神经肌肉控制机制。这导致仿真结果在生物力学上不够真实,例如出现非生理性的关节运动或力矩。核心痛点在于如何在高维控制空间中找到合理的控制策略,并保证仿真结果的生理可行性。

核心思路:论文的核心思路是利用肌肉协同(muscle synergies)这一神经生理学概念来降低控制空间的维度。肌肉协同代表了神经系统控制肌肉的一种模块化方式,通过少数几个协同模式即可驱动多个肌肉的活动。通过将肌肉协同作为强化学习的动作空间,可以有效地约束控制策略,使其更符合生物学原理,从而提高仿真的生物力学保真度。

技术框架:整体框架包含以下几个主要步骤:1) 从少量实验数据(地面行走试验)中进行逆向肌肉骨骼分析,提取低维的肌肉协同基;2) 构建一个肌肉驱动的三维肌肉骨骼模型;3) 使用强化学习算法训练一个控制器,该控制器的动作空间由提取的肌肉协同基定义;4) 在不同的速度、坡度和地形条件下评估控制器的性能,并与无约束控制器进行比较。

关键创新:最重要的技术创新点在于将神经生理学先验知识(肌肉协同)嵌入到强化学习框架中。与传统的无约束控制方法相比,该方法能够有效地约束控制策略,使其更符合生物学原理,从而提高仿真的生物力学保真度。此外,该方法只需要少量实验数据即可提取肌肉协同基,降低了对实验数据的依赖。

关键设计:论文中,肌肉协同基是通过非负矩阵分解(NMF)从实验数据中提取的。强化学习算法采用了一种基于策略梯度的方法,目标是最大化模型在不同条件下的行走速度和稳定性。损失函数的设计考虑了步态的周期性、能量消耗以及对关节极限的约束。具体的参数设置,例如协同基的维度、强化学习的奖励函数权重等,需要根据具体的模型和任务进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,基于肌肉协同的强化学习控制器能够生成稳定的步态,并在不同速度和坡度下表现出良好的泛化能力。与无约束控制器相比,该方法显著降低了非生理性的膝关节运动学,并将膝关节力矩曲线保持在实验范围内。模拟的垂直地面反作用力与人类测量值高度相关,肌肉激活时序也与实验数据吻合,验证了该方法的有效性。

🎯 应用场景

该研究成果可应用于康复机器人控制、外骨骼设计、运动损伤预测与预防、以及虚拟现实运动训练等领域。通过更真实的肌肉骨骼运动仿真,可以更好地理解人类运动的神经肌肉控制机制,并为相关工程应用提供更可靠的理论基础和设计指导。未来,该方法有望扩展到更复杂的运动任务和更精细的肌肉骨骼模型。

📄 摘要(原文)

Human locomotion emerges from high-dimensional neuromuscular control, making predictive musculoskeletal simulation challenging. We present a physiology-informed reinforcement-learning framework that constrains control using muscle synergies. We extracted a low-dimensional synergy basis from inverse musculoskeletal analyses of a small set of overground walking trials and used it as the action space for a muscle-driven three-dimensional model trained across variable speeds, slopes and uneven terrain. The resulting controller generated stable gait from 0.7-1.8 m/s and on $\pm$ 6$^{\circ}$ grades and reproduced condition-dependent modulation of joint angles, joint moments and ground reaction forces. Compared with an unconstrained controller, synergy-constrained control reduced non-physiological knee kinematics and kept knee moment profiles within the experimental envelope. Across conditions, simulated vertical ground reaction forces correlated strongly with human measurements, and muscle-activation timing largely fell within inter-subject variability. These results show that embedding neurophysiological structure into reinforcement learning can improve biomechanical fidelity and generalization in predictive human locomotion simulation with limited experimental data.