Reducing Robotic Upper-Limb Assessment Time While Maintaining Precision: A Time Series Foundation Model Approach
作者: Faranak Akbarifar, Nooshin Maghsoodi, Sean P Dukelow, Stephen Scott, Parvin Mousavi
分类: cs.RO, cs.LG
发布日期: 2025-10-31
💡 一句话要点
利用时序基础模型,在保证精度的前提下,缩短机器人上肢评估时间
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 机器人评估 上肢运动 时序预测 基础模型 运动学特征
📋 核心要点
- Kinarm机器人VGR评估虽然有效,但耗时较长,容易引起疲劳,限制了其临床应用。
- 提出利用时序基础模型预测后续抓取轨迹,从而减少实际需要的抓取次数,缩短评估时间。
- 实验表明,使用Chronos模型预测,仅需8次实际抓取即可达到与24-28次抓取相当的评估精度。
📝 摘要(中文)
本研究旨在缩短Kinarm机器人上视觉引导抓取(VGR)评估时间,该评估虽能产生敏感的运动学生物标志物,但需40-64次抓取,造成时间和疲劳负担。我们评估了时序基础模型能否通过预测未记录的试验来替代早期抓取子集,同时保持标准Kinarm参数的可靠性。我们分析了461名中风患者和599名对照参与者的VGR速度信号,使用了4目标和8目标抓取协议。我们仅保留前8或16次抓取试验,并使用ARIMA、MOMENT和Chronos模型(在70%的受试者上进行微调)来预测合成试验。我们重新计算了抓取的四个运动学特征(反应时间、运动时间、姿势速度、最大速度),并使用ICC(2,1)将记录的试验与预测的试验组合后的结果与完整长度的参考结果进行比较。结果表明,仅使用8次记录的试验加上Chronos预测,所有参数的ICC均恢复到>=0.90,与24-28次记录的抓取的可靠性相匹配(Delta ICC <= 0.07)。MOMENT产生了中等程度的增益,而ARIMA的改进最小。在不同的队列和协议中,合成试验在不严重影响特征可靠性的情况下替代了抓取。结论是,基础模型预测可以大大缩短Kinarm VGR评估时间。对于受损最严重的中风幸存者,评估时间从4-5分钟降至约1分钟,同时保持运动学精度。这种预测增强的范例有望实现高效的机器人评估,以评估中风后的运动障碍。
🔬 方法详解
问题定义:论文旨在解决Kinarm机器人上肢运动评估中,视觉引导抓取(VGR)任务耗时过长的问题。传统的VGR评估需要进行40-64次抓取试验,这对于患者,特别是中风患者,会造成较大的时间和疲劳负担,影响评估的效率和准确性。现有方法的痛点在于无法在保证评估精度的前提下,显著缩短评估时间。
核心思路:论文的核心思路是利用时序基础模型学习VGR任务中的运动模式,并基于少量已记录的抓取试验数据,预测后续的抓取轨迹。通过将预测的轨迹与实际记录的轨迹相结合,可以减少实际需要的抓取次数,从而缩短评估时间,同时保持评估结果的可靠性。这种方法的核心在于利用模型的泛化能力,从少量数据中提取出足够的信息,用于准确预测后续的运动轨迹。
技术框架:整体框架包括以下几个主要阶段:1) 数据收集:收集大量中风患者和健康对照组的VGR任务数据,包括速度信号等运动学信息。2) 模型选择与训练:选择合适的时序基础模型,如ARIMA、MOMENT和Chronos,并使用70%的受试者数据进行微调训练。3) 轨迹预测:使用训练好的模型,基于前8或16次抓取试验的数据,预测后续的抓取轨迹。4) 特征提取与评估:将实际记录的轨迹与预测的轨迹相结合,重新计算运动学特征(如反应时间、运动时间、姿势速度、最大速度),并使用ICC(2,1)评估预测轨迹的可靠性。
关键创新:最重要的技术创新点在于将时序基础模型应用于机器人上肢运动评估,并证明了其在减少评估时间的同时,保持评估精度的可行性。与传统的基于统计或机器学习的运动分析方法相比,时序基础模型具有更强的泛化能力和预测精度,能够更好地捕捉VGR任务中的复杂运动模式。
关键设计:论文中关键的设计包括:1) 模型选择:选择了ARIMA、MOMENT和Chronos三种不同的时序模型进行比较,最终发现Chronos模型的性能最佳。2) 数据预处理:对原始的速度信号数据进行预处理,以提高模型的训练效果。3) 评估指标:使用ICC(2,1)作为评估预测轨迹可靠性的指标,该指标能够反映预测轨迹与实际轨迹的一致性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,使用Chronos模型预测,仅需8次实际抓取即可达到与24-28次抓取相当的评估精度(ICC >= 0.90,Delta ICC <= 0.07)。对于受损最严重的中风患者,评估时间从4-5分钟缩短至约1分钟,显著提高了评估效率,同时保持了运动学精度。MOMENT模型也取得了一定的增益,而ARIMA模型的改进最小。
🎯 应用场景
该研究成果可应用于中风、脑瘫等神经系统疾病患者的上肢运动功能评估与康复。通过缩短评估时间,减轻患者负担,提高评估效率,有助于临床医生更快速、准确地了解患者的运动障碍程度,制定个性化的康复方案。此外,该方法还可推广到其他类型的机器人运动评估任务中,具有广泛的应用前景。
📄 摘要(原文)
Purpose: Visually Guided Reaching (VGR) on the Kinarm robot yields sensitive kinematic biomarkers but requires 40-64 reaches, imposing time and fatigue burdens. We evaluate whether time-series foundation models can replace unrecorded trials from an early subset of reaches while preserving the reliability of standard Kinarm parameters. Methods: We analyzed VGR speed signals from 461 stroke and 599 control participants across 4- and 8-target reaching protocols. We withheld all but the first 8 or 16 reaching trials and used ARIMA, MOMENT, and Chronos models, fine-tuned on 70 percent of subjects, to forecast synthetic trials. We recomputed four kinematic features of reaching (reaction time, movement time, posture speed, maximum speed) on combined recorded plus forecasted trials and compared them to full-length references using ICC(2,1). Results: Chronos forecasts restored ICC >= 0.90 for all parameters with only 8 recorded trials plus forecasts, matching the reliability of 24-28 recorded reaches (Delta ICC <= 0.07). MOMENT yielded intermediate gains, while ARIMA improvements were minimal. Across cohorts and protocols, synthetic trials replaced reaches without materially compromising feature reliability. Conclusion: Foundation-model forecasting can greatly shorten Kinarm VGR assessment time. For the most impaired stroke survivors, sessions drop from 4-5 minutes to about 1 minute while preserving kinematic precision. This forecast-augmented paradigm promises efficient robotic evaluations for assessing motor impairments following stroke.