SUBTA: A Framework for Supported User-Guided Bimanual Teleoperation in Structured Assembly

📄 arXiv: 2603.10459v1 📥 PDF

作者: Xiao Liu, Prakash Baskaran, Songpo Li, Simon Manschitz, Wei Ma, Dirk Ruiken, Soshi Iba

分类: cs.RO

发布日期: 2026-03-11

备注: 8 pages, 7 figures, accepted at ICRA 2026


💡 一句话要点

SUBTA:结构化装配中支持用户引导的双臂遥操作框架

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 双臂遥操作 人机协作 意图估计 场景图 运动辅助 结构化装配 共享自主

📋 核心要点

  1. 现有遥操作系统在人机协作装配任务中,缺乏对人类意图的准确理解和任务结构的有效利用,导致机器人辅助的时机和方式不够优化。
  2. SUBTA框架通过学习人类意图、利用场景图进行任务规划,并结合上下文相关的运动辅助,实现了对双臂遥操作的智能支持。
  3. 实验结果表明,SUBTA在提高位置和方向精度、降低用户心理负荷方面显著优于传统遥操作,并提供了更清晰和可信赖的反馈。

📝 摘要(中文)

本文提出了一种用于双臂装配的支持遥操作系统SUBTA,该系统通过学习的意图估计、场景图任务规划和上下文相关的运动辅助来增强人机协作。SUBTA旨在通过精确和直观的支持来提高人类操作员的性能。通过用户研究(N=12),对比了标准遥操作、仅运动支持和SUBTA。线性混合效应分析表明,SUBTA在位置精度(p<0.001, d=1.18)和方向精度(p<0.001, d=1.75)方面显著优于标准遥操作,同时降低了心理负荷(p=0.002, d=1.34)。实验后评分表明,SUBTA提供了更清晰、更值得信赖的可视化反馈和可预测的干预。结果表明,SUBTA极大地提高了遥操作的有效性和用户体验。

🔬 方法详解

问题定义:现有的双臂遥操作系统在结构化装配任务中,难以准确推断操作员的意图,无法根据任务结构提供最佳的辅助。这导致操作精度低、操作员心理负担重,影响了人机协作的效率。现有方法通常依赖于预定义的运动轨迹或简单的力反馈,缺乏对复杂任务上下文的理解和动态适应能力。

核心思路:SUBTA的核心思路是结合学习的意图估计、场景图任务规划和上下文相关的运动辅助,构建一个智能的遥操作系统。通过学习人类操作员的动作模式,系统能够预测操作员的意图,并利用场景图表示任务结构,从而确定最佳的辅助时机和方式。上下文相关的运动辅助则根据当前的任务状态和操作员的意图,提供精确的运动引导和约束。

技术框架:SUBTA框架包含三个主要模块:1) 意图估计模块,用于预测操作员的下一步动作;2) 任务规划模块,利用场景图表示任务结构,并生成最优的动作序列;3) 运动辅助模块,根据意图估计和任务规划的结果,提供上下文相关的运动引导和约束。整个流程是:操作员通过遥操作设备控制机器人,意图估计模块预测操作员的意图,任务规划模块根据意图和场景图生成最优动作序列,运动辅助模块根据动作序列提供运动引导,最终机器人执行操作。

关键创新:SUBTA的关键创新在于将学习的意图估计、场景图任务规划和上下文相关的运动辅助相结合,实现了一种智能的遥操作系统。与传统的遥操作系统相比,SUBTA能够更准确地理解操作员的意图,并根据任务结构提供更有效的辅助。这种方法能够显著提高操作精度、降低操作员的心理负担,并提高人机协作的效率。

关键设计:意图估计模块可能采用循环神经网络(RNN)或Transformer等序列模型,对操作员的动作序列进行建模。场景图任务规划模块可能使用A*搜索或强化学习等算法,生成最优的动作序列。运动辅助模块可能采用力/位混合控制或阻抗控制等方法,提供精确的运动引导和约束。具体的参数设置、损失函数和网络结构等技术细节在论文中可能没有详细描述,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

用户研究表明,SUBTA在位置精度(p<0.001, d=1.18)和方向精度(p<0.001, d=1.75)方面显著优于标准遥操作,同时降低了心理负荷(p=0.002, d=1.34)。这些数据表明,SUBTA能够显著提高遥操作的性能和用户体验。Cohen's d 值表明效果量较大,具有实际意义。

🎯 应用场景

SUBTA框架可应用于各种需要高精度和人机协作的遥操作场景,如精密仪器装配、医疗手术、太空探索和危险环境下的作业。该研究的实际价值在于提高遥操作的效率和安全性,降低操作员的技能要求和心理负担。未来,SUBTA有望与更先进的感知和控制技术相结合,实现更智能、更自主的遥操作系统。

📄 摘要(原文)

In human-robot collaboration, shared autonomy enhances human performance through precise, intuitive support. Effective robotic assistance requires accurately inferring human intentions and understanding task structures to determine optimal support timing and methods. In this paper, we present SUBTA, a supported teleoperation system for bimanual assembly that couples learned intention estimation, scene-graph task planning, and context-dependent motion assists. We validate our approach through a user study (N=12) comparing standard teleoperation, motion-support only, and SUBTA. Linear mixed-effects analysis revealed that SUBTA significantly outperformed standard teleoperation in position accuracy (p<0.001, d=1.18) and orientation accuracy (p<0.001, d=1.75), while reducing mental demand (p=0.002, d=1.34). Post-experiment ratings indicate clearer, more trustworthy visual feedback and predictable interventions in SUBTA. The results demonstrate that SUBTA greatly improves both effectiveness and user experience in teleoperation.