SID: Sliding into Distribution for Robust Few-Demonstration Manipulation

📄 arXiv: 2605.13428v1 📥 PDF

作者: Yicheng Ma, Wei Yu, Zhian Su, Xidan Zhang, Huixu Dong

分类: cs.RO

发布日期: 2026-05-13

备注: 20 pages, 14 figures. Project website: https://sliding-into-distribution.github.io/


💡 一句话要点

提出SID框架以解决少量演示下的鲁棒性操控问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture) 支柱六:视频提取与匹配 (Video Extraction)

关键词: 机器人操控 少量演示 分布外执行 运动场学习 自我中心策略 动态环境 任务特定操控

📋 核心要点

  1. 现有机器人操控方法在少量演示下难以泛化,尤其在面对物体姿态和动态干扰时表现不佳。
  2. 本文提出的SID框架通过学习运动场,逐步将系统滑向演示流形,显著提高了操控的鲁棒性。
  3. 在六个真实任务中,SID在仅有两个演示的情况下实现了约90%的成功率,表现出色。

📝 摘要(中文)

在机器人操控中,跨越物体姿态、视角和动态干扰的泛化能力较弱,尤其是在仅有少量演示的情况下。现有的端到端视觉运动策略虽然表达能力强,但对数据的需求较高;而规划和优化方法虽然满足明确约束,但未能直接捕捉人类展示的交互策略。为此,本文提出了滑动到分布(SID)框架,通过从规范化演示中学习物体中心的运动场,逐步将系统滑向演示流形并进入轻量级自我中心执行策略的可靠操作区域,从而减轻分布外执行问题。实验结果表明,SID在六个真实任务中,在仅有两个演示的情况下,成功率约为90%,在干扰和外部扰动下的下降幅度低于10%。

🔬 方法详解

问题定义:本文旨在解决在少量演示下,机器人操控在物体姿态、视角和动态干扰下的泛化能力不足的问题。现有方法通常依赖大量数据或无法有效捕捉人类的交互策略。

核心思路:SID框架的核心思想是通过学习物体中心的运动场,逐步将系统滑向演示流形,从而进入可靠的操作区域,减少分布外执行的风险。

技术框架:SID的整体架构包括两个主要模块:首先是从规范化演示中学习运动场,其次是基于条件流匹配的自我中心策略进行任务特定操控。

关键创新:SID的创新之处在于其通过在线分布恢复显式管理分布转移,提供了一个新的少量演示操控范式,与传统方法相比,能够更好地应对动态环境中的变化。

关键设计:在设计中,SID采用了运动场的学习机制,结合了运动场的校正能力和自我中心策略的任务适应性,确保了在接近演示流形时的动作一致性和鲁棒性。具体的损失函数和网络结构细节在论文中进行了详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在六个真实任务中,SID框架在仅有两个演示的情况下,成功率达到了约90%。在面对干扰和外部扰动时,成功率下降幅度低于10%,显示出其优越的鲁棒性和适应能力。

🎯 应用场景

该研究的潜在应用领域包括服务机器人、工业自动化和人机协作等场景,能够在复杂和动态的环境中实现高效的操控。未来,SID框架有望推动机器人在少量示例学习中的广泛应用,提升其在实际操作中的灵活性和适应性。

📄 摘要(原文)

Generalizing robotic manipulation across object poses, viewpoints, and dynamic disturbances is difficult, especially with only a few demonstrations. End-to-end visuomotor policies are expressive but data-hungry, while planning and optimization satisfy explicit constraints but do not directly capture the interaction strategies demonstrated by humans. We propose Sliding into Distribution (SID), a structured framework that learns an object-centric motion field from canonicalized demonstrations to iteratively slide the system toward the demonstrated manifold and into the reliable operating region of a lightweight egocentric execution policy, mitigating out-of-distribution (OOD) execution. The motion field provides large corrective motions when far from the demonstration manifold and naturally vanishes near convergence, enabling robust reaching under substantial pose and viewpoint shifts. Within the reached regime, an egocentric policy trained with conditioned flow matching performs task-specific manipulation, supported by kinematically consistent point-cloud reprojection augmentation that preserves action-observation consistency. Across six real-world tasks, SID achieves approximately 90% success under OOD initializations with only two demonstrations, with under a 10% drop under distractors and external disturbances. Overall, SID provides a new paradigm for few-shot manipulation: explicitly managing distribution shift via online distribution recovery.