ANCHOR: A Physically Grounded Closed-Loop Framework for Robust Home-Service Mobile Manipulation
作者: Jinhao Jiang, Shengyu Fang, Sibo Zuo, Yujie Tang, Yirui Li
分类: cs.RO
发布日期: 2026-04-28
🔗 代码/项目: PROJECT_PAGE
💡 一句话要点
ANCHOR:面向家庭服务机器人,提出物理 grounding 的闭环框架,提升操作鲁棒性。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 移动操作 家庭服务机器人 物理Grounding 闭环控制 任务规划 鲁棒性 分层恢复
📋 核心要点
- 现有移动操作系统依赖预扫描地图,易受环境变化影响,且忽略操作可行性,导致任务失败。
- ANCHOR 框架通过物理锚定任务规划、操作性感知基座对齐和分层恢复机制,实现符号推理与物理状态对齐。
- 实验表明,ANCHOR 显著提升了家庭服务机器人在真实环境中的任务成功率和抗干扰能力。
📝 摘要(中文)
本文提出ANCHOR,一个物理 grounding 的闭环框架,旨在提升家庭服务移动操作的鲁棒性。现有系统常依赖预扫描的语义地图,易受场景变化干扰;导航终点选择忽略操作可行性,导致“到达但不可操作”问题;异常处理采用无差别全局重规划,难以控制局部错误。为解决执行不一致问题,ANCHOR将符号推理与可验证的物理状态对齐,集成了物理锚定任务规划(将符号谓词绑定到可观察的几何锚点并重新验证)、操作性感知的基座对齐(确保导航终点满足运动学可达性和局部碰撞可行性)和最小责任层级恢复(定位感知、基座-手臂协调和执行层中的故障,防止级联重试)。在真实机器人实验中,ANCHOR将任务成功率从53.3%提高到71.7%,扰动下的恢复率达到71.4%。
🔬 方法详解
问题定义:现有开放词汇移动操作系统在真实家庭环境中面临鲁棒性挑战。主要痛点在于符号计划与物理世界状态不一致,具体表现为:依赖预扫描地图导致环境变化后地图失效;导航终点选择未考虑后续操作可行性;异常处理采用全局重规划,无法有效控制局部错误。
核心思路:ANCHOR 的核心思路是通过物理 grounding 将符号推理与物理世界状态对齐。具体来说,将符号谓词绑定到可观察的几何锚点,并在执行过程中不断验证这些锚点,确保计划的有效性。同时,在导航过程中考虑操作可行性,避免到达无法操作的位置。最后,采用分层恢复机制,精确定位并解决问题,防止级联重试。
技术框架:ANCHOR 框架包含三个主要模块:1) 物理锚定任务规划:将符号谓词与几何锚点绑定,并在每次动作后重新验证。2) 操作性感知的基座对齐:在导航到目标位置时,考虑机器人手臂的运动学可达性和局部碰撞可行性,确保到达的位置能够顺利进行后续操作。3) 最小责任层级恢复:当出现错误时,首先尝试在局部进行恢复,如果失败,则逐步向上层报告,最终进行全局重规划。
关键创新:ANCHOR 的关键创新在于其物理 grounding 的闭环框架,它将符号推理与物理世界状态紧密结合,通过不断验证和调整,提高了系统的鲁棒性。与现有方法相比,ANCHOR 不仅考虑了语义理解,还关注了物理可行性,从而能够更好地应对真实环境中的各种挑战。
关键设计:物理锚定任务规划中,几何锚点的选择至关重要,需要选择易于观察和验证的特征。操作性感知的基座对齐需要考虑机器人手臂的运动学模型和环境的几何信息,以确保可达性和无碰撞。最小责任层级恢复需要设计合理的错误检测机制和恢复策略,以实现快速有效的故障排除。
🖼️ 关键图片
📊 实验亮点
ANCHOR 在真实机器人实验中取得了显著的性能提升。在未见过的环境中,任务成功率从 53.3% 提高到 71.7%,在受到扰动的情况下,恢复率达到 71.4%。这些结果表明,物理 grounding 和结构化故障控制对于提高移动操作的鲁棒性至关重要。
🎯 应用场景
该研究成果可应用于家庭服务机器人、仓储物流机器人等领域,提升机器人在复杂动态环境中的操作能力和鲁棒性。通过物理 grounding 和闭环反馈,机器人能够更好地理解和适应环境变化,从而完成更复杂的任务,例如物品整理、清洁打扫等,具有重要的实际应用价值和广阔的市场前景。
📄 摘要(原文)
Recent advances in open-vocabulary mobile manipulation have brought robots into real domestic environments. In such settings, reliable long-horizon execution under open-set object references and frequent disturbances becomes essential. However, many failures persist. These are not caused by semantic misunderstanding but by inconsistencies between symbolic plans and the evolving physical world, manifested as three recurring limitations: (i) existing systems often rely on pre-scanned semantic maps that become inconsistent after scene changes and disturbances; (ii) they select navigation endpoints without considering downstream manipulation feasibility, causing the "arrived but inoperable" problem; and (iii) they handle anomalies through undifferentiated global replanning, which often fails to contain local errors. To address this execution inconsistency, we present ANCHOR, a physically grounded closed-loop framework that aligns symbolic reasoning with verifiable physical state during execution. ANCHOR integrates three mechanisms: (i) physically anchored task planning, which binds symbolic predicates to observable geometric anchors and re-validates them after each action; (ii) operability-aware base alignment, which ensures that navigation endpoints satisfy kinematic reachability and local collision feasibility; and (iii) minimum-responsible-layer hierarchical recovery, which localizes failures across perception, base-arm coordination, and execution layers to prevent cascading retries. Across 60 real-robot trials in previously unseen environments, ANCHOR improves task success from 53.3% to 71.7% and achieves a 71.4% recovery rate under perturbations, demonstrating that explicit physical grounding and structured failure containment are critical for robust mobile manipulation. Our project page is available at https://anchor9178.github.io/ANCHOR/ .