TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

📄 arXiv: 2603.08128v1 📥 PDF

作者: Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi

分类: cs.RO, cs.LG

发布日期: 2026-03-09

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

TRIAGE:通过概率-认知门控估计实现机器人操作和自适应感知中的类型路由干预

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 机器人操作 不确定性估计 偶然不确定性 认知不确定性 自适应感知 类型路由干预 马氏距离

📋 核心要点

  1. 现有不确定性感知机器人系统将不确定性聚合为单一标量,忽略了其来源差异,导致纠正措施可能失效。
  2. TRIAGE框架将不确定性分解为偶然不确定性和认知不确定性,分别用于观测恢复和控制动作调节。
  3. 实验表明,该方法在机器人操作和自适应感知任务中均取得了显著提升,例如操作成功率提升至80.4%。

📝 摘要(中文)

大多数不确定性感知的机器人系统将预测不确定性折叠成一个单一的标量分数,并使用它来触发统一的纠正响应。这种聚合掩盖了不确定性是来自损坏的观测还是来自学习模型与真实系统动力学之间的不匹配。因此,纠正措施可能会应用于闭环的错误组件,从而降低相对于保持策略不变的性能。我们引入了一个轻量级的后验框架,将不确定性分解为偶然不确定性和认知不确定性,并使用这些信号来调节推理时的系统响应。偶然不确定性是使用马氏距离密度模型从观测分布的偏差中估计的,而认知不确定性是使用噪声鲁棒的前向动力学集成检测的,该集成将模型不匹配与测量损坏隔离开来。这两个信号在闭环执行期间在经验上保持接近正交,并启用特定类型的响应。高偶然不确定性触发观测恢复,而高认知不确定性缓和控制动作。相同的信号还通过在跟踪推理期间引导模型容量选择来调节自适应感知。实验证明了控制和感知任务的一致改进。在机器人操作中,分解控制器在复合扰动下将任务成功率从 59.4% 提高到 80.4%,并且优于组合不确定性基线高达 21.0%。在 MOT17 上的自适应跟踪推理中,不确定性引导的模型选择相对于固定的高容量检测器将平均计算量减少了 58.2%,同时将检测质量保持在 0.4% 以内。

🔬 方法详解

问题定义:现有不确定性感知的机器人系统通常将所有类型的不确定性(例如,来自噪声观测或模型不匹配)聚合为一个单一的不确定性度量。这种做法的痛点在于,它无法区分不同来源的不确定性,导致系统采取的纠正措施可能并不针对问题的根源,反而可能降低性能。

核心思路:TRIAGE的核心思路是将不确定性分解为两个互补的部分:偶然不确定性(aleatoric uncertainty)和认知不确定性(epistemic uncertainty)。偶然不确定性反映了数据本身的噪声和不确定性,而认知不确定性反映了模型对自身预测的不确定性。通过区分这两种不确定性,系统可以采取更有针对性的干预措施。

技术框架:TRIAGE框架包含以下主要模块:1) 偶然不确定性估计模块,使用马氏距离密度模型来评估观测分布的偏差;2) 认知不确定性估计模块,使用噪声鲁棒的前向动力学集成来检测模型不匹配;3) 类型特定响应模块,根据偶然不确定性和认知不确定性的高低,分别触发观测恢复和控制动作调节;4) 自适应感知模块,利用不确定性信息引导模型容量选择,从而实现计算效率和检测质量的平衡。

关键创新:TRIAGE最重要的技术创新点在于对不确定性的分解和类型特定响应。与现有方法将所有不确定性视为相同并采取统一纠正措施不同,TRIAGE能够区分偶然不确定性和认知不确定性,并根据不同类型的不确定性采取不同的干预措施。这种方法能够更有效地解决问题,并提高系统的整体性能。

关键设计:偶然不确定性估计模块使用马氏距离来衡量观测值与预期分布之间的偏差。认知不确定性估计模块使用一个前向动力学模型集成,并通过添加噪声来提高模型的鲁棒性。类型特定响应模块使用门控机制来调节控制动作和观测恢复的强度。自适应感知模块使用不确定性信息来选择合适的模型容量,以在计算效率和检测质量之间取得平衡。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,TRIAGE框架在机器人操作任务中,在复合扰动下将任务成功率从59.4%提高到80.4%,并且优于组合不确定性基线高达21.0%。在MOT17上的自适应跟踪推理中,不确定性引导的模型选择相对于固定的高容量检测器将平均计算量减少了58.2%,同时将检测质量保持在0.4%以内。

🎯 应用场景

该研究成果可广泛应用于机器人操作、自动驾驶、智能监控等领域。通过区分不同类型的不确定性,系统能够更有效地应对复杂环境中的挑战,提高任务的成功率和系统的鲁棒性。未来,该方法有望应用于更广泛的机器人和人工智能系统中,实现更智能、更可靠的决策。

📄 摘要(原文)

Most uncertainty-aware robotic systems collapse prediction uncertainty into a single scalar score and use it to trigger uniform corrective responses. This aggregation obscures whether uncertainty arises from corrupted observations or from mismatch between the learned model and the true system dynamics. As a result, corrective actions may be applied to the wrong component of the closed loop, degrading performance relative to leaving the policy unchanged. We introduce a lightweight post hoc framework that decomposes uncertainty into aleatoric and epistemic components and uses these signals to regulate system responses at inference time. Aleatoric uncertainty is estimated from deviations in the observation distribution using a Mahalanobis density model, while epistemic uncertainty is detected using a noise robust forward dynamics ensemble that isolates model mismatch from measurement corruption. The two signals remain empirically near orthogonal during closed loop execution and enable type specific responses. High aleatoric uncertainty triggers observation recovery, while high epistemic uncertainty moderates control actions. The same signals also regulate adaptive perception by guiding model capacity selection during tracking inference. Experiments demonstrate consistent improvements across both control and perception tasks. In robotic manipulation, the decomposed controller improves task success from 59.4% to 80.4% under compound perturbations and outperforms a combined uncertainty baseline by up to 21.0%. In adaptive tracking inference on MOT17, uncertainty-guided model selection reduces average compute by 58.2% relative to a fixed high capacity detector while preserving detection quality within 0.4%. Code and demo videos are available at https://divake.github.io/uncertainty-decomposition/.