Beyond Autonomy: A Dynamic Tiered AgentRunner Framework for Governable and Resilient Enterprise AI Execution

📄 arXiv: 2605.10223v1 📥 PDF

作者: Kai Pan, Rong Hou

分类: cs.AI, cs.SE

发布日期: 2026-05-11

备注: 9 pages, 2 figures, 3 tables


💡 一句话要点

提出动态分层AgentRunner框架,以实现企业级AI执行的可治理性与韧性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 企业级AI 代理框架 权力制衡 风险管理 系统韧性 多代理系统 计算资源调度

📋 核心要点

  1. 现有LLM代理框架过于强调自主性,导致在企业级应用中缺乏必要的风险控制、审查机制及资源分配策略。
  2. 提出动态分层AgentRunner框架,通过风险自适应分层、权力制衡架构及验证-恢复闭环,实现受控的AI执行。
  3. 该框架在保障企业级安全合规的前提下,实现了计算资源的最优分配,显著提升了复杂任务的执行成功率与系统韧性。

📝 摘要(中文)

当前大语言模型(LLM)代理框架过度追求自主性,却缺乏企业部署所需的治理机制。高风险写入操作往往在缺乏独立审查的情况下执行,复杂任务缺乏验收验证,且计算资源分配未考虑风险等级。为此,本文提出了“动态分层AgentRunner”(Dynamic Tiered AgentRunner),这是一种源自生产级多租户SaaS平台的受控执行协议。该框架引入了三大核心机制:一是基于任务风险配置动态分配计算资源与审查强度的“风险自适应分层”;二是将提案、审查、执行与验证由物理隔离的独立代理执行的“权力制衡架构”;三是视故障为一等系统状态的“验证-恢复闭环”设计,从而提升了系统的韧性。

🔬 方法详解

问题定义:现有AI代理框架在企业环境中面临“治理真空”问题,表现为高风险操作缺乏审查、任务执行缺乏验证,以及计算资源分配与任务风险等级不匹配,导致生产环境下的安全隐患与资源浪费。

核心思路:借鉴生产级SaaS平台的治理经验,引入“受控执行协议”。核心逻辑是将代理的自主性与企业合规性解耦,通过分层机制平衡安全性与执行效率,确保所有关键操作均处于可控、可审计的闭环中。

技术框架:框架包含三个核心模块:风险自适应分层器(负责任务分级与资源调度)、权力制衡执行引擎(通过物理隔离的代理分别负责提案、审查、执行、验证)以及验证-恢复闭环系统(处理执行失败并触发自动修复)。

关键创新:引入了“权力制衡”架构,通过物理隔离的代理角色分配,从系统层面杜绝了单点故障与越权操作,这是区别于传统单一代理架构的本质特征。

关键设计:采用了帕累托最优(Pareto-optimal)的资源调度策略,根据任务风险评级动态调整审查强度;设计了“验证-恢复”闭环,将系统故障视为一等公民状态,通过预定义的恢复协议确保任务的最终一致性。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,该框架通过风险自适应分层,在保持高安全性审查的同时,显著降低了低风险任务的延迟。与基线方法相比,该框架在复杂任务执行中的成功率提升了显著比例,且在故障恢复测试中表现出极高的鲁棒性,证明了其在生产环境下的实际部署价值(具体性能数据需参考论文全文)。

🎯 应用场景

该框架适用于对安全性与合规性要求极高的企业级AI场景,如自动化财务审计、代码库自动维护、企业内部数据处理及关键业务流程自动化。它能够有效降低AI代理在执行高风险操作时的失控风险,为企业部署大规模自主代理提供了一套标准化的治理范式。

📄 摘要(原文)

Current large language model agent frameworks prioritize autonomy but lack the governability mechanisms required for enterprise deployment. High-risk write operations proceed without independent review, complex tasks lack acceptance verification, and computational resources are allocated uniformly regardless of risk level. We propose the Dynamic Tiered AgentRunner, a controlled execution protocol distilled from a production-grade multi-tenant SaaS platform. The framework introduces three core mechanisms: (1) Risk-Adaptive Tiering that dynamically allocates computational resources and review intensity based on task risk profiles, achieving Pareto-optimal trade-offs between safety and efficiency; (2) Separation of Powers architecture where proposal, review, execution, and verification are performed by independent agents with physically isolated boundaries; and (3) Resilience-by-Design through a Verifier-Recovery closed loop that treats failure as a first-class system state. We formalize the tier selectio