Beyond Autonomy: A Dynamic Tiered AgentRunner Framework for Governable and Resilient Enterprise AI Execution
作者: Kai Pan, Rong Hou
分类: cs.AI, cs.SE
发布日期: 2026-05-11
备注: 9 pages, 2 figures, 3 tables
💡 一句话要点
提出动态分层AgentRunner框架,以实现企业级AI执行的可治理性与韧性
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 企业级AI 代理框架 权力制衡 风险管理 系统韧性 多代理系统 计算资源调度
📋 核心要点
- 现有LLM代理框架过于强调自主性,导致在企业级应用中缺乏必要的风险控制、审查机制及资源分配策略。
- 提出动态分层AgentRunner框架,通过风险自适应分层、权力制衡架构及验证-恢复闭环,实现受控的AI执行。
- 该框架在保障企业级安全合规的前提下,实现了计算资源的最优分配,显著提升了复杂任务的执行成功率与系统韧性。
📝 摘要(中文)
当前大语言模型(LLM)代理框架过度追求自主性,却缺乏企业部署所需的治理机制。高风险写入操作往往在缺乏独立审查的情况下执行,复杂任务缺乏验收验证,且计算资源分配未考虑风险等级。为此,本文提出了“动态分层AgentRunner”(Dynamic Tiered AgentRunner),这是一种源自生产级多租户SaaS平台的受控执行协议。该框架引入了三大核心机制:一是基于任务风险配置动态分配计算资源与审查强度的“风险自适应分层”;二是将提案、审查、执行与验证由物理隔离的独立代理执行的“权力制衡架构”;三是视故障为一等系统状态的“验证-恢复闭环”设计,从而提升了系统的韧性。
🔬 方法详解
问题定义:现有AI代理框架在企业环境中面临“治理真空”问题,表现为高风险操作缺乏审查、任务执行缺乏验证,以及计算资源分配与任务风险等级不匹配,导致生产环境下的安全隐患与资源浪费。
核心思路:借鉴生产级SaaS平台的治理经验,引入“受控执行协议”。核心逻辑是将代理的自主性与企业合规性解耦,通过分层机制平衡安全性与执行效率,确保所有关键操作均处于可控、可审计的闭环中。
技术框架:框架包含三个核心模块:风险自适应分层器(负责任务分级与资源调度)、权力制衡执行引擎(通过物理隔离的代理分别负责提案、审查、执行、验证)以及验证-恢复闭环系统(处理执行失败并触发自动修复)。
关键创新:引入了“权力制衡”架构,通过物理隔离的代理角色分配,从系统层面杜绝了单点故障与越权操作,这是区别于传统单一代理架构的本质特征。
关键设计:采用了帕累托最优(Pareto-optimal)的资源调度策略,根据任务风险评级动态调整审查强度;设计了“验证-恢复”闭环,将系统故障视为一等公民状态,通过预定义的恢复协议确保任务的最终一致性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该框架通过风险自适应分层,在保持高安全性审查的同时,显著降低了低风险任务的延迟。与基线方法相比,该框架在复杂任务执行中的成功率提升了显著比例,且在故障恢复测试中表现出极高的鲁棒性,证明了其在生产环境下的实际部署价值(具体性能数据需参考论文全文)。
🎯 应用场景
该框架适用于对安全性与合规性要求极高的企业级AI场景,如自动化财务审计、代码库自动维护、企业内部数据处理及关键业务流程自动化。它能够有效降低AI代理在执行高风险操作时的失控风险,为企业部署大规模自主代理提供了一套标准化的治理范式。
📄 摘要(原文)
Current large language model agent frameworks prioritize autonomy but lack the governability mechanisms required for enterprise deployment. High-risk write operations proceed without independent review, complex tasks lack acceptance verification, and computational resources are allocated uniformly regardless of risk level. We propose the Dynamic Tiered AgentRunner, a controlled execution protocol distilled from a production-grade multi-tenant SaaS platform. The framework introduces three core mechanisms: (1) Risk-Adaptive Tiering that dynamically allocates computational resources and review intensity based on task risk profiles, achieving Pareto-optimal trade-offs between safety and efficiency; (2) Separation of Powers architecture where proposal, review, execution, and verification are performed by independent agents with physically isolated boundaries; and (3) Resilience-by-Design through a Verifier-Recovery closed loop that treats failure as a first-class system state. We formalize the tier selectio