Governance by Construction for Generalist Agents

📄 arXiv: 2605.20874v1 📥 PDF

作者: Segev Shlomov, Iftach Shoham, Alon Oved, Ido Levy, Sami Marreed, Harold Ship, Offer Akrabi, Sergey Zeltyn, Avi Yaeli, Nir Mashkif

分类: cs.AI, cs.SE

发布日期: 2026-05-20


💡 一句话要点

CUGA:通过构建治理通用智能体,实现企业级应用中可预测、可审计和合规的行为。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 通用智能体 治理 策略即代码 运行时治理 人机协作

📋 核心要点

  1. 现有企业智能体缺乏在复杂工作流中进行有效治理的能力,难以保证行为的可预测性、可审计性和合规性。
  2. CUGA提出了一种模块化的策略即代码层,通过在智能体执行的关键阶段进行策略干预,实现细粒度的运行时治理。
  3. 通过医疗保健场景的演示,验证了CUGA能够动态注入剧本、阻止恶意请求,并对高风险操作进行人工干预,从而提高策略遵守和执行一致性。

📝 摘要(中文)

企业智能体越来越多地需要在各种工具和界面上自主运行,但生产部署需要通过构建进行治理。系统必须指定允许哪些操作,何时需要人工监督,以及可以暴露哪些信息,而无需为每个领域重建智能体。本文演示了CUGA的策略系统,这是一个模块化的策略即代码层,它与通用LLM智能体结合,在复合工作流程中提供可预测、可审计和合规的行为,而无需模型微调。我们提出了一种运行时治理架构,该架构在执行的每个关键阶段强制执行策略干预。策略不是被动地约束行为,而是在五个结构检查点拦截智能体:规划上游(意图守卫)、系统提示内以指导推理(剧本)、工具调用边界以强制正确使用(工具指南)、推理循环外作为高风险操作的人工参与门(工具批准)以及输出阶段以过滤和构建最终响应(输出格式器)。总之,这些阶段将治理持续嵌入到智能体的执行管道中,而不是将其视为事后才考虑的事情。通过医疗保健场景和多层强制干预,演示展示了用于结构化工具序列强制执行的动态剧本注入、阻止恶意或意外有害请求的意图守卫,以及用于潜在破坏性操作的人工参与工具批准检查点。该演示说明了类型化治理原语如何能够更快、更安全地部署企业智能体系统,同时提高策略遵守和执行一致性。

🔬 方法详解

问题定义:企业智能体需要在各种工具和界面上自主运行,但现有方法难以在不重新构建智能体的情况下,保证其行为的可预测性、可审计性和合规性。现有的方法缺乏细粒度的控制,无法在智能体的执行过程中进行有效的干预和治理。

核心思路:CUGA的核心思路是通过构建治理(Governance by Construction)来实现对通用智能体的有效控制。它将治理嵌入到智能体的执行管道中,而不是将其视为事后才考虑的事情。通过在智能体的关键执行阶段进行策略干预,实现细粒度的运行时治理。

技术框架:CUGA的运行时治理架构包含五个关键模块:1) 意图守卫(Intent Guard):在规划上游拦截请求,阻止恶意或有害的请求。2) 剧本(Playbook):通过系统提示引导智能体的推理过程,强制执行结构化的工具序列。3) 工具指南(Tool Guide):在工具调用边界强制执行正确的工具使用方式。4) 工具批准(Tool Approvals):对于高风险操作,需要人工批准才能执行。5) 输出格式器(Output Formatter):在输出阶段过滤和构建最终响应。这些模块共同构成了一个完整的治理体系,确保智能体的行为符合预期的策略。

关键创新:CUGA的关键创新在于其模块化的策略即代码层,以及在智能体执行的多个关键阶段进行策略干预的运行时治理架构。与传统的被动约束方法不同,CUGA能够主动引导和控制智能体的行为,从而提高策略遵守和执行一致性。此外,CUGA无需对底层LLM进行微调,即可实现有效的治理。

关键设计:CUGA的关键设计包括:1) 类型化的治理原语,用于定义各种策略规则。2) 动态剧本注入机制,用于强制执行结构化的工具序列。3) 人工参与的工具批准流程,用于处理高风险操作。4) 可配置的输出格式器,用于过滤和构建最终响应。这些设计使得CUGA能够灵活地适应不同的应用场景和策略需求。

📊 实验亮点

CUGA通过医疗保健场景的演示,展示了其在动态剧本注入、恶意请求阻止和高风险操作人工干预方面的能力。实验结果表明,CUGA能够显著提高策略遵守和执行一致性,从而实现更快、更安全的企业智能体系统部署。具体的性能数据和提升幅度未知。

🎯 应用场景

CUGA适用于需要高度可控和合规的企业级智能体应用,例如医疗保健、金融服务和法律等领域。它可以帮助企业安全地部署智能体系统,提高工作效率,并降低风险。未来,CUGA可以扩展到更广泛的应用场景,并与其他智能体技术相结合,构建更强大的智能体系统。

📄 摘要(原文)

Enterprise agents are increasingly expected to operate autonomously across tools and interfaces, yet production deployments require governance by construction. Systems must specify which actions are allowed, when human oversight is required, and what information may be exposed, without rebuilding the agent for each domain. This demo presents CUGA's policy system, a modular policy-as-code layer that composes with a generalist LLM agent to deliver predictable, auditable, and compliance-aware behavior in compound workflows without model fine-tuning. We present a runtime governance architecture that enforces policy interventions at every critical stage of execution. Rather than passively constraining behavior, policies intercept the agent at five structural checkpoints: upstream of planning (Intent Guard), within the system prompt to steer reasoning (Playbook), at the tool-call boundary to enforce proper usage (Tool Guide), outside the reasoning loop as a Human-in-the-Loop gate for high-risk actions (Tool Approvals), and at the output stage to filter and structure the final response (Output Formatter). Together, these stages embed governance continuously across the agent's execution pipeline rather than treating it as an afterthought. Using a healthcare scenario and a multi-layered enforcement intervention, the demo shows dynamic playbook injection for structured tool-sequence enforcement, intent guards that block malicious or accidental harmful requests, and human-in-the-loop tool approval checkpoints for potentially destructive actions. The artifact illustrates how typed governance primitives enable faster, safer deployment of enterprise agentic systems while improving policy adherence and execution consistency.