Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics

📄 arXiv: 2605.12178v1 📥 PDF

作者: Jishnu Sethumadhavan Nair, Patrice Bechard, Rishabh Maheshwary, Surajit Dasgupta, Sravan Ramachandran, Aakash Bhagat, Shruthan Radhakrishna, Pulkit Pattnaik, Johan Obando-Ceron, Shiva Krishna Reddy Malay, Sagar Davasam, Seganrasan Subramanian, Vipul Mittal, Sridhar Krishna Nemala, Christopher Pal, Srinivas Sunkara, Sai Rajeswar

分类: cs.AI, cs.CL, cs.LG

发布日期: 2026-05-12


💡 一句话要点

针对企业系统,提出基于运行时发现的智能体,提升动态环境适应性

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 世界模型 企业系统 运行时发现 动态环境 智能体

📋 核心要点

  1. 企业系统动态变化且依赖租户特定业务逻辑,导致离线训练的世界模型在部署转移时性能下降。
  2. 提出企业发现智能体,通过运行时读取系统配置来恢复相关转换动态,从而适应动态变化的环境。
  3. CascadeBench基准测试表明,相比离线训练模型,基于发现的智能体在部署转移下表现出更强的鲁棒性。

📝 摘要(中文)

世界模型通过内化环境动态,使智能体能够预测其行为的影响。然而,在企业系统中,这些动态通常由租户特定的业务逻辑定义,这些逻辑在不同的部署中各不相同,并且随着时间的推移而演变,使得在历史转换上训练的模型在部署转移下变得脆弱。我们提出了一个世界模型文献尚未解决的问题:当规则可以在推理时读取时,智能体是否仍然需要学习它们?我们认为,并根据经验证明,在转换动态可配置和可读的设置中,运行时发现通过将预测建立在活动系统实例中来补充离线训练。我们提出了企业发现智能体,它通过读取系统的配置而不是仅仅依赖于内化的表示来在运行时恢复相关的转换动态。我们引入了CascadeBench,这是一个以推理为中心的用于企业级联预测的基准,它在不同的合成环境中采用了World of Workflows的评估方法,并将其与部署转移评估一起使用,以表明离线训练的世界模型可以在分布内表现良好,但随着动态的变化而退化,而基于发现的智能体通过将其预测建立在当前实例中,在转移下更具鲁棒性。我们的研究结果表明,在可配置的企业环境中,智能体不应仅仅依赖于固定的内化动态,而应包含用于在运行时发现相关转换逻辑的机制。

🔬 方法详解

问题定义:论文旨在解决企业系统中世界模型在面对动态变化和租户定制化业务逻辑时,泛化能力不足的问题。现有方法主要依赖离线训练,将环境动态内化到模型参数中,但这种方式难以适应企业系统部署转移带来的动态变化,导致模型性能显著下降。

核心思路:论文的核心思路是利用企业系统配置的可读性,在运行时动态发现和利用相关的转换逻辑,而不是完全依赖预先学习的固定模型。通过运行时发现,智能体能够根据当前系统实例的配置调整其预测,从而提高在动态环境下的适应性和鲁棒性。

技术框架:论文提出了企业发现智能体的框架,该框架主要包含以下几个阶段:1) 系统配置读取:智能体在运行时读取当前企业系统的配置信息,包括业务规则、流程定义等。2) 转换逻辑提取:从配置信息中提取相关的转换动态,例如状态转移规则、行为影响等。3) 预测生成:基于提取的转换逻辑,结合当前状态,生成对未来状态的预测。4) 决策执行:根据预测结果,制定并执行相应的决策。

关键创新:论文最重要的技术创新在于将运行时发现机制引入到企业级世界模型中。与传统的离线训练方法相比,该方法能够动态适应环境变化,避免了因部署转移导致的性能下降。此外,论文还提出了CascadeBench基准测试,为企业级世界模型的评估提供了一个标准化的平台。

关键设计:论文的关键设计包括:1) 系统配置读取模块的设计,需要能够高效地解析和提取企业系统的配置信息。2) 转换逻辑提取模块的设计,需要能够准确地识别和表示状态转移规则。3) 预测生成模块的设计,需要能够有效地利用提取的转换逻辑进行预测。具体的参数设置、损失函数、网络结构等技术细节在论文中未详细描述,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,离线训练的世界模型在分布内表现良好,但随着动态的变化而退化,而基于发现的智能体通过将其预测建立在当前实例中,在转移下更具鲁棒性。具体的性能数据和提升幅度在论文中未明确给出,属于未知信息。

🎯 应用场景

该研究成果可应用于各种企业级应用场景,例如流程自动化、资源调度、异常检测等。通过利用运行时发现的转换逻辑,智能体能够更好地理解和适应企业系统的动态变化,从而提高决策的准确性和效率,降低运营成本,并提升用户体验。未来,该方法有望在更广泛的领域得到应用,例如智能制造、智慧城市等。

📄 摘要(原文)

World models enable agents to anticipate the effects of their actions by internalizing environment dynamics. In enterprise systems, however, these dynamics are often defined by tenant-specific business logic that varies across deployments and evolves over time, making models trained on historical transitions brittle under deployment shift. We ask a question the world-models literature has not addressed: when the rules can be read at inference time, does an agent still need to learn them? We argue, and demonstrate empirically, that in settings where transition dynamics are configurable and readable, runtime discovery complements offline training by grounding predictions in the active system instance. We propose enterprise discovery agents, which recover relevant transition dynamics at runtime by reading the system's configuration rather than relying solely on internalized representations. We introduce CascadeBench, a reasoning-focused benchmark for enterprise cascade prediction that adopts the evaluation methodology of World of Workflows on diverse synthetic environments, and use it together with deployment-shift evaluation to show that offline-trained world models can perform well in-distribution but degrade as dynamics change, whereas discovery-based agents are more robust under shift by grounding their predictions in the current instance. Our findings suggest that, in configurable enterprise environments, agents should not rely solely on fixed internalized dynamics, but should incorporate mechanisms for discovering relevant transition logic at runtime.