Vox Deorum: A Hybrid LLM Architecture for 4X / Grand Strategy Game AI -- Lessons from Civilization V

作者: John Chen, Sihan Cheng, Can Gurkan, Ryan Lay, Moez Salahuddin

分类: cs.AI

发布日期: 2025-12-21 (更新: 2025-12-25)

备注: Under review

💡 一句话要点

提出Vox Deorum混合架构，赋能LLM在4X游戏中进行宏观策略推理。

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 4X游戏 混合架构 宏观策略 游戏AI

📋 核心要点

4X游戏的复杂性和长时程决策对LLM提出了挑战，同时延迟和成本限制了LLM的实际部署。
Vox Deorum采用混合架构，利用LLM进行宏观战略决策，并将战术执行委托给其他AI子系统。
实验结果表明，LLM在4X游戏中表现出与传统AI不同的游戏风格，并实现了具有竞争力的游戏性能。

📝 摘要（中文）

本文提出了一种名为Vox Deorum的混合LLM+X架构，旨在解决大型语言模型（LLM）在4X和大型战略游戏中应用时面临的挑战，如复杂性、长时程决策、延迟和成本等问题。该架构利用LLM进行宏观战略推理，并将战术执行委派给子系统（如算法AI或强化学习AI）。通过在《文明V》及其Vox Populi Mod上的2327局完整游戏测试，比较了两个开源LLM和一个简单提示与Vox Populi的增强AI。结果表明，LLM在实现具有竞争力的端到端游戏体验的同时，展现出与算法AI及彼此之间显著不同的游戏风格。该研究为在商业4X游戏中集成LLM建立了一个可行的架构，为游戏设计和智能体AI研究开辟了新的机会。

🔬 方法详解

问题定义：论文旨在解决在4X游戏中应用LLM时遇到的挑战，包括游戏复杂性带来的推理难度、长时程决策带来的规划问题，以及LLM推理带来的延迟和成本问题。现有方法，如直接使用LLM进行所有决策，无法有效应对这些挑战，导致游戏体验不佳或成本过高。

核心思路：论文的核心思路是将LLM的优势（宏观战略推理）与传统AI的优势（战术执行效率）相结合。通过分层架构，LLM负责制定高层次的战略目标和决策，而具体的战术执行则交给更高效的子系统，从而在保证智能水平的同时，降低延迟和成本。

技术框架：Vox Deorum架构包含以下主要模块：1) LLM：负责接收游戏状态信息，进行战略分析，并输出高层次的行动指令。2) 战术执行子系统：可以是传统的算法AI，也可以是强化学习AI，负责将LLM的指令转化为具体的游戏操作。3) 游戏环境：提供游戏状态信息，并执行AI的行动。整个流程是LLM根据游戏状态制定战略，然后由战术执行子系统执行，并将结果反馈给LLM，形成一个闭环控制系统。

关键创新：该架构的关键创新在于将LLM与传统AI进行有效集成，实现了优势互补。与完全依赖LLM的方案相比，Vox Deorum降低了延迟和成本，提高了游戏体验。与完全依赖传统AI的方案相比，Vox Deorum赋予了AI更强的战略推理能力和更丰富的游戏风格。

关键设计：论文中，LLM的prompt设计至关重要，需要清晰地描述游戏状态、可执行的行动以及战略目标。此外，LLM输出的指令需要能够被战术执行子系统理解和执行。具体的参数设置和网络结构取决于所选用的LLM和战术执行子系统。

🖼️ 关键图片

📊 实验亮点

实验结果表明，使用LLM的AI在《文明V》游戏中表现出与传统AI不同的游戏风格，例如，一个LLM倾向于扩张和侵略，而另一个LLM则更注重文化发展。同时，LLM驱动的AI在游戏结束时的得分与Vox Populi的增强AI相当，证明了该架构的有效性。

🎯 应用场景

该研究成果可应用于商业4X游戏和大型战略游戏，提升AI的智能水平和游戏体验。此外，该混合架构也为Agentic AI研究提供了新的思路，可应用于其他需要长期规划和复杂决策的领域，如机器人控制、供应链管理等。

📄 摘要（原文）

Large Language Models' capacity to reason in natural language makes them uniquely promising for 4X and grand strategy games, enabling more natural human-AI gameplay interactions such as collaboration and negotiation. However, these games present unique challenges due to their complexity and long-horizon nature, while latency and cost factors may hinder LLMs' real-world deployment. Working on a classic 4X strategy game, Sid Meier's Civilization V with the Vox Populi mod, we introduce Vox Deorum, a hybrid LLM+X architecture. Our layered technical design empowers LLMs to handle macro-strategic reasoning, delegating tactical execution to subsystems (e.g., algorithmic AI or reinforcement learning AI in the future). We validate our approach through 2,327 complete games, comparing two open-source LLMs with a simple prompt against Vox Populi's enhanced AI. Results show that LLMs achieve competitive end-to-end gameplay while exhibiting play styles that diverge substantially from algorithmic AI and from each other. Our work establishes a viable architecture for integrating LLMs in commercial 4X games, opening new opportunities for game design and agentic AI research.

Vox Deorum: A Hybrid LLM Architecture for 4X / Grand Strategy Game AI -- Lessons from Civilization V

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理