Mortar: Evolving Mechanics for Automatic Game Design
作者: Muhammad U. Nasir, Yuchen Li, Steven James, Julian Togelius
分类: cs.AI
发布日期: 2025-12-31
💡 一句话要点
Mortar:一种用于自动游戏设计的演化机制
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 自动游戏设计 游戏机制演化 质量-多样性算法 大型语言模型 技能排序 游戏AI 程序化内容生成
📋 核心要点
- 游戏机制设计耗时且依赖专家知识,现有方法难以自动生成高质量、多样化的游戏机制。
- Mortar结合质量-多样性算法和大型语言模型,探索并演化游戏机制,旨在自动生成多样且可玩的游戏。
- 实验表明,Mortar生成的游戏具有多样性和可玩性,并且其机制对基于技能的排序得分有显著贡献。
📝 摘要(中文)
本文提出Mortar,一个用于自动演化游戏机制以实现自动游戏设计的系统。游戏机制定义了控制游戏玩法的规则和交互,手动设计它们既耗时又需要专业知识。Mortar结合了质量-多样性算法与大型语言模型,以探索多样化的机制集合。这些机制通过合成完整的游戏进行评估,这些游戏既包含演化的机制,也包含来自档案库的机制。机制的评估通过树搜索程序合成完整游戏,最终游戏根据其保持玩家之间基于技能的排序能力进行评估——即,更强的玩家是否始终优于较弱的玩家。我们根据机制对游戏中基于技能的排序得分的贡献来评估机制。我们证明Mortar生成的游戏看起来多样且可玩,并且机制对游戏中基于技能的排序得分贡献更大。我们进行了消融研究以评估每个系统组件的作用,并进行了用户研究以根据人类反馈评估游戏。
🔬 方法详解
问题定义:论文旨在解决自动游戏设计中游戏机制自动生成的问题。现有方法在生成高质量、多样化的游戏机制方面存在不足,需要耗费大量时间和专家知识进行手动设计。因此,如何自动生成既多样又有趣,同时能有效区分玩家技能水平的游戏机制是本研究要解决的核心问题。
核心思路:论文的核心思路是结合质量-多样性算法和大型语言模型,通过演化的方式自动生成游戏机制。质量-多样性算法用于探索多样化的机制集合,大型语言模型则用于辅助生成和评估机制。通过合成完整的游戏并评估其区分玩家技能的能力,来衡量机制的质量。
技术框架:Mortar系统的整体框架包含以下几个主要模块:1) 机制生成模块:使用大型语言模型生成候选游戏机制。2) 机制评估模块:通过质量-多样性算法对生成的机制进行评估,鼓励多样性。3) 游戏合成模块:将演化的机制与来自档案库的机制组合,通过树搜索程序合成完整的游戏。4) 游戏评估模块:评估合成的游戏,重点关注其保持玩家之间基于技能的排序能力。
关键创新:该论文的关键创新在于将质量-多样性算法与大型语言模型相结合,用于自动演化游戏机制。与传统的手动设计方法相比,Mortar能够自动探索更广泛的机制空间,并生成多样化的游戏。此外,使用基于技能的排序能力作为评估指标,能够更好地衡量游戏机制的质量。
关键设计:在机制生成模块中,使用了预训练的大型语言模型,并对其进行微调,以生成符合游戏设计规则的机制描述。在质量-多样性算法中,使用了Novelty Search算法,鼓励探索新的、未知的机制。在游戏评估模块中,使用了Elo rating系统来评估玩家的技能水平,并计算游戏区分玩家技能的能力得分。
🖼️ 关键图片
📊 实验亮点
实验结果表明,Mortar能够生成多样且可玩的游戏,并且其机制对游戏中基于技能的排序得分贡献更大。消融研究验证了质量-多样性算法和大型语言模型在系统中的作用。用户研究表明,人类玩家对Mortar生成的游戏给予了积极的评价。
🎯 应用场景
该研究成果可应用于游戏开发领域,降低游戏设计成本,提高游戏设计的效率和创新性。此外,该方法还可以推广到其他需要自动生成规则和交互的领域,例如自动化任务规划、机器人行为设计等,具有广泛的应用前景和实际价值。
📄 摘要(原文)
We present Mortar, a system for autonomously evolving game mechanics for automatic game design. Game mechanics define the rules and interactions that govern gameplay, and designing them manually is a time-consuming and expert-driven process. Mortar combines a quality-diversity algorithm with a large language model to explore a diverse set of mechanics, which are evaluated by synthesising complete games that incorporate both evolved mechanics and those drawn from an archive. The mechanics are evaluated by composing complete games through a tree search procedure, where the resulting games are evaluated by their ability to preserve a skill-based ordering over players -- that is, whether stronger players consistently outperform weaker ones. We assess the mechanics based on their contribution towards the skill-based ordering score in the game. We demonstrate that Mortar produces games that appear diverse and playable, and mechanics that contribute more towards the skill-based ordering score in the game. We perform ablation studies to assess the role of each system component and a user study to evaluate the games based on human feedback.