Sim2Schedule: A Simulator-Guided LLM Framework for Autonomous Open-Pit Mine Scheduling

📄 arXiv: 2606.10286v1 📥 PDF

作者: Mustavi Ibne Masum, Thiago Eustaquio Alves de Oliveira, Mahzabeen Emu

分类: cs.AI

发布日期: 2026-06-09


💡 一句话要点

提出Sim2Schedule框架以解决开放式矿山调度问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 开放式矿山调度 大型语言模型 混合整数线性规划 模拟器驱动 自主决策 资源优化 经济回报

📋 核心要点

  1. 现有的混合整数线性规划方法在动态工业环境中存在计算复杂性高和实时适应能力差的问题。
  2. 本文提出了一种基于模拟器驱动的LLM调度框架,LLM作为自主决策代理,利用自定义模拟器引导决策过程。
  3. 实验结果表明,该框架在不同规模的矿山实例中恢复了94%至99%的MILP最优净现值,同时计算时间呈线性增长。

📝 摘要(中文)

开放式矿山调度是一个在复杂的地质和操作约束下最大化经济回报的关键过程。尽管混合整数线性规划(MILP)提供了数学上的最优基准,但其指数级的计算复杂性和在动态工业环境中无法实时适应的局限性限制了其实际应用。本文提出了一种基于模拟器驱动的大型语言模型(LLM)调度框架,其中LLM作为自主决策代理,在每一步都由一个自定义模拟器引导,该模拟器将地质优先级、提取-处理耦合和动态容量约束直接编码到动作生成机制中。该框架在一个完全零-shot的封闭数据安全环境中运行,能够生成完整、可解释的提取和处理调度,而无需基于云的推理、领域特定的微调或再训练。为提供可信的性能基准,本文开发了一种新的MILP公式,结合了现实的操作和地质约束。经过不同规模和时间段的矿山实例评估,基于LLM的框架恢复了94%到99%的MILP最优净现值(NPV),同时计算时间线性增长。这些结果将模拟器约束的LLM代理定位为在复杂操作约束下进行长期工业调度的实用且可扩展的替代方案。

🔬 方法详解

问题定义:本文旨在解决开放式矿山调度中的复杂地质和操作约束问题。现有的MILP方法由于计算复杂性高,无法在动态环境中实时适应,限制了其应用。

核心思路:论文提出的解决方案是利用大型语言模型(LLM)作为自主决策代理,结合自定义模拟器进行调度决策。通过这种方式,LLM能够在复杂约束下生成可解释的调度方案。

技术框架:整体架构包括LLM作为决策代理和自定义模拟器。模拟器负责编码地质优先级、提取-处理耦合和动态容量约束,LLM在每一步决策中依赖于模拟器的反馈。

关键创新:最重要的技术创新在于将LLM与模拟器结合,使得LLM能够在没有云推理和微调的情况下,直接在封闭环境中生成高质量的调度方案。

关键设计:关键设计包括自定义模拟器的构建,确保其能够有效地编码地质和操作约束,以及LLM的训练和参数设置,确保其在零-shot环境下的有效性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,基于LLM的调度框架在不同规模的矿山实例中能够恢复94%至99%的MILP最优净现值(NPV),并且计算时间呈线性增长,显示出其在复杂操作约束下的优越性和实用性。

🎯 应用场景

该研究的潜在应用领域包括开放式矿山的调度优化、资源提取行业的决策支持系统等。通过提供高效的调度方案,能够显著提高经济效益和资源利用率,未来可能对矿业自动化和智能化发展产生深远影响。

📄 摘要(原文)

Open-pit mine scheduling is a critical process for maximizing economic return under complex geotechnical and operational constraints. While Mixed-Integer Linear Programming (MILP) provides mathematically optimal baselines, its exponential computational complexity and inability to adapt in real time limit its practical deployment in dynamic industrial environments. This work introduces a simulator-driven Large Language Model (LLM) scheduling framework in which the LLM acts as an autonomous decision-making agent, guided at each step by a custom simulator that encodes geotechnical precedence, extraction-processing coupling, and dynamic capacity constraints directly into the action generation mechanism. Operating entirely zero-shot within a closed, data-secure environment, the framework produces complete, interpretable extraction and processing schedules without cloud-based inference, domain-specific fine-tuning, or retraining. To provide a trustworthy performance benchmark, a novel MILP formulation is developed that incorporates realistic operational and geotechnical constraints. Evaluated across mining instances of varying scale and time periods, the LLM-based framework recovers between 94\% and 99\% of the MILP optimal NPV while scaling linearly in computation time. These results position simulator-constrained LLM agents as a practical and scalable alternative to classical optimization for long-horizon industrial scheduling under complex operational constraints.