MIRROR: A Multi-Agent Framework with Iterative Adaptive Revision and Hierarchical Retrieval for Optimization Modeling in Operations Research

作者: Yifan Shi, Jialong Shi, Jiayi Wang, Ye Fan, Jianyong Sun

分类: cs.CL

发布日期: 2026-02-03

💡 一句话要点

MIRROR：面向运筹优化建模的迭代自适应修正与分层检索多Agent框架

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 运筹优化 多Agent系统 自然语言处理 数学建模 迭代修正 分层检索 自动化建模

📋 核心要点

现有运筹优化建模依赖专家经验，效率低且难以适应新场景，通用LLM直接建模效果不佳。
MIRROR框架通过迭代自适应修正和分层检索，实现自然语言到优化模型的自动转换。
实验表明，MIRROR在标准和工业数据集上均优于现有方法，提升了建模的效率和准确性。

📝 摘要（中文）

运筹学(OR)依赖于专家驱动的建模，这种方式缓慢且脆弱，难以适应新的场景。虽然大型语言模型(LLM)可以自动将自然语言转换为优化模型，但现有方法要么依赖于昂贵的后训练，要么采用多Agent框架，但大多数仍然缺乏可靠的协同纠错和特定任务的检索，经常导致不正确的输出。我们提出了MIRROR，一个无需微调的端到端多Agent框架，可以直接将自然语言优化问题转换为数学模型和求解器代码。MIRROR集成了两个核心机制：(1)执行驱动的迭代自适应修正，用于自动纠错；(2)分层检索，从精心策划的示例库中获取相关的建模和编码示例。实验表明，MIRROR在标准OR基准测试中优于现有方法，并在复杂的工业数据集(如IndustryOR和Mamo-ComplexLP)上取得了显著成果。通过将精确的外部知识注入与系统的错误纠正相结合，MIRROR为非专业用户提供了一种高效可靠的OR建模解决方案，克服了通用LLM在专家优化任务中的根本局限性。

🔬 方法详解

问题定义：论文旨在解决运筹优化领域中，将自然语言描述的问题自动转化为数学模型和求解器代码的难题。现有方法，如依赖专家手动建模，效率低下且易出错；直接使用通用LLM，缺乏领域知识和纠错机制，效果不佳。

核心思路：论文的核心思路是构建一个多Agent框架，通过迭代执行和自适应修正，逐步完善模型和代码。同时，利用分层检索机制，从示例库中获取相关知识，提高建模的准确性和效率。这种设计旨在模拟专家解决问题的过程，即先尝试建模，然后根据执行结果进行修正，并参考已有的经验。

技术框架：MIRROR框架包含多个Agent，协同完成建模任务。主要流程包括：(1)问题理解Agent，负责解析自然语言描述；(2)模型构建Agent，根据问题描述生成数学模型；(3)代码生成Agent，将数学模型转化为求解器代码；(4)执行Agent，运行求解器代码并评估结果；(5)修正Agent，根据执行结果和示例库中的知识，对模型和代码进行迭代修正。各个Agent之间通过消息传递进行协作。

关键创新：MIRROR的关键创新在于：(1)执行驱动的迭代自适应修正机制，能够自动检测和纠正模型和代码中的错误；(2)分层检索机制，能够有效地利用示例库中的知识，提高建模的准确性和效率。与现有方法相比，MIRROR无需微调LLM，即可实现端到端的自动建模。

关键设计：分层检索机制包含两层：第一层是基于问题描述的语义检索，找到与当前问题最相关的示例；第二层是基于模型结构的结构化检索，找到与当前模型最相似的示例。修正Agent使用强化学习算法，根据执行结果和示例库中的知识，学习修正策略。具体参数设置和网络结构等技术细节在论文中未详细说明，属于未知信息。

🖼️ 关键图片

📊 实验亮点

MIRROR在IndustryOR和Mamo-ComplexLP等复杂工业数据集上取得了显著成果，表明其在实际应用中具有很强的潜力。具体性能数据和提升幅度在摘要中未给出，属于未知信息。但强调了优于现有方法，并在复杂数据集上表现突出。

🎯 应用场景

MIRROR框架可应用于各种运筹优化问题，例如供应链管理、生产调度、资源分配等。它可以帮助非专业用户快速构建优化模型，提高决策效率和质量。未来，该框架可以扩展到更复杂的领域，例如金融工程、智能交通等，为各行各业提供智能化的优化解决方案。

📄 摘要（原文）

Operations Research (OR) relies on expert-driven modeling-a slow and fragile process ill-suited to novel scenarios. While large language models (LLMs) can automatically translate natural language into optimization models, existing approaches either rely on costly post-training or employ multi-agent frameworks, yet most still lack reliable collaborative error correction and task-specific retrieval, often leading to incorrect outputs. We propose MIRROR, a fine-tuning-free, end-to-end multi-agent framework that directly translates natural language optimization problems into mathematical models and solver code. MIRROR integrates two core mechanisms: (1) execution-driven iterative adaptive revision for automatic error correction, and (2) hierarchical retrieval to fetch relevant modeling and coding exemplars from a carefully curated exemplar library. Experiments show that MIRROR outperforms existing methods on standard OR benchmarks, with notable results on complex industrial datasets such as IndustryOR and Mamo-ComplexLP. By combining precise external knowledge infusion with systematic error correction, MIRROR provides non-expert users with an efficient and reliable OR modeling solution, overcoming the fundamental limitations of general-purpose LLMs in expert optimization tasks.

MIRROR: A Multi-Agent Framework with Iterative Adaptive Revision and Hierarchical Retrieval for Optimization Modeling in Operations Research

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理