Large Language Models as Amortized Pareto-Front Generators for Constrained Bi-Objective Convex Optimization

作者: Peipei Xu, SiYuan Ma, Yaohua Liu, Yu Wu, Guanliang Liu, Yang Zhang, Yong Liu

分类: cs.AI

发布日期: 2026-05-12

备注: 31 pages

💡 一句话要点

DIPS：利用大语言模型生成约束双目标凸优化的Pareto前沿

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 Pareto前沿 多目标优化 约束优化 凸优化

📋 核心要点

现有方法在解决约束双目标优化问题时，依赖迭代标量化、进化搜索或特定问题求解器，需要对每个实例重复优化。
DIPS框架通过微调大型语言模型，使其能够直接从问题描述生成Pareto前沿，无需迭代优化。
实验表明，DIPS在速度和Pareto前沿质量上均优于现有方法，证明了LLM作为分摊生成器的有效性。

📝 摘要（中文）

本文提出DIPS，一个端到端框架，通过微调大型语言模型，使其能够为约束双目标凸优化问题生成分摊的Pareto前沿。给定问题的文本描述，DIPS直接输出一组有序的可行连续决策向量，逼近Pareto前沿。为了使连续优化与自回归语言建模兼容，DIPS结合了紧凑的离散化方案、用于新数值token的数值基础token初始化，以及三阶段课程优化，逐步对齐结构有效性、可行性和Pareto前沿质量。在五个约束双目标凸问题族上，微调后的70亿参数模型实现了相对于参考前沿95.29%到98.18%的归一化超体积比率。通过vLLM加速推理，DIPS在短短0.16秒内解决一个实例，并在评估设置下优于通用和推理LLM基线。这些结果表明，LLM可以作为连续Pareto前沿逼近的有效分摊生成器。

🔬 方法详解

问题定义：论文旨在解决约束双目标凸优化问题中，生成可行Pareto前沿的难题。传统方法如迭代标量化、进化算法等，需要针对每个问题实例进行重复优化，计算成本高昂，效率低下。此外，这些方法通常依赖于问题特定的求解器，缺乏通用性。

核心思路：论文的核心思路是将大型语言模型（LLM）作为分摊的Pareto前沿生成器。通过将优化问题描述转化为文本，利用LLM的生成能力，直接输出一组逼近Pareto前沿的决策向量。这种方法避免了重复优化，提高了效率，并具有较强的通用性。

技术框架：DIPS框架包含以下几个主要模块：1) 问题文本描述输入；2) LLM（经过微调）作为Pareto前沿生成器；3) 紧凑离散化方案，将连续决策变量转化为离散token；4) 数值基础Token初始化，为新的数值token提供合理的初始表示；5) 三阶段课程优化，逐步优化模型的结构有效性、可行性和Pareto前沿质量。

关键创新：DIPS的关键创新在于将LLM应用于连续优化问题的Pareto前沿生成。与传统优化方法不同，DIPS利用LLM的生成能力，实现了一次性生成整个Pareto前沿，避免了重复迭代优化。此外，DIPS还提出了紧凑离散化方案和数值基础Token初始化，解决了连续优化与自回归语言建模的兼容性问题。

关键设计：DIPS采用三阶段课程优化策略：第一阶段，优化结构有效性，确保生成的决策向量符合基本结构要求；第二阶段，优化可行性，确保生成的决策向量满足约束条件；第三阶段，优化Pareto前沿质量，提高生成的Pareto前沿的逼近精度。损失函数的设计也至关重要，需要综合考虑结构有效性、可行性和Pareto前沿质量。具体参数设置和网络结构细节在论文中有详细描述。

🖼️ 关键图片

📊 实验亮点

实验结果表明，DIPS在五个约束双目标凸问题族上，相对于参考前沿实现了95.29%到98.18%的归一化超体积比率。与通用和推理LLM基线相比，DIPS在Pareto前沿质量和推理速度上均表现出显著优势。通过vLLM加速推理，DIPS可以在0.16秒内解决一个实例，证明了其高效性。

🎯 应用场景

DIPS框架可应用于各种需要多标准决策的领域，如工程设计、资源分配、金融投资等。例如，在汽车设计中，可以同时优化车辆的燃油效率和安全性，生成Pareto前沿，供设计师选择。该研究的实际价值在于提高了多目标优化的效率和通用性，未来可能促进更多复杂优化问题的解决。

📄 摘要（原文）

Generating feasible Pareto fronts for constrained bi-objective continuous optimization is central to multi-criteria decision-making. Existing methods usually rely on iterative scalarization, evolutionary search, or problem-specific solvers, requiring repeated optimization for each instance. We introduce DIPS, an end-to-end framework that fine-tunes large language models as amortized Pareto-front generators for constrained bi-objective convex optimization. Given a textual problem description, DIPS directly outputs an ordered set of feasible continuous decision vectors approximating the Pareto front. To make continuous optimization compatible with autoregressive language modeling, DIPS combines a compact discretization scheme, Numerically Grounded Token Initialization for new numerical tokens, and Three-Phase Curriculum Optimization, which progressively aligns structural validity, feasibility, and Pareto-front quality. Across five families of constrained bi-objective convex problems, a fine-tuned 7B-parameter model achieves normalized hypervolume ratios of 95.29% to 98.18% relative to reference fronts. With vLLM-accelerated inference, DIPS solves one instance in as little as 0.16 seconds and outperforms general-purpose and reasoning LLM baselines under the evaluated setting. These results suggest that LLMs can serve as effective amortized generators for continuous Pareto-front approximation.

Large Language Models as Amortized Pareto-Front Generators for Constrained Bi-Objective Convex Optimization

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理