SMaRT: Select, Mix, and ReinvenT -- A Strategy Fusion Framework for LLM-Driven Reasoning and Planning

作者: Nikhil Verma, Manasa Bharadwaj, Wonjun Jang, Harmanpreet Singh, Yixiao Wang, Homa Fashandi, Chul Lee

分类: cs.AI, cs.CL

发布日期: 2025-10-20

💡 一句话要点

SMaRT：融合多种策略，提升LLM在推理与规划任务中的性能

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 策略融合 推理 规划 决策 自动化 智能集成

📋 核心要点

现有方法依赖单一策略提示，未能充分利用不同推理策略的协同优势，导致性能受限。
SMaRT框架通过选择、混合和重塑多种推理策略，将LLM作为智能集成器，实现优势互补。
实验表明，SMaRT在推理、规划和顺序决策任务中，显著优于现有基线方法，提升了鲁棒性和适应性。

📝 摘要（中文）

大型语言模型（LLMs）以其卓越的泛化能力重新定义了复杂任务自动化。然而，现有方法依赖于单一策略提示，忽略了不同推理方法的协同效应。由于没有一种策略在所有情况下都表现出色，因此需要融合多种策略的框架，以最大限度地提高性能并确保鲁棒性。我们提出了Select, Mix, and ReinvenT (SMaRT)框架，这是一种创新的策略融合方法，旨在通过无缝集成不同的推理策略来创建平衡且高效的解决方案，从而克服这一限制。与仅将LLM用作评估器的现有方法不同，SMaRT将其用作智能集成器，从而在各项任务中实现“集大成”。在推理、规划和顺序决策等基准上的大量实证评估突出了SMaRT的鲁棒性和适应性。该框架在解决方案质量、约束遵守和性能指标方面始终优于最先进的基线。这项工作通过开创跨策略校准的新范例，重新定义了LLM驱动的决策，从而为推理系统解锁了卓越的成果，并推进了自我完善方法的边界。

🔬 方法详解

问题定义：现有基于LLM的推理和规划方法通常依赖于单一的策略，例如思维链（Chain-of-Thought）或计划生成（Plan Generation）。然而，不同的任务可能需要不同的策略才能达到最佳效果，单一策略难以适应所有场景。现有方法未能充分利用多种策略的优势，导致性能瓶颈和鲁棒性不足。

核心思路：SMaRT框架的核心思想是融合多种推理策略，并利用LLM作为智能集成器，自动选择、混合和重塑这些策略，以适应不同的任务和场景。通过这种方式，SMaRT可以充分利用各种策略的优势，避免单一策略的局限性，从而提高整体性能和鲁棒性。

技术框架：SMaRT框架包含三个主要阶段：选择（Select）、混合（Mix）和重塑（Reinvent）。在选择阶段，框架根据任务的特点和当前状态，从预定义的策略库中选择合适的策略。在混合阶段，框架将选择的策略进行组合，生成一个综合的推理流程。在重塑阶段，框架利用LLM对混合后的推理流程进行优化和调整，以进一步提高性能。整个过程迭代进行，直到达到预定的性能目标或达到最大迭代次数。

关键创新：SMaRT框架的关键创新在于其策略融合机制和LLM作为智能集成器的角色。与现有方法不同，SMaRT不是简单地将LLM用作策略的执行者或评估者，而是将其用作策略的智能集成器，负责选择、混合和重塑策略，从而实现更高效和鲁棒的推理和规划。

关键设计：SMaRT框架的关键设计包括：1) 策略库的设计，需要包含足够多样化的策略，以覆盖不同的任务和场景；2) 选择机制的设计，需要能够根据任务的特点和当前状态，准确地选择合适的策略；3) 混合机制的设计，需要能够有效地组合不同的策略，避免冲突和冗余；4) 重塑机制的设计，需要能够利用LLM的强大能力，对混合后的推理流程进行优化和调整。具体的参数设置、损失函数和网络结构等细节未在摘要中提及，属于未知信息。

🖼️ 关键图片

📊 实验亮点

SMaRT框架在推理、规划和顺序决策等多个基准测试中，均显著优于现有最先进的基线方法。具体性能数据和提升幅度未在摘要中给出，属于未知信息。但摘要强调了SMaRT在解决方案质量、约束遵守和性能指标方面的优越性，表明其具有很强的实用价值。

🎯 应用场景

SMaRT框架具有广泛的应用前景，可应用于机器人控制、自动驾驶、智能客服、游戏AI等领域。通过融合多种推理策略，SMaRT可以提高LLM在复杂任务中的决策能力和鲁棒性，从而实现更智能、更可靠的自动化系统。未来，SMaRT有望成为LLM驱动的决策系统的核心组成部分。

📄 摘要（原文）

Large Language Models (LLMs) have redefined complex task automation with exceptional generalization capabilities. Despite these advancements, state-of-the-art methods rely on single-strategy prompting, missing the synergy of diverse reasoning approaches. No single strategy excels universally, highlighting the need for frameworks that fuse strategies to maximize performance and ensure robustness. We introduce the Select, Mix, and ReinvenT (SMaRT) framework, an innovative strategy fusion approach designed to overcome this constraint by creating balanced and efficient solutions through the seamless integration of diverse reasoning strategies. Unlike existing methods, which employ LLMs merely as evaluators, SMaRT uses them as intelligent integrators, unlocking the "best of all worlds" across tasks. Extensive empirical evaluations across benchmarks in reasoning, planning, and sequential decision-making highlight the robustness and adaptability of SMaRT. The framework consistently outperforms state-of-the-art baselines in solution quality, constraint adherence, and performance metrics. This work redefines LLM-driven decision-making by pioneering a new paradigm in cross-strategy calibration, unlocking superior outcomes for reasoning systems and advancing the boundaries of self-refining methodologies.

SMaRT: Select, Mix, and ReinvenT -- A Strategy Fusion Framework for LLM-Driven Reasoning and Planning

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理