EXPLORA: Efficient Exemplar Subset Selection for Complex Reasoning

作者: Kiran Purohit, Venktesh V, Raghuram Devalla, Krishna Mohan Yerragorla, Sourangshu Bhattacharya, Avishek Anand

分类: cs.LG

发布日期: 2024-11-06

🔗 代码/项目: GITHUB

💡 一句话要点

提出EXPLORA算法，高效选择复杂推理任务的静态示例子集，提升大语言模型性能。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 上下文学习 示例选择 复杂推理 大语言模型 静态示例 探索算法 文本推理

📋 核心要点

现有上下文学习方法在复杂推理任务中选择最优示例时面临挑战，静态示例选择可以提高推理速度和鲁棒性。
EXPLORA算法通过探索方法估计评分函数参数，评估示例子集，无需置信度信息，降低了对LLM的调用次数。
实验结果表明，EXPLORA在复杂推理任务上显著提升了性能，并大幅减少了LLM的调用次数。

📝 摘要（中文）

本文针对基于文本和混合数据源（包括表格）的复杂推理问题，提出了一种高效的静态示例子集选择算法EXPLORA。该算法旨在解决大语言模型（LLM）上下文学习（ICL）中示例选择的难题。EXPLORA通过一种新颖的探索方法来估计评分函数的参数，该评分函数用于评估示例子集，且无需置信度信息。实验结果表明，EXPLORA显著减少了LLM的调用次数，仅为现有最佳方法的约11%，同时实现了12.24%的性能提升。代码和数据已开源。

🔬 方法详解

问题定义：论文旨在解决复杂推理任务中，如何高效地选择最优的静态示例子集，以提升大语言模型（LLM）在上下文学习（ICL）中的性能。现有方法在选择示例时，通常需要大量的LLM调用来评估不同的示例组合，计算成本高昂，效率低下。此外，一些方法依赖于置信度信息，这可能引入额外的误差。

核心思路：EXPLORA的核心思路是通过一种新颖的探索方法，直接估计评分函数的参数，而无需显式地计算每个示例子集的置信度。这种方法旨在减少对LLM的调用次数，从而提高示例选择的效率。通过更有效地探索示例空间，EXPLORA能够找到更优的示例子集，从而提升LLM在复杂推理任务中的性能。

技术框架：EXPLORA算法主要包含以下几个阶段：1) 初始化：随机选择一组示例子集作为初始候选集。2) 探索：使用提出的探索方法，迭代地更新评分函数的参数。该探索方法旨在找到能够更好地区分有效和无效示例子集的参数。3) 评估：使用更新后的评分函数，对候选示例子集进行评估。4) 选择：选择评分最高的示例子集作为最终的静态示例子集。

关键创新：EXPLORA最关键的创新在于其探索方法，该方法能够有效地估计评分函数的参数，而无需依赖置信度信息，并显著减少了对LLM的调用次数。与现有方法相比，EXPLORA的探索方法更加高效，能够在更短的时间内找到更优的示例子集。此外，EXPLORA专注于静态示例选择，这使得其在推理速度和鲁棒性方面具有优势。

关键设计：EXPLORA的具体设计细节包括：1) 评分函数的设计：评分函数用于评估示例子集的质量。具体形式未知，但其参数通过探索方法进行估计。2) 探索策略：具体的探索策略未知，但其目标是高效地更新评分函数的参数，以更好地区分有效和无效的示例子集。3) 停止准则：探索过程的停止准则未知，但其目标是在计算成本和性能之间取得平衡。

📊 实验亮点

EXPLORA算法在复杂推理任务上取得了显著的性能提升。实验结果表明，EXPLORA将LLM的调用次数减少到现有最佳方法的约11%，同时实现了12.24%的性能提升。这些结果表明，EXPLORA是一种高效且有效的静态示例子集选择算法。

🎯 应用场景

EXPLORA算法可应用于各种需要复杂推理能力的场景，例如问答系统、知识图谱推理、表格推理等。通过高效地选择示例，可以提升大语言模型在这些场景中的性能，降低计算成本，并提高系统的鲁棒性。该研究对于推动大语言模型在实际应用中的部署具有重要意义。

📄 摘要（原文）

Answering reasoning-based complex questions over text and hybrid sources, including tables, is a challenging task. Recent advances in large language models (LLMs) have enabled in-context learning (ICL), allowing LLMs to acquire proficiency in a specific task using only a few demonstration samples (exemplars). A critical challenge in ICL is the selection of optimal exemplars, which can be either task-specific (static) or test-example-specific (dynamic). Static exemplars provide faster inference times and increased robustness across a distribution of test examples. In this paper, we propose an algorithm for static exemplar subset selection for complex reasoning tasks. We introduce EXPLORA, a novel exploration method designed to estimate the parameters of the scoring function, which evaluates exemplar subsets without incorporating confidence information. EXPLORA significantly reduces the number of LLM calls to ~11% of those required by state-of-the-art methods and achieves a substantial performance improvement of 12.24%. We open-source our code and data (https://github.com/kiranpurohit/EXPLORA).

EXPLORA: Efficient Exemplar Subset Selection for Complex Reasoning

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理