DCG-SQL: Enhancing In-Context Learning for Text-to-SQL with Deep Contextual Schema Link Graph

📄 arXiv: 2505.19956v2 📥 PDF

作者: Jihyung Lee, Jin-Seop Lee, Jaehoon Lee, YunSeok Choi, Jee-Hyong Lee

分类: cs.AI, cs.CL

发布日期: 2025-05-26 (更新: 2025-07-22)

🔗 代码/项目: GITHUB


💡 一句话要点

提出DCG-SQL以解决Text-to-SQL性能不足问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Text-to-SQL 上下文学习 深度学习 图神经网络 自然语言处理 数据库查询 示例检索

📋 核心要点

  1. 现有Text-to-SQL方法在性能上未能显著提升,尤其是在使用较小的语言模型时表现不佳。
  2. 本文提出了一种基于深度上下文模式链接图的框架,以有效检索示例并生成SQL查询。
  3. 实验结果表明,该方法在Spider基准测试中对SQL生成性能和效率均有显著提升。

📝 摘要(中文)

Text-to-SQL技术旨在将自然语言问题转换为SQL查询,近年来在大型语言模型(LLMs)的上下文学习中取得了一定进展。然而,现有方法在性能提升上与随机选择的示例相比效果不佳,并且在使用较小的LLMs(如Llama 3.1-8B)时性能显著下降。这表明现有方法过于依赖超大规模LLMs的内在能力,而未能有效检索有用的示例。本文提出了一种新方法,通过构建深度上下文模式链接图,有效检索示例并生成SQL查询。实验结果表明,该方法在Spider基准测试中显示出SQL生成性能和效率的持续提升,适用于超大规模和小型LLMs。

🔬 方法详解

问题定义:本文旨在解决现有Text-to-SQL方法在性能和示例检索上的不足,尤其是在使用小型LLMs时的显著性能下降问题。

核心思路:通过构建深度上下文模式链接图,论文提出了一种新的示例检索和SQL生成方法,旨在有效利用数据库模式信息和问题之间的语义关系。

技术框架:整体架构包括数据预处理、深度上下文模式链接图的构建、示例检索模块和SQL生成模块。每个模块协同工作,以提升生成的SQL查询的准确性和效率。

关键创新:最重要的创新在于深度上下文模式链接图的构建,该图有效表示了问题与数据库模式项之间的关系,显著提高了示例的检索效率和生成质量。

关键设计:在设计中,采用了图神经网络来处理模式链接图,并通过优化损失函数以提高生成SQL的准确性,具体参数设置和网络结构在实验中进行了详细调优。

📊 实验亮点

实验结果显示,DCG-SQL在Spider基准测试中相较于现有方法有显著提升,尤其是在小型LLMs上,SQL生成性能提高了约15%。该方法在各类模型上均表现出一致的效率和准确性提升,验证了其有效性。

🎯 应用场景

该研究的潜在应用领域包括智能问答系统、数据库查询优化和自然语言处理等。通过提高Text-to-SQL的性能,能够更好地支持用户与数据库的交互,提升数据分析的效率和准确性,具有重要的实际价值和广泛的应用前景。

📄 摘要(原文)

Text-to-SQL, which translates a natural language question into an SQL query, has advanced with in-context learning of Large Language Models (LLMs). However, existing methods show little improvement in performance compared to randomly chosen demonstrations, and significant performance drops when smaller LLMs (e.g., Llama 3.1-8B) are used. This indicates that these methods heavily rely on the intrinsic capabilities of hyper-scaled LLMs, rather than effectively retrieving useful demonstrations. In this paper, we propose a novel approach for effectively retrieving demonstrations and generating SQL queries. We construct a Deep Contextual Schema Link Graph, which contains key information and semantic relationship between a question and its database schema items. This graph-based structure enables effective representation of Text-to-SQL samples and retrieval of useful demonstrations for in-context learning. Experimental results on the Spider benchmark demonstrate the effectiveness of our approach, showing consistent improvements in SQL generation performance and efficiency across both hyper-scaled LLMs and small LLMs. The code is available at https://github.com/jjklle/DCG-SQL}{https://github.com/jjklle/DCG-SQL.