Bridging Global Intent with Local Details: A Hierarchical Representation Approach for Semantic Validation in Text-to-SQL

📄 arXiv: 2512.22744v1 📥 PDF

作者: Rihong Qiu, Zhibang Yang, Xinke Jiang, Weibin Liao, Xin Gao, Xu Chu, Junfeng Zhao, Yasha Wang

分类: cs.LG

发布日期: 2025-12-28


💡 一句话要点

提出HEROSQL,通过分层表示和嵌套消息传递网络,提升Text-to-SQL语义验证的准确性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Text-to-SQL 语义验证 分层表示 嵌套消息传递网络 抽象语法树 逻辑计划 数据查询

📋 核心要点

  1. 现有Text-to-SQL验证方法主要关注语法正确性,忽略了语义验证,难以检测问题与SQL之间的语义不一致。
  2. HEROSQL通过分层表示(逻辑计划和抽象语法树)和嵌套消息传递网络,同时捕捉全局意图和局部细节。
  3. 实验表明,HEROSQL在语义不一致性检测方面显著优于现有方法,AUPRC提升9.40%,AUROC提升12.35%。

📝 摘要(中文)

本文提出了一种用于Text-to-SQL语义验证的分层SQL表示方法HEROSQL。该方法旨在解决现有方法在捕捉全局用户意图和SQL结构细节方面的不足。HEROSQL集成了全局意图(通过逻辑计划LP)和局部细节(通过抽象语法树AST)。为了更好地信息传播,采用了嵌套消息传递神经网络(NMPNN)来捕获SQL中固有的关系信息,并聚合LP和AST之间的schema引导语义。此外,为了生成高质量的负样本,提出了一种AST驱动的子SQL增强策略,以支持对细粒度语义不一致性的鲁棒优化。在Text-to-SQL验证基准测试(包括域内和域外设置)上进行的大量实验表明,该方法优于现有的state-of-the-art方法,在识别语义不一致性方面,AUPRC平均提高了9.40%,AUROC平均提高了12.35%。该方法擅长检测细粒度的语义错误,为大型语言模型提供更细粒度的反馈,并最终提高数据查询平台的可靠性和可解释性。

🔬 方法详解

问题定义:Text-to-SQL系统需要验证生成的SQL语句的可靠性和可执行性。现有的语义验证方法难以同时捕捉全局用户意图和SQL结构细节,并且缺乏高质量的细粒度子SQL标注,导致无法有效检测语义不一致性。

核心思路:论文的核心思路是使用分层的SQL表示方法,将全局的用户意图(通过逻辑计划LP表示)和局部的SQL结构细节(通过抽象语法树AST表示)相结合。通过这种方式,模型可以同时理解SQL语句的整体语义和局部结构,从而更准确地检测语义不一致性。

技术框架:HEROSQL框架包含以下几个主要模块:1) 分层SQL表示:将SQL语句表示为逻辑计划(LP)和抽象语法树(AST)的组合。2) 嵌套消息传递神经网络(NMPNN):用于捕获SQL中固有的关系信息,并在LP和AST之间聚合schema引导的语义。3) AST驱动的子SQL增强:用于生成高质量的负样本,以支持对细粒度语义不一致性的鲁棒优化。整体流程是,首先将自然语言问题和SQL语句进行分层表示,然后使用NMPNN进行信息传递和语义聚合,最后使用分类器判断SQL语句是否存在语义错误。

关键创新:该论文的关键创新在于提出了HEROSQL,一种分层的SQL表示方法,它能够同时捕捉全局的用户意图和局部的SQL结构细节。与现有方法相比,HEROSQL能够更全面地理解SQL语句的语义,从而更准确地检测语义不一致性。此外,AST驱动的子SQL增强策略也为生成高质量的负样本提供了有效的方法。

关键设计:NMPNN的具体结构包括多层消息传递,每一层都聚合来自相邻节点的信息。损失函数采用交叉熵损失,用于训练分类器判断SQL语句是否存在语义错误。AST驱动的子SQL增强策略通过随机替换、删除或插入AST节点来生成负样本。具体参数设置(例如,NMPNN的层数、消息传递的聚合函数、负样本生成的概率)需要根据具体数据集进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,HEROSQL在Text-to-SQL验证基准测试中取得了显著的性能提升。在识别语义不一致性方面,AUPRC平均提高了9.40%,AUROC平均提高了12.35%。尤其在细粒度语义错误检测方面表现出色,证明了分层表示和嵌套消息传递网络的有效性。

🎯 应用场景

该研究成果可应用于各种Text-to-SQL系统中,提高生成SQL语句的可靠性和可执行性。通过提供更细粒度的反馈,可以帮助大型语言模型更好地理解数据库schema和用户意图,从而生成更准确的SQL语句。此外,该方法还可以用于构建更可靠和可解释的数据查询平台。

📄 摘要(原文)

Text-to-SQL translates natural language questions into SQL statements grounded in a target database schema. Ensuring the reliability and executability of such systems requires validating generated SQL, but most existing approaches focus only on syntactic correctness, with few addressing semantic validation (detecting misalignments between questions and SQL). As a consequence, effective semantic validation still faces two key challenges: capturing both global user intent and SQL structural details, and constructing high-quality fine-grained sub-SQL annotations. To tackle these, we introduce HEROSQL, a hierarchical SQL representation approach that integrates global intent (via Logical Plans, LPs) and local details (via Abstract Syntax Trees, ASTs). To enable better information propagation, we employ a Nested Message Passing Neural Network (NMPNN) to capture inherent relational information in SQL and aggregate schema-guided semantics across LPs and ASTs. Additionally, to generate high-quality negative samples, we propose an AST-driven sub-SQL augmentation strategy, supporting robust optimization of fine-grained semantic inconsistencies. Extensive experiments conducted on Text-to-SQL validation benchmarks (both in-domain and out-of-domain settings) demonstrate that our approach outperforms existing state-of-the-art methods, achieving an average 9.40% improvement of AUPRC and 12.35% of AUROC in identifying semantic inconsistencies. It excels at detecting fine-grained semantic errors, provides large language models with more granular feedback, and ultimately enhances the reliability and interpretability of data querying platforms.