Tree-of-Text: A Tree-based Prompting Framework for Table-to-Text Generation in the Sports Domain

📄 arXiv: 2604.26501v1 📥 PDF

作者: Shang-Hsuan Chiang, Tsan-Tsung Yang, An-Zi Yen, Wen-Chih Peng

分类: cs.CL, cs.AI, cs.HC

发布日期: 2026-04-29

备注: Accepted by ACL SRW 2025: Long Paper (Oral)


💡 一句话要点

提出Tree-of-Text框架,解决体育领域表格到文本生成中的幻觉问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 表格到文本生成 大型语言模型 提示学习 体育领域 内容规划

📋 核心要点

  1. 现有表格到文本方法在体育领域面临挑战,模型方法依赖大量标注数据,而基于LLM的提示方法易产生幻觉。
  2. Tree-of-Text框架通过树状结构的提示,引导LLM分阶段进行内容规划、操作执行和内容生成,提升表格理解和文本连贯性。
  3. 实验结果表明,Tree-of-Text在多个体育数据集上优于现有方法,并在时间和成本上具有显著优势。

📝 摘要(中文)

本文提出了一种名为Tree-of-Text的树状结构提示框架,用于解决体育领域中从结构化表格生成比赛报告的复杂表格到文本任务。传统基于模型的方法需要大量的标注数据集,而使用大型语言模型(LLM)的基于提示的方法由于表格理解能力不足,常常出现幻觉问题。Tree-of-Text框架通过引导LLM完成三个阶段的生成过程来克服这些挑战:(1)内容规划,从输入表格中选择相关的操作和参数;(2)操作执行,将大型表格分解为可管理的子表格;(3)内容生成,将简短的文本输出合并并改写成连贯的报告。实验表明,该方法在ShuttleSet+上优于现有方法,在RotoWire-FG上领先RG和CO指标,并在MLB上以大约Chain-of-Table 40%的时间和成本在CS和CO指标上表现出色。这些结果证明了Tree-of-Text的有效性和效率,并为体育领域中基于提示的表格到文本生成提供了一个有希望的方向。

🔬 方法详解

问题定义:论文旨在解决体育领域中,从结构化表格生成高质量、无幻觉的比赛报告这一表格到文本的任务。现有方法,特别是基于大型语言模型的提示学习方法,在处理复杂表格时,由于缺乏对表格内容的深入理解,容易产生与事实不符的幻觉内容,影响生成报告的质量。此外,传统模型训练方法需要大量标注数据,成本高昂。

核心思路:论文的核心思路是将复杂的表格到文本生成任务分解为多个可控的子任务,并利用树状结构来组织这些子任务。通过显式地规划内容、执行操作和生成文本,引导大型语言模型逐步理解表格内容,减少幻觉的产生,并提高生成报告的质量和连贯性。这种分而治之的策略使得模型能够更好地处理大型和复杂的表格数据。

技术框架:Tree-of-Text框架包含三个主要阶段:内容规划、操作执行和内容生成。首先,内容规划阶段从输入表格中选择相关的操作和参数,确定报告的重点内容。其次,操作执行阶段将大型表格分解为更小的、易于管理的子表格,方便后续处理。最后,内容生成阶段将各个子表格对应的文本片段合并并改写成连贯的报告。整个过程通过树状结构进行组织,每个节点代表一个子任务,父节点依赖于子节点的输出。

关键创新:Tree-of-Text的关键创新在于其树状结构的提示框架,它将复杂的表格到文本生成任务分解为多个可控的子任务,并显式地引导大型语言模型逐步理解表格内容。与传统的端到端方法相比,Tree-of-Text能够更好地控制生成过程,减少幻觉的产生,并提高生成报告的质量和连贯性。此外,该框架还能够有效地利用大型语言模型的知识,减少对大量标注数据的依赖。

关键设计:在内容规划阶段,论文设计了特定的提示模板,引导LLM选择与报告相关的操作和参数。在操作执行阶段,论文采用启发式规则将大型表格分解为子表格。在内容生成阶段,论文使用特定的提示模板,引导LLM将各个子表格对应的文本片段合并并改写成连贯的报告。具体的参数设置和损失函数等技术细节在论文中未详细描述,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,Tree-of-Text框架在ShuttleSet+数据集上优于现有方法。在RotoWire-FG数据集上,Tree-of-Text在RG和CO指标上取得了领先。在MLB数据集上,Tree-of-Text以大约Chain-of-Table 40%的时间和成本,在CS和CO指标上表现出色。这些结果证明了Tree-of-Text框架在体育领域表格到文本生成任务中的有效性和效率。

🎯 应用场景

该研究成果可应用于自动化体育赛事报道生成、金融报告自动撰写、数据分析报告生成等领域。通过结构化数据到自然语言的转换,可以大幅提升信息传播效率,降低人工撰写成本,并为用户提供更加便捷、高效的信息获取方式。未来,该技术有望扩展到更多领域,例如科学研究报告、商业分析报告等。

📄 摘要(原文)

Generating sports game reports from structured tables is a complex table-to-text task that demands both precise data interpretation and fluent narrative generation. Traditional model-based approaches require large, annotated datasets, while prompt-based methods using large language models (LLMs) often struggle with hallucination due to weak table comprehension. To overcome these challenges, we propose Tree-of-Text, a tree-structured prompting framework that guides LLMs through a three-stage generation process: (1) Content Planning, where relevant operations and arguments are selected from the input tables; (2) Operation Execution, which breaks down large tables into manageable sub-tables; and (3) Content Generation, where short textual outputs are merged and rewritten into a cohesive report. Experiments show that our method outperforms existing methods on ShuttleSet+, leads in RG and CO metrics on RotoWire-FG, and excels in CS and CO on MLB with roughly 40% of the time and cost of Chain-of-Table. These results demonstrate the effectiveness and efficiency of Tree-of-Text and suggest a promising direction for prompt-based table-to-text generation in the sports domain.