Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories
作者: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
分类: cs.CV, cs.CL, cs.CY, cs.HC
发布日期: 2026-06-09
备注: Project page: https://data2story.github.io Github: https://github.com/QinghongLin/data2story-skill
💡 一句话要点
提出数据记者代理以解决数据故事生成问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 数据记者 多模态生成 证据追溯 虚拟新闻室 自动化新闻
📋 核心要点
- 现有的数据处理方法在生成可信的多模态故事方面存在不足,缺乏端到端的解决方案。
- 提出的数据记者代理(Data2Story)通过整合多个专业角色,能够自动化生成基于证据的多模态新闻故事。
- 在对18篇文章的评估中,Data2Story在透明性和可审计性方面表现优异,尽管人类创作仍在某些方面占优。
📝 摘要(中文)
数据讲述塑造社会,而数据记者的职责是将原始信息转化为非专家可以信任的故事。高质量的新闻特写通常需要数周的时间来完成。现有的代理在各个步骤上表现良好,但缺乏一个能够端到端服务的数据记者代理。本文提出了数据记者代理(Data2Story),这是一个多代理框架,将专业角色整合为一个虚拟新闻室。Data2Story的两个创新点在于:一是声明基于证据,二是文章生成多模态内容。通过对18篇文章的评估,Data2Story在透明性和可审计性方面表现出色,尽管人类文章在编辑角度和创意设计上仍占优势。
🔬 方法详解
问题定义:本文旨在解决如何将原始数据转化为可信的多模态新闻故事的问题。现有方法通常只能处理单一步骤,缺乏整体的自动化能力。
核心思路:数据记者代理(Data2Story)通过多代理框架,将数据分析、设计和内容生成等多个步骤整合在一起,形成一个虚拟新闻室,能够自动生成完整的新闻故事。
技术框架:Data2Story的整体架构包括多个模块:数据分析模块、内容生成模块、设计模块和验证模块。每个模块负责特定的任务,协同工作以生成最终的新闻故事。
关键创新:Data2Story的主要创新在于声明的证据基础和多模态生成能力。与传统方法不同,Data2Story能够追溯每个声明的来源,并根据读者需求生成交互式内容。
关键设计:在设计中,Data2Story使用了特定的损失函数来优化生成内容的质量,并结合了多种生成模型,以确保生成的故事在视觉和听觉上都具有吸引力。
🖼️ 关键图片
📊 实验亮点
在对18篇文章的评估中,Data2Story在透明性和可审计性方面表现出色,尤其是在证据追溯方面,显示出其生成的多媒体故事具有竞争力。尽管人类创作在编辑角度和创意设计上仍占优势,但Data2Story在成本效益和效率上具有明显提升。
🎯 应用场景
该研究的潜在应用领域包括新闻媒体、教育和数据可视化等。通过提供一个自动化的工具,Data2Story可以帮助记者更高效地生成基于数据的报道,提升新闻的透明度和可信度,未来可能会对新闻行业产生深远影响。
📄 摘要(原文)
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.