Paper2Web: Let's Make Your Paper Alive!

作者: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen

分类: cs.CL, cs.CV

发布日期: 2025-10-17

备注: Under Review. Check https://github.com/YuhangChen1/Paper2All for the unified platform to streamline all academic presentation

💡 一句话要点

Paper2Web：提出学术网页自动生成框架PWAgent，提升论文传播效果

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 学术网页生成 自主智能体 多维度评估 基准数据集 人机交互

📋 核心要点

现有学术网页生成方法难以兼顾布局、交互性与信息呈现，缺乏全面评估标准。
Paper2Web提出基准数据集与多维度评估框架，并设计自主流程PWAgent优化网页生成。
实验表明，PWAgent在网页质量和成本控制上均优于现有方法，实现帕累托最优。

📝 摘要（中文）

学术项目网站通过清晰地呈现核心内容并实现直观的导航和交互，能够更有效地传播研究成果。然而，目前的方法，如直接使用大型语言模型（LLM）生成、模板或直接HTML转换，难以生成布局感知、交互式的网站，并且缺乏针对此任务的全面评估体系。本文介绍了Paper2Web，一个用于评估学术网页生成的基准数据集和多维度评估框架。它包含基于规则的指标（如连通性、完整性）和人工验证的LLM-as-a-Judge（涵盖交互性、美学和信息性），以及PaperQuiz，用于衡量论文级别的知识保留。此外，我们还提出了PWAgent，一个将科学论文转换为交互式和多媒体丰富的学术主页的自主流程。该Agent通过MCP工具迭代地改进内容和布局，从而增强重点、平衡和呈现质量。实验表明，PWAgent始终优于基于模板的网页和arXiv/alphaXiv版本等端到端基线，并且成本较低，在学术网页生成中实现了帕累托最优。

🔬 方法详解

问题定义：现有方法在将学术论文转化为网页时存在诸多痛点。直接使用大型语言模型（LLM）生成难以保证布局的合理性和交互性，模板方法缺乏灵活性，而直接HTML转换则可能丢失论文的结构信息。此外，缺乏一个全面的评估体系来衡量生成的学术网页的质量，包括内容完整性、交互性、美观程度以及知识保留能力。

核心思路：Paper2Web的核心思路是构建一个能够自主学习并迭代优化学术网页生成的智能体（PWAgent）。该智能体能够理解论文的内容和结构，并根据预定义的规则和评估指标，生成具有良好布局、交互性和信息呈现效果的网页。通过引入多维度的评估框架，可以对生成的网页进行客观的评价，并指导智能体不断改进。

技术框架：PWAgent的整体架构是一个自主流程，它首先解析输入的学术论文，提取关键信息和结构。然后，利用MCP（增强重点、平衡和呈现质量）工具迭代地改进内容和布局。这个迭代过程受到Paper2Web基准数据集和评估框架的指导，包括基于规则的指标（连通性、完整性）和LLM-as-a-Judge（交互性、美学、信息性）。最后，生成交互式和多媒体丰富的学术主页。

关键创新：Paper2Web的关键创新在于提出了一个完整的学术网页生成和评估体系。它不仅提供了一个基准数据集和多维度评估框架，还设计了一个能够自主学习和优化的智能体PWAgent。与现有方法相比，PWAgent能够更好地理解论文的内容和结构，并生成更具交互性和信息呈现效果的网页。此外，Paper2Web的评估框架也更加全面和客观，能够更准确地衡量生成的网页的质量。

关键设计：PWAgent的关键设计包括MCP工具，用于增强重点、平衡和呈现质量。具体的技术细节包括如何使用LLM来评估网页的交互性、美学和信息性，以及如何设计PaperQuiz来衡量论文级别的知识保留。此外，如何定义和计算连通性和完整性等基于规则的指标也是关键的设计细节。

🖼️ 关键图片

📊 实验亮点

PWAgent在学术网页生成任务中显著优于现有方法，包括基于模板的网页和arXiv/alphaXiv版本。实验结果表明，PWAgent在连通性、完整性、交互性、美学和信息性等多个指标上均取得了显著提升，并且在成本控制方面也表现出色，实现了学术网页生成的帕累托最优。具体的性能数据和提升幅度在论文中有详细展示。

🎯 应用场景

该研究成果可广泛应用于学术论文的传播和推广，帮助研究者更有效地展示其研究成果，提升学术影响力。通过自动生成高质量的学术网页，可以降低研究者在网页制作上的时间和精力投入，使其能够更专注于研究本身。此外，该技术还可以应用于在线教育、知识共享等领域，促进学术交流和知识传播。

📄 摘要（原文）

Academic project websites can more effectively disseminate research when they clearly present core content and enable intuitive navigation and interaction. However, current approaches such as direct Large Language Model (LLM) generation, templates, or direct HTML conversion struggle to produce layout-aware, interactive sites, and a comprehensive evaluation suite for this task has been lacking. In this paper, we introduce Paper2Web, a benchmark dataset and multi-dimensional evaluation framework for assessing academic webpage generation. It incorporates rule-based metrics like Connectivity, Completeness and human-verified LLM-as-a-Judge (covering interactivity, aesthetics, and informativeness), and PaperQuiz, which measures paper-level knowledge retention. We further present PWAgent, an autonomous pipeline that converts scientific papers into interactive and multimedia-rich academic homepages. The agent iteratively refines both content and layout through MCP tools that enhance emphasis, balance, and presentation quality. Our experiments show that PWAgent consistently outperforms end-to-end baselines like template-based webpages and arXiv/alphaXiv versions by a large margin while maintaining low cost, achieving the Pareto-front in academic webpage generation.

Paper2Web: Let's Make Your Paper Alive!

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理