FAME: Forecasting Academic Impact via Continuous-Time Manifold Evolution
作者: Jianrong Ding, Jianyuan Zhong, Zhengyan Shi, Qiang Xu
分类: cs.LG
发布日期: 2026-05-08
💡 一句话要点
提出FAME框架:通过连续时间流形演化建模科学主题动态轨迹,实现学术影响力预测
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 学术影响力预测 时空建模 流形学习 知识流图 科学计量学 动态潜在空间
📋 核心要点
- 现有LLM仅基于静态文本评估学术影响力,缺乏对科学领域演进动态的感知,难以准确区分高影响力与普通论文。
- 提出FAME框架,通过结合文本特征与知识流图,在动态潜在空间中建模科学主题的演化轨迹,捕捉学术发展的方向性动量。
- 实验证明FAME在多维影响力预测任务中大幅超越SOTA LLM,且其几何信号可作为有效补充,显著增强现有模型的预测能力。
📝 摘要(中文)
大型语言模型(LLMs)正日益被用于构思和评估科研创意,但由于新想法的真实影响力往往需要数年时间才能显现,评估这些判断的准确性极具挑战。本研究以人类撰写论文的影响力预测作为可验证的代理任务,发现前沿LLMs难以可靠地区分高影响力论文与普通出版物,表明仅依赖静态文本的评估方式存在局限。为此,我们提出了FAME(通过连续时间流形演化预测学术影响力),这是一个用于建模科学主题动态轨迹的时空框架。FAME将论文投影到一个由文本特征和经过验证的知识流图所驱动的动态潜在空间中,通过学习几何约束,使高影响力论文与领域发展的向前动量对齐。在三个快速演进子领域的3,200篇arXiv论文上的实验表明,FAME在多维影响力预测方面显著优于现有的LLM评估器,且将FAME的动态几何信号集成到LLMs中可进一步提升其预测性能。
🔬 方法详解
问题定义:论文旨在解决学术影响力预测的滞后性与复杂性问题。现有方法主要依赖LLM对论文内容的静态语义分析,忽略了科学发现作为一种随时间演进的动态过程,导致其在预测长期影响力时表现不佳。
核心思路:论文提出将学术影响力建模为一种“流形演化”过程。核心思想是高影响力论文往往顺应了科学领域的发展动量,通过构建时空框架,将论文映射至动态潜在空间,从而量化论文与领域演进方向的契合度。
技术框架:FAME框架包含三个主要模块:首先是基于文本的语义编码器,提取论文的静态特征;其次是基于知识流图的动态建模模块,捕捉领域内的引用与演化关系;最后是流形演化投影层,将上述信息融合并映射至连续时间空间,学习论文在潜在流形上的轨迹。
关键创新:最重要的创新在于引入了“连续时间流形演化”视角,将静态的论文评估转化为动态的轨迹匹配问题。与仅依赖文本语义的LLM不同,FAME显式地建模了科学知识的流动性与方向性。
关键设计:模型采用了几何约束损失函数,强制要求高影响力论文的潜在表示与领域演进的“向前动量”保持一致。此外,通过引入知识流图作为拓扑约束,增强了模型对跨时间引用关系的捕捉能力,确保了潜在空间演化的连续性与逻辑性。
🖼️ 关键图片
📊 实验亮点
在涵盖三个快速演进子领域的3,200篇arXiv论文数据集上,FAME在多维影响力预测任务中表现优异,一致性地超越了GPT-4等前沿LLM评估器。实验显示,将FAME生成的动态几何信号注入LLM后,预测准确率得到显著提升,验证了该框架作为自动化科学评估基础架构的有效性与鲁棒性。
🎯 应用场景
该研究可广泛应用于科研资助评审、学术招聘、论文同行评审辅助及科研趋势监测。通过提供量化的影响力预测,FAME能够帮助研究机构更客观地识别具有突破性潜力的研究方向,优化资源配置,并为科研评价体系提供一种基于数据驱动的辅助决策工具。
📄 摘要(原文)
Large Language Models (LLMs) are increasingly used to brainstorm and evaluate research ideas, yet assessing such judgments is fundamentally difficult because the true impact of a new idea may take years to emerge. We address this challenge by using the impact forecasting of human-authored manuscripts as a verifiable proxy task. In a prospective forecasting study, we find that frontier LLMs fail to reliably distinguish high-impact papers from ordinary publications, suggesting that static text-based judging is insufficient for scientific evaluation. To address this limitation, we propose $\textbf{FAME}$ ($\underline{\text{F}}$orecasting $\underline{\text{A}}$cademic Impact via Continuous-Time $\underline{\text{M}}$anifold $\underline{\text{E}}$volution), a spatiotemporal framework for modeling the dynamic trajectories of scientific topics. FAME projects papers into a dynamic latent space informed by textual features and a verified knowledge-flow graph, learning geometric constraints that align impactful manuscripts with the forward momentum of their fields. Experiments on 3,200 arXiv papers across three fast-evolving subfields show that FAME consistently and substantially outperforms state-of-the-art LLM evaluators in prospective multidimensional impact forecasting. Furthermore, integrating FAME's dynamic geometric signals into LLMs significantly improves their forecasting performance. These results support manuscript impact forecasting as a useful, measurable proxy benchmark and position FAME as a strong, trajectory-aware foundation for automated scientific evaluation.