From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery

📄 arXiv: 2505.13259v3 📥 PDF

作者: Tianshi Zheng, Zheye Deng, Hong Ting Tsang, Weiqi Wang, Jiaxin Bai, Zihao Wang, Yangqiu Song

分类: cs.CL

发布日期: 2025-05-19 (更新: 2025-09-17)

备注: EMNLP 2025 Main

🔗 代码/项目: GITHUB


💡 一句话要点

综述性论文:大型语言模型赋能科学发现,从自动化工具到自主科研智能体

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 科学发现 自主性 人机协作 综述 人工智能 机器人自动化

📋 核心要点

  1. 现有科学研究流程面临效率瓶颈,需要更智能的工具来加速知识发现和实验验证。
  2. 论文提出基于LLM的三层自主性框架,将LLM在科研中的角色划分为工具、分析师和科学家,逐步提升自主性。
  3. 该综述探讨了LLM在科学发现中的应用,并指出了机器人自动化、自我改进和伦理治理等未来研究方向。

📝 摘要(中文)

大型语言模型(LLMs)正在催化科学发现的范式转变,从特定任务的自动化工具演变为越来越自主的智能体,从根本上重新定义研究过程和人机协作。本综述系统地描述了这一新兴领域,重点关注LLMs在科学领域中不断变化的角色和不断提升的能力。通过科学方法,我们引入了一个基础的三层分类法——工具、分析师和科学家——来描述它们在研究生命周期中不断提升的自主性和不断发展的责任。我们进一步确定了关键挑战和未来的研究方向,如机器人自动化、自我改进和伦理治理。总的来说,本综述提供了一个概念架构和战略远见,以引导和塑造人工智能驱动的科学发现的未来,促进快速创新和负责任的进步。

🔬 方法详解

问题定义:当前科学研究面临数据量爆炸、实验设计复杂、知识整合困难等挑战,传统方法难以高效地进行科学发现。现有方法在自动化程度上存在局限,缺乏自主性和智能性,无法充分利用海量数据和知识。

核心思路:论文的核心思路是将LLM引入科学发现流程,并根据LLM在科研中的自主性程度,将其角色划分为三个层次:工具、分析师和科学家。通过逐步提升LLM的自主性,使其能够更有效地辅助甚至自主完成科学研究任务。这种分层方法旨在系统地探索LLM在科学发现中的潜力,并为未来的研究提供指导。

技术框架:该综述构建了一个概念框架,将LLM在科学发现中的应用划分为三个层次。第一层是“工具”,LLM作为辅助工具,执行特定任务,例如数据清洗、文献检索等。第二层是“分析师”,LLM能够进行数据分析、模式识别和假设生成。第三层是“科学家”,LLM能够自主设计实验、验证假设并进行知识推理。该框架还探讨了机器人自动化、自我改进和伦理治理等关键问题。

关键创新:该综述的关键创新在于提出了一个三层自主性框架,用于描述LLM在科学发现中的角色演变。该框架不仅提供了一个清晰的分类体系,还为未来的研究方向提供了指导。此外,该综述还强调了LLM在科学发现中的伦理问题,例如数据偏见和知识产权。

关键设计:该综述没有涉及具体的参数设置、损失函数或网络结构等技术细节,而是侧重于对LLM在科学发现中的应用进行系统性的综述和分析。未来的研究可以基于该框架,探索更具体的技术细节,例如如何设计更有效的LLM模型,如何利用LLM进行实验设计和验证,以及如何解决LLM在科学发现中面临的伦理问题。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

该综述系统地梳理了LLM在科学发现中的应用,并提出了一个三层自主性框架,为未来的研究提供了指导。该综述还强调了LLM在科学发现中的伦理问题,例如数据偏见和知识产权。该论文在github上开源了相关资源,方便研究者进一步学习和探索。

🎯 应用场景

该研究具有广泛的应用前景,可应用于新药研发、材料科学、化学工程等领域。通过利用LLM的强大能力,可以加速科学发现过程,降低研发成本,并推动科学技术的进步。未来,LLM有望成为科学家不可或缺的助手,甚至能够自主进行科学研究。

📄 摘要(原文)

Large Language Models (LLMs) are catalyzing a paradigm shift in scientific discovery, evolving from task-specific automation tools into increasingly autonomous agents and fundamentally redefining research processes and human-AI collaboration. This survey systematically charts this burgeoning field, placing a central focus on the changing roles and escalating capabilities of LLMs in science. Through the lens of the scientific method, we introduce a foundational three-level taxonomy-Tool, Analyst, and Scientist-to delineate their escalating autonomy and evolving responsibilities within the research lifecycle. We further identify pivotal challenges and future research trajectories such as robotic automation, self-improvement, and ethical governance. Overall, this survey provides a conceptual architecture and strategic foresight to navigate and shape the future of AI-driven scientific discovery, fostering both rapid innovation and responsible advancement. Github Repository: https://github.com/HKUST-KnowComp/Awesome-LLM-Scientific-Discovery.