From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery

作者: Tianshi Zheng, Zheye Deng, Hong Ting Tsang, Weiqi Wang, Jiaxin Bai, Zihao Wang, Yangqiu Song

分类: cs.CL

发布日期: 2025-05-19 (更新: 2025-09-17)

备注: EMNLP 2025 Main

🔗 代码/项目: GITHUB

💡 一句话要点

综述性论文：大型语言模型赋能科学发现，从自动化工具到自主科研智能体

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 科学发现 自主性 人机协作 综述 人工智能 机器人自动化

📋 核心要点

现有科学研究流程面临效率瓶颈，需要更智能的工具来加速知识发现和实验验证。
论文提出基于LLM的三层自主性框架，将LLM在科研中的角色划分为工具、分析师和科学家，逐步提升自主性。
该综述探讨了LLM在科学发现中的应用，并指出了机器人自动化、自我改进和伦理治理等未来研究方向。

📝 摘要（中文）

大型语言模型(LLMs)正在催化科学发现的范式转变，从特定任务的自动化工具演变为越来越自主的智能体，从根本上重新定义研究过程和人机协作。本综述系统地描述了这一新兴领域，重点关注LLMs在科学领域中不断变化的角色和不断提升的能力。通过科学方法，我们引入了一个基础的三层分类法——工具、分析师和科学家——来描述它们在研究生命周期中不断提升的自主性和不断发展的责任。我们进一步确定了关键挑战和未来的研究方向，如机器人自动化、自我改进和伦理治理。总的来说，本综述提供了一个概念架构和战略远见，以引导和塑造人工智能驱动的科学发现的未来，促进快速创新和负责任的进步。

🔬 方法详解

问题定义：当前科学研究面临数据量爆炸、实验设计复杂、知识整合困难等挑战，传统方法难以高效地进行科学发现。现有方法在自动化程度上存在局限，缺乏自主性和智能性，无法充分利用海量数据和知识。

核心思路：论文的核心思路是将LLM引入科学发现流程，并根据LLM在科研中的自主性程度，将其角色划分为三个层次：工具、分析师和科学家。通过逐步提升LLM的自主性，使其能够更有效地辅助甚至自主完成科学研究任务。这种分层方法旨在系统地探索LLM在科学发现中的潜力，并为未来的研究提供指导。

技术框架：该综述构建了一个概念框架，将LLM在科学发现中的应用划分为三个层次。第一层是“工具”，LLM作为辅助工具，执行特定任务，例如数据清洗、文献检索等。第二层是“分析师”，LLM能够进行数据分析、模式识别和假设生成。第三层是“科学家”，LLM能够自主设计实验、验证假设并进行知识推理。该框架还探讨了机器人自动化、自我改进和伦理治理等关键问题。

关键创新：该综述的关键创新在于提出了一个三层自主性框架，用于描述LLM在科学发现中的角色演变。该框架不仅提供了一个清晰的分类体系，还为未来的研究方向提供了指导。此外，该综述还强调了LLM在科学发现中的伦理问题，例如数据偏见和知识产权。

关键设计：该综述没有涉及具体的参数设置、损失函数或网络结构等技术细节，而是侧重于对LLM在科学发现中的应用进行系统性的综述和分析。未来的研究可以基于该框架，探索更具体的技术细节，例如如何设计更有效的LLM模型，如何利用LLM进行实验设计和验证，以及如何解决LLM在科学发现中面临的伦理问题。

🖼️ 关键图片

📊 实验亮点

该综述系统地梳理了LLM在科学发现中的应用，并提出了一个三层自主性框架，为未来的研究提供了指导。该综述还强调了LLM在科学发现中的伦理问题，例如数据偏见和知识产权。该论文在github上开源了相关资源，方便研究者进一步学习和探索。

🎯 应用场景

该研究具有广泛的应用前景，可应用于新药研发、材料科学、化学工程等领域。通过利用LLM的强大能力，可以加速科学发现过程，降低研发成本，并推动科学技术的进步。未来，LLM有望成为科学家不可或缺的助手，甚至能够自主进行科学研究。

📄 摘要（原文）

Large Language Models (LLMs) are catalyzing a paradigm shift in scientific discovery, evolving from task-specific automation tools into increasingly autonomous agents and fundamentally redefining research processes and human-AI collaboration. This survey systematically charts this burgeoning field, placing a central focus on the changing roles and escalating capabilities of LLMs in science. Through the lens of the scientific method, we introduce a foundational three-level taxonomy-Tool, Analyst, and Scientist-to delineate their escalating autonomy and evolving responsibilities within the research lifecycle. We further identify pivotal challenges and future research trajectories such as robotic automation, self-improvement, and ethical governance. Overall, this survey provides a conceptual architecture and strategic foresight to navigate and shape the future of AI-driven scientific discovery, fostering both rapid innovation and responsible advancement. Github Repository: https://github.com/HKUST-KnowComp/Awesome-LLM-Scientific-Discovery.

From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理