Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

📄 arXiv: 2603.10285v1 📥 PDF

作者: Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. Ahyong

分类: cs.HC, cs.AI, cs.CY, cs.DL, cs.ET

发布日期: 2026-03-11

备注: 25 pages, 9 figures


💡 一句话要点

提出基于对话式AI的探索系统,用于查询大型自然历史博物馆数字化馆藏

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 对话式AI 自然语言处理 大型语言模型 数字化馆藏 自然历史博物馆

📋 核心要点

  1. 现有自然历史博物馆数字化馆藏数据量庞大,但传统检索方式(如关键词搜索)存在局限性,阻碍了公众的有效访问和理解。
  2. 论文提出利用对话式AI构建探索系统,用户可以通过自然语言与系统交互,查询和理解澳大利亚博物馆的数字化标本数据。
  3. 该系统集成了交互式地图和自然语言对话代理,并利用大型语言模型的功能调用能力,实现与外部API的实时数据交互。

📝 摘要(中文)

自然历史博物馆的数字化工作产生了大量的馆藏数据,但其规模和科学复杂性常常阻碍公众的访问和理解。传统的数据管理工具,如数据库,通过基于关键词的搜索限制了探索,或需要专门的模式知识。本文提出了一种系统设计,该系统使用对话式AI来查询澳大利亚博物馆生命科学馆藏中近170万条数字化标本记录。该系统通过以人为中心的设计过程进行设计和开发,包含一个用于视觉空间探索的交互式地图和一个自然语言对话代理,该代理检索详细的标本数据并回答特定于馆藏的问题。该系统利用当代大型语言模型的功能调用能力,从外部API动态检索结构化数据,从而实现与广泛但频繁更新的数据集的快速实时交互。我们的工作提供了一种通过基于自然语言的查询连接大型博物馆馆藏的新方法,并为未来自然历史博物馆的科学AI代理的设计提供信息。

🔬 方法详解

问题定义:自然历史博物馆的数字化馆藏数据量巨大,但传统的数据查询方式(如数据库查询、关键词搜索)需要用户具备专业知识,难以满足公众的探索需求。现有方法无法有效利用自然语言进行交互,难以快速检索和理解馆藏信息。

核心思路:利用对话式AI技术,构建一个自然语言交互界面,用户可以通过提问的方式查询馆藏数据。通过集成交互式地图,提供可视化的空间探索方式。利用大型语言模型的功能调用能力,实现与外部API的实时数据交互,保证数据的时效性。

技术框架:该系统包含以下主要模块:1) 交互式地图:用于展示标本的空间分布,提供可视化的探索方式。2) 自然语言对话代理:负责理解用户的自然语言查询,并生成相应的数据库查询语句。3) 外部API接口:用于从澳大利亚博物馆的数据库中检索标本数据。4) 大型语言模型:利用其功能调用能力,将自然语言查询转化为API调用,并将API返回的结果转化为自然语言回复。

关键创新:该系统的关键创新在于将对话式AI技术应用于自然历史博物馆的数字化馆藏查询。通过利用大型语言模型的功能调用能力,实现了自然语言查询到结构化数据检索的无缝衔接。集成了交互式地图,提供了可视化的探索方式,提升了用户体验。

关键设计:系统设计中,选择了合适的LLM模型,并针对博物馆馆藏数据进行了微调,以提高查询的准确性和效率。设计了清晰的API接口,方便与博物馆的数据库进行交互。在对话代理的设计中,采用了多轮对话管理策略,支持用户进行更复杂的查询。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该系统成功应用于澳大利亚博物馆的近170万条数字化标本记录的查询。通过自然语言交互,用户可以快速检索到所需的标本信息,并了解其空间分布。与传统的关键词搜索相比,该系统能够更准确地理解用户的意图,并提供更丰富的查询结果。具体性能数据未知,但用户反馈表明,该系统显著提升了馆藏数据的可访问性和易用性。

🎯 应用场景

该研究成果可应用于其他自然历史博物馆、图书馆、档案馆等机构的数字化资源管理,提升公众对科学数据的访问和理解。该系统也可扩展到其他领域,如教育、旅游等,为用户提供个性化的信息查询和知识探索服务。未来,可以结合虚拟现实、增强现实等技术,构建更沉浸式的数字化馆藏体验。

📄 摘要(原文)

Recent digitisation efforts in natural history museums have produced large volumes of collection data, yet their scale and scientific complexity often hinder public access and understanding. Conventional data management tools, such as databases, restrict exploration through keyword-based search or require specialised schema knowledge. This paper presents a system design that uses conversational AI to query nearly 1.7 million digitised specimen records from the life-science collections of the Australian Museum. Designed and developed through a human-centred design process, the system contains an interactive map for visual-spatial exploration and a natural-language conversational agent that retrieves detailed specimen data and answers collection-specific questions. The system leverages function-calling capabilities of contemporary large language models to dynamically retrieve structured data from external APIs, enabling fast, real-time interaction with extensive yet frequently updated datasets. Our work provides a new approach of connecting large museum collections with natural language-based queries and informs future designs of scientific AI agents for natural history museums.