Scaling Data-Driven Building Energy Modelling using Large Language Models

📄 arXiv: 2407.03469v1 📥 PDF

作者: Sunil Khadka, Liang Zhang

分类: cs.SE, cs.AI

发布日期: 2024-07-03


💡 一句话要点

利用大型语言模型扩展数据驱动的建筑能源建模

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 建筑能源建模 数据驱动 自动化建模 提示工程

📋 核心要点

  1. 数据驱动的建筑管理系统面临数据和模型可扩展性问题,限制了其广泛应用。
  2. 利用大型语言模型(LLM)自动生成数据处理和建模代码,无需手动开发,降低成本。
  3. 通过案例研究验证,基于LLM的代码生成方法具有高成功率和准确性,能显著降低人工成本。

📝 摘要(中文)

本文提出了一种利用大型语言模型(LLM)解决数据驱动的建筑管理系统(BMS)在数据和模型可扩展性方面面临的挑战的方法。LLM的代码生成能力可以通过“自动化自动化”,特别是数据处理和数据驱动建模过程,从而更广泛地采用BMS。本文使用LLM生成代码,处理来自BMS的结构化数据,并为BMS的特定需求构建数据驱动模型。这消除了手动数据和模型开发的需求,减少了与此过程相关的时间、精力和成本。论文假设LLM可以将关于数据科学和BMS的领域知识融入到数据处理和建模中,确保数据驱动建模针对不同建筑类型和控制目标的特定需求实现自动化,从而提高准确性和可扩展性。论文遵循机器学习操作框架生成提示模板,以便将提示设计为系统地生成用于数据驱动建模的Python代码。案例研究表明,在提示模板下的双序列提示可以实现高代码生成成功率和代码准确性,并显著降低人工成本。

🔬 方法详解

问题定义:论文旨在解决数据驱动的建筑能源建模中数据和模型的可扩展性问题。现有方法依赖于手动的数据处理和模型开发,耗时耗力,且难以适应不同建筑类型和控制目标的需求。这限制了数据驱动的BMS的广泛应用。

核心思路:论文的核心思路是利用大型语言模型(LLM)的代码生成能力,自动化数据处理和模型开发过程。通过设计合适的提示(prompt),LLM可以生成针对特定建筑和控制目标的Python代码,从而降低人工成本,提高建模效率和准确性。

技术框架:论文采用基于提示工程(prompt engineering)的框架,主要包含以下阶段:1) 设计符合机器学习操作(MLOps)框架的提示模板;2) 使用双序列提示(bi-sequential prompting)方法,即先生成数据处理代码,再生成模型训练代码;3) 利用LLM生成Python代码;4) 评估生成的代码的准确性和性能。

关键创新:论文的关键创新在于将大型语言模型应用于建筑能源建模领域,并提出了一种基于提示工程的自动化建模方法。与传统的手动建模方法相比,该方法能够显著降低人工成本,提高建模效率和可扩展性。此外,通过精心设计的提示模板,LLM能够将领域知识融入到代码生成过程中,从而提高模型的准确性。

关键设计:论文采用双序列提示策略,首先提示LLM生成数据清洗、特征工程等数据处理代码,然后提示LLM基于处理后的数据生成模型训练代码。提示模板遵循MLOps框架,包含明确的任务描述、输入数据格式、输出代码要求等信息。具体的参数设置和损失函数等细节取决于LLM生成的代码,论文侧重于提示工程和框架设计,而非具体的模型结构。

📊 实验亮点

案例研究表明,基于LLM的双序列提示方法能够以高成功率生成准确的代码,显著降低人工成本。具体性能数据和对比基线未在摘要中明确给出,但强调了该方法在自动化和降低成本方面的优势。代码生成成功率和代码准确率是关键的评估指标,表明LLM能够有效地理解和执行建模任务。

🎯 应用场景

该研究成果可应用于各种建筑类型的能源管理系统,实现数据驱动的自动化建模,优化能源消耗,降低运营成本。通过LLM自动生成定制化的模型,可以更好地适应不同建筑的特点和需求,提高能源管理效率。未来,该方法有望推广到其他领域,例如智能制造、智慧城市等,实现更广泛的自动化和智能化。

📄 摘要(原文)

Building Management System (BMS) through a data-driven method always faces data and model scalability issues. We propose a methodology to tackle the scalability challenges associated with the development of data-driven models for BMS by using Large Language Models (LLMs). LLMs' code generation adaptability can enable broader adoption of BMS by "automating the automation," particularly the data handling and data-driven modeling processes. In this paper, we use LLMs to generate code that processes structured data from BMS and build data-driven models for BMS's specific requirements. This eliminates the need for manual data and model development, reducing the time, effort, and cost associated with this process. Our hypothesis is that LLMs can incorporate domain knowledge about data science and BMS into data processing and modeling, ensuring that the data-driven modeling is automated for specific requirements of different building types and control objectives, which also improves accuracy and scalability. We generate a prompt template following the framework of Machine Learning Operations so that the prompts are designed to systematically generate Python code for data-driven modeling. Our case study indicates that bi-sequential prompting under the prompt template can achieve a high success rate of code generation and code accuracy, and significantly reduce human labor costs.