Personalized Building Climate Control with Contextual Preferential Bayesian Optimization
作者: Wenbin Wang, Jicheng Shi, Colin N. Jones
分类: eess.SY
发布日期: 2025-12-10
💡 一句话要点
提出上下文偏好贝叶斯优化,实现个性化建筑气候控制
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 贝叶斯优化 建筑气候控制 个性化控制 偏好学习 模型预测控制
📋 核心要点
- 建筑气候控制器的优化面临效用函数难以直接测量和时变上下文因素干扰的挑战。
- 论文提出上下文偏好贝叶斯优化算法,利用二元偏好反馈和上下文信息实现实时控制器调整。
- 实验表明,该方法在建筑模拟平台BOPTEST上优于基线控制器,效用提升高达23%,并能适应不同居住者偏好。
📝 摘要(中文)
为了优化居住者的舒适度和满意度,高效调整建筑气候控制器至关重要。然而,潜在效用难以直接测量,这使得该任务充满挑战。此外,室外温度等时变上下文因素进一步增加了问题的复杂性。为了应对这些挑战,我们提出了一种上下文偏好贝叶斯优化算法,该算法利用二元偏好反馈和上下文信息,以实现高效的实时控制器调整。我们在BOPTEST(一个高保真建筑模拟平台)上通过调整经济模型预测控制(MPC)控制器来验证该方法。在为期两个月的模拟期间,我们的方法优于基线控制器,并且效用提高了高达23%。此外,对于不同的居住者类型,我们证明该算法能够自动适应个人偏好,从而实现个性化的控制器调整。
🔬 方法详解
问题定义:论文旨在解决建筑气候控制中,如何根据居住者的个性化偏好和时变的外部环境,高效地调整控制器参数,以最大化居住者的舒适度和满意度的问题。现有方法难以直接测量居住者的效用函数,且无法有效处理上下文信息,导致控制效果不佳。
核心思路:论文的核心思路是利用贝叶斯优化框架,结合居住者的二元偏好反馈(例如,更喜欢设置A还是设置B)和上下文信息(例如,室外温度),学习一个代理模型来近似居住者的效用函数。通过不断迭代,算法能够找到最优的控制器参数,从而实现个性化的建筑气候控制。
技术框架:整体框架包含以下几个主要模块:1) 上下文信息获取模块,用于获取室外温度、时间等上下文信息;2) 控制器参数空间定义模块,定义控制器可调整的参数范围;3) 偏好反馈收集模块,通过二元比较收集居住者的偏好反馈;4) 贝叶斯优化模块,利用高斯过程等模型建立效用函数的代理模型,并使用采集函数选择下一个要评估的控制器参数;5) 控制器部署模块,将选定的控制器参数部署到实际的建筑气候控制系统中。
关键创新:论文的关键创新在于将上下文信息和偏好反馈融入到贝叶斯优化框架中。传统的贝叶斯优化方法通常只考虑目标函数的直接测量值,而忽略了上下文信息和偏好反馈。通过引入上下文信息,算法能够更好地适应时变的环境条件。通过利用偏好反馈,算法能够更有效地学习居住者的个性化偏好。
关键设计:论文使用高斯过程作为效用函数的代理模型,并使用期望提升(Expected Improvement, EI)作为采集函数。偏好反馈被建模为一个二元比较问题,并使用Bradley-Terry模型来估计每个控制器参数的效用值。上下文信息被作为高斯过程的输入,从而使代理模型能够根据上下文信息进行调整。具体参数设置未知。
🖼️ 关键图片
📊 实验亮点
在BOPTEST建筑模拟平台上,该方法与基线控制器相比,效用提升高达23%。实验结果表明,该算法能够有效地适应不同居住者的偏好,实现个性化的控制器调整。此外,该方法在实时性方面表现良好,能够满足实际应用的需求。
🎯 应用场景
该研究成果可应用于智能建筑、智能家居等领域,实现个性化的建筑气候控制,提高居住者的舒适度和满意度,并降低能源消耗。通过自动适应不同居住者的偏好和外部环境,该方法能够显著提升建筑气候控制系统的性能和用户体验。未来,该技术还可以扩展到其他需要个性化优化的控制问题,例如机器人控制、推荐系统等。
📄 摘要(原文)
Efficient tuning of building climate controllers to optimize occupant utility is essential for ensuring overall comfort and satisfaction. However, this is a challenging task since the latent utility are difficult to measure directly. Time-varying contextual factors, such as outdoor temperature, further complicate the problem. To address these challenges, we propose a contextual preferential Bayesian optimization algorithm that leverages binary preference feedback together with contextual information to enable efficient real-time controller tuning. We validate the approach by tuning an economic MPC controller on BOPTEST, a high-fidelity building simulation platform. Over a two-month simulation period, our method outperforms the baseline controller and achieves an improvement of up to 23% in utility. Moreover, for different occupant types, we demonstrate that the algorithm automatically adapts to individual preferences, enabling personalized controller tuning.