计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (21): 239-246.DOI: 10.3778/j.issn.1002-8331.1702-0217
胡龄爻1,2,3,陈建平1,2,3,傅启明1,2,3,4,胡文1,2,3,倪庆文1,2,3
HU Lingyao1,2,3, CHEN Jianping1,2,3, FU Qiming1,2,3,4, HU Wen1,2,3, NI Qingwen1,2,3
摘要: 针对建筑节能领域中传统控制方法对于建筑物相关设备控制存在收敛速度慢、不稳定等问题,结合强化学习中经典的Q学习方法,提出一种强化学习自适应控制方法——RLAC。该方法通过对建筑物内能耗交换机制进行建模,结合Q学习方法,求解最优值函数,进一步得出最优控制策略,确保在不降低建筑物人体舒适度的情况下,达到建筑节能的目的。将所提出的RLAC与On/Off以及Fuzzy-PD方法用于模拟建筑物能耗问题进行对比实验,实验结果表明,RLAC具有较快的收敛速度以及较好的收敛精度。