一种面向建筑节能的强化学习自适应控制方法

doi:10.3778/j.issn.1002-8331.1702-0217

计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (21): 239-246.DOI: 10.3778/j.issn.1002-8331.1702-0217

一种面向建筑节能的强化学习自适应控制方法

胡龄爻1，2，3，陈建平1，2，3，傅启明1，2，3，4，胡文1，2，3，倪庆文1，2，3

1.苏州科技大学电子与信息工程学院，江苏苏州 215009
2.江苏省建筑智慧节能重点实验室，江苏苏州 215009
3.苏州市移动网络技术与应用重点实验室，江苏苏州 215009
4.吉林大学符号计算与知识工程教育部重点实验室，长春 130012

出版日期:2017-11-01 发布日期:2017-11-15

Building energy efficiency oriented reinforcement learning adaptive control method

HU Lingyao1，2，3, CHEN Jianping1，2，3, FU Qiming1，2，3，4, HU Wen1，2，3, NI Qingwen1，2，3

1.College of Electronics and Information Engineering, Suzhou University of Science and Technology, Suzhou, Jiangsu 215009, China
2.Jiangsu Province Key Laboratory of Intelligent Building Energy Efficiency, Suzhou, Jiangsu 215009, China
3.Suzhou Key Laboratory of Mobile Network Technology and Application, Suzhou, Jiangsu 215009, China
4.Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun 130012, China

Online:2017-11-01 Published:2017-11-15

摘要/Abstract

摘要： 针对建筑节能领域中传统控制方法对于建筑物相关设备控制存在收敛速度慢、不稳定等问题，结合强化学习中经典的Q学习方法，提出一种强化学习自适应控制方法——RLAC。该方法通过对建筑物内能耗交换机制进行建模，结合Q学习方法，求解最优值函数，进一步得出最优控制策略，确保在不降低建筑物人体舒适度的情况下，达到建筑节能的目的。将所提出的RLAC与On/Off以及Fuzzy-PD方法用于模拟建筑物能耗问题进行对比实验，实验结果表明，RLAC具有较快的收敛速度以及较好的收敛精度。

关键词: 强化学习, 马尔科夫决策过程, Q学习, 建筑节能, 自适应控制

Abstract: With respect to the problem of slow convergence and instability for the traditional methods, in the field of building energy efficiency, this paper proposes a new reinforcement learning adaptive control method, RLAC by combining Q-learning. The proposed method models the exchange mechanism of the building energy consumption, and tries to find the better control policy by solving the optimal value function. Furthermore, RLAC can decrease the energy consumption without losing the performance of good comfort of the building occupants. Compared with the On/Off and Fuzzy-PD, the proposed RLAC has a better convergence performance in speed and accuracy.

Key words: reinforcement learning, Markov Decision Process(MDP), Q-learning, building energy efficiency, adaptive control

胡龄爻1，2，3，陈建平1，2，3，傅启明1，2，3，4，胡文1，2，3，倪庆文1，2，3. 一种面向建筑节能的强化学习自适应控制方法[J]. 计算机工程与应用, 2017, 53(21): 239-246.

HU Lingyao1，2，3, CHEN Jianping1，2，3, FU Qiming1，2，3，4, HU Wen1，2，3, NI Qingwen1，2，3. Building energy efficiency oriented reinforcement learning adaptive control method[J]. Computer Engineering and Applications, 2017, 53(21): 239-246.

[1]	张鑫，张席. 优先状态估计的双深度Q网络[J]. 计算机工程与应用, 2021, 57(8): 78-83.
[2]	王晓，唐伦，贺小雨，陈前斌. 基于深度强化学习的服务功能链多维资源优化[J]. 计算机工程与应用, 2021, 57(4): 68-76.
[3]	张俊杰，张聪，赵涵捷. 重复利用状态值的竞争深度Q网络算法[J]. 计算机工程与应用, 2021, 57(4): 134-140.
[4]	陈世明，林子朋，高彦丽，裴惠琴. 自适应耦合权重下的异质群体一致性研究[J]. 计算机工程与应用, 2021, 57(4): 231-235.
[5]	赖俊，魏竞毅，陈希亮. 分层强化学习综述[J]. 计算机工程与应用, 2021, 57(3): 72-79.
[6]	马志豪，朱响斌. 拟双曲动量梯度的对抗深度强化学习研究[J]. 计算机工程与应用, 2021, 57(24): 90-99.
[7]	李宝帅，叶春明. 深度强化学习算法求解作业车间调度问题[J]. 计算机工程与应用, 2021, 57(23): 248-254.
[8]	成怡，郝密密. 改进深度强化学习的室内移动机器人路径规划[J]. 计算机工程与应用, 2021, 57(21): 256-262.
[9]	王军，曹雷，陈希亮，赖俊，章乐贵. 多智能体博弈强化学习研究综述[J]. 计算机工程与应用, 2021, 57(21): 1-13.
[10]	况立群，李思远，冯利，韩燮，徐清宇. 深度强化学习算法在智能军事决策中的应用[J]. 计算机工程与应用, 2021, 57(20): 271-278.
[11]	孔松涛，刘池池，史勇，谢义，王堃. 深度强化学习在智能制造中的应用展望综述[J]. 计算机工程与应用, 2021, 57(2): 49-59.
[12]	李浩，宁浩宇，康雁，梁文韬，霍雯. 针对文本情感转换的SMRFGAN模型[J]. 计算机工程与应用, 2021, 57(2): 170-176.
[13]	张荣霞，武长旭，孙同超，赵增顺. 深度强化学习及在路径规划中的研究进展[J]. 计算机工程与应用, 2021, 57(19): 44-56.
[14]	杨薛钰，陈建平，傅启明，陆悠，吴宏杰. 基于随机方差减小方法的DDPG算法[J]. 计算机工程与应用, 2021, 57(19): 104-111.
[15]	宋浩楠，赵刚，王兴芬. 融合知识表示和深度强化学习的知识推理方法[J]. 计算机工程与应用, 2021, 57(19): 189-197.

一种面向建筑节能的强化学习自适应控制方法

Building energy efficiency oriented reinforcement learning adaptive control method

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics