计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (13): 1-5.
程晓北,沈 晶,刘海波,顾国昌,张国印
CHENG Xiao-bei,SHEN Jing,LIU Hai-bo,GU Guo-chang,ZHANG Guo-yin
摘要: 强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。但强化学习方法一直被维数灾难所困扰。近年来,分层强化学习方法在解决维数灾问题中取得了显著成果,并逐渐开始向多智能体系统推广,论文归纳分析这一领域目前的研究进展,并对迫切需要解决的一些问题和进一步的发展趋势作出探讨和展望。