计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (22): 7-9.DOI: 10.3778/j.issn.1002-8331.2009.22.003
刘 亮,李龙澍
LIU Liang,LI Long-shu
摘要: 多智能体Q-学习问题往往因为联合动作的个数指数级增长而变得无法解决。从研究分层强化学习入手,通过对强化学习中合作MAS的研究,在基于系统工作逻辑的研究基础上,提出了基于学习过程分层的局部合作强化学习,通过对独立Agent强化学习的知识考察,改进多Agent系统学习的效率,进一步提高了局部合作强化学习的效能。从而解决强化学习中的状态空间的维数灾难,并通过仿真足球的2vs1防守证明了算法的有效性。