计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (24): 156-158.DOI: 10.3778/j.issn.1002-8331.2008.24.047
毛俊杰,刘国栋
MAO Jun-jie,LIU Guo-dong
摘要: 针对传统的多Agent强化学习算法中,Agent学习效率低的问题,在传统强化学习算法中加入具有经验知识的函数;从心理学角度引入内部激励的概念,并将其作为强化学习的激励信号,与外部激励信号一同作用于强化学习的整个过程。最后将此算法运用到RoboCup仿真中,仿真结果表明该算法的学习效率和收敛速度明显优于传统的强化学习。