计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (19): 131-133.DOI: 10.3778/j.issn.1002-8331.2009.19.040
廉佐政1,王海珍2,邓文新1,滕艳平2
LIAN Zuo-zheng1,WANG Hai-zhen2,DENG Wen-xin1,TENG Yan-ping2
摘要: 在多Agent系统(MAS)环境中,协商是一个复杂的动态交互过程。如何提高协商效率,成为了研究者关注的焦点。应用记忆演化理论的强化学习思想,提出一种Agent协商算法。它与基本强化学习相比,3阶段的记忆演化的强化学习,使得Agent可以在实时回报与延迟回报间更好的做出平衡,并为Agent记忆社会化交互创造条件,使强化学习更适合MAS的要求。通过模拟实验证明该协商算法是有效性的。