计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (30): 24-25.DOI: 10.3778/j.issn.1002-8331.2008.30.007
孙天昊,朱庆生,李双庆,周明强
SUN Tian-hao,ZHU Qing-sheng,LI Shuang-qing,ZHOU Ming-qiang
摘要: 增强学习可以帮助协商Agent选择最优行动实现其最终目标。对基于增强学习的协商策略进行优化,在协商过程中充分利用对手的历史信息,加快协商解的收敛和提高协商解的质量。最后通过实验验证了算法的有效性和可用性。