计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (23): 44-46.
孙天昊,邓俊昆,陈 飞,朱庆生
SUN Tianhao, DENG Junkun, CHEN Fei, ZHU Qingsheng
摘要: 增强学习在电子商务中可以帮助Agent选择最优行动,并达成目标。在传统增强学习协商策略中,Agent一开始便进行大幅度的妥协,这是不合理的,与现实不符,降低了Agent的期望。通过期望还原率来还原Agent的真实期望,对协商策略进行优化;讨论了期望还原率的取值对协商过程的影响;通过实验验证了优化的协商策略在保证协商效率的同时,提高了协商解的质量。