摘要: 以B2B电子市场中卖方agent的智能定价问题为应用背景,在库诺特短视调整基础上,应用Q学习算法,提出了基于情节序列训练的学习方法,将纯粹以结果为反馈的强化学习方法和以推理为目标的慎思过程结合起来,提高了算法的在线学习性能。仿真实验验证了算法的有效性,为推向实际应用奠定了基础。
韩伟2. 基于情节序列训练的电子市场智能定价算法[J]. 计算机工程与应用, 2007, 43(6): 17-19.
Han wei. An Intelligent Pricing Algorithm Based on multiagent Learning[J]. Computer Engineering and Applications, 2007, 43(6): 17-19.