一种优化的基于增强学习协商策略

doi:10.3778/j.issn.1002-8331.2008.30.007

计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (30): 24-25.DOI: 10.3778/j.issn.1002-8331.2008.30.007

一种优化的基于增强学习协商策略

孙天昊,朱庆生,李双庆,周明强

重庆大学计算机学院，重庆 400030

收稿日期:2008-07-01 修回日期:2008-07-28 出版日期:2008-10-21 发布日期:2008-10-21
通讯作者: 孙天昊

Optimized negotiation strategy based on reinforcement learning

SUN Tian-hao,ZHU Qing-sheng,LI Shuang-qing,ZHOU Ming-qiang

College of Computer，Chongqing University，Chongqing 400030，China

Received:2008-07-01 Revised:2008-07-28 Online:2008-10-21 Published:2008-10-21
Contact: SUN Tian-hao

摘要/Abstract

摘要： 增强学习可以帮助协商Agent选择最优行动实现其最终目标。对基于增强学习的协商策略进行优化，在协商过程中充分利用对手的历史信息，加快协商解的收敛和提高协商解的质量。最后通过实验验证了算法的有效性和可用性。

关键词: 增强学习, 协商策略, 协商历史

Abstract: Negotiation agent can use reinforcement learning to select its best actions and reach its final goal.This paper proposes an optimized negotiation strategy based on reinforcement learning.In the middle of negotiation process，it makes the best use of the opponent’s negotiation history，in order to quicken the negotiation result convergence and enhance the negotiation result quality.Finally，the algorithm is proved to be effective and practical by experiment.

Key words: reinforcement learning, negotiation strategy, negotiation history

孙天昊,朱庆生,李双庆,周明强. 一种优化的基于增强学习协商策略[J]. 计算机工程与应用, 2008, 44(30): 24-25.

SUN Tian-hao,ZHU Qing-sheng,LI Shuang-qing,ZHOU Ming-qiang. Optimized negotiation strategy based on reinforcement learning[J]. Computer Engineering and Applications, 2008, 44(30): 24-25.

[1]	季挺，张华. 基于CMAC的非参数化近似策略迭代增强学习[J]. 计算机工程与应用, 2019, 55(2): 128-136.
[2]	陈春晓1，陈治亚1，2，陈维亚1. 基于多智能体增强学习的公交驻站控制方法[J]. 计算机工程与应用, 2015, 51(17): 8-13.
[3]	李健利，霍光磊，刘博，高勇. 使用案例推理的协商策略研究[J]. 计算机工程与应用, 2012, 48(8): 119-121.
[4]	孙天昊，邓俊昆，陈飞，朱庆生. 基于增强学习协商策略的研究及优化[J]. 计算机工程与应用, 2012, 48(23): 44-46.
[5]	郑素娥¹，左保河²，孙甜¹. 多Agent自动协商的公平性研究[J]. 计算机工程与应用, 2011, 47(1): 238-241.
[6]	郑明，王玲娟，蔚承建. 用多Agent系统分配具有启动成本的有限资源[J]. 计算机工程与应用, 2010, 46(4): 219-222.
[7]	修国明,张积滨,潘启树. 基于实例的POMDP问题的近似求解[J]. 计算机工程与应用, 2008, 44(29): 82-85.
[8]	刘国栋,杨宝庆. 多智能体的增强学习及其在RoboCup中的应用[J]. 计算机工程与应用, 2008, 44(23): 46-48.
[9]	姚慧,高承实,戴青,张徐. 一种基于树建模的自动信任协商策略[J]. 计算机工程与应用, 2008, 44(15): 127-130.
[10]	孙天昊朱庆生李双庆. 一对多协商协调策略[J]. 计算机工程与应用, 2007, 43(3期): 230-230.
[11]	杨克巍，张少丁，岑凯辉，谭跃进. 基于半自治agent的profit-sharing增强学习方法研究[J]. 计算机工程与应用, 2007, 43(15): 72-75.

一种优化的基于增强学习协商策略

Optimized negotiation strategy based on reinforcement learning

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 11

编辑推荐

Metrics