计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (15): 72-75.
杨克巍,张少丁,岑凯辉,谭跃进
YANG Ke-wei,ZHANG Shao-ding,CEN Kai-hui,TAN Yue-jin
摘要: 在基于半自治agent的系统中应用profit-sharing增强学习方法,并与基于动态规划的Q-learning 增强学习方法进行比较,在不确定因素较多的动态环境中,当系统状态变化不是一个马尔科夫过程时profit-sharing方法具有很大优势。根据半自治agent中半自治的特性——受制性,提出了一种面向基于半自治agent的增强学习模型,以战场仿真中安全隐蔽的寻找模型为实例对基于半自治agent的profit-sharing增强学习模型进行了试验分析。