基于随机对策的团队CGA学习

doi:10.3778/j.issn.1002-8331.2009.23.015

计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (23): 52-54.DOI: 10.3778/j.issn.1002-8331.2009.23.015

基于随机对策的团队CGA学习

郑延斌，牛丽平

河南师范大学计算机与信息技术学院，河南新乡 453007

收稿日期:2009-04-28 修回日期:2009-06-15 出版日期:2009-08-11 发布日期:2009-08-11
通讯作者: 郑延斌

Research on team CGA learning based on stochastic game

ZHENG Yan-bin，NIU Li-ping

College of Computer and Information，Henan Normal University，Xinxiang，Henan 453007，China

Received:2009-04-28 Revised:2009-06-15 Online:2009-08-11 Published:2009-08-11
Contact: ZHENG Yan-bin

摘要/Abstract

摘要： 分布式虚拟环境中，个体CGA通过学习来适应环境和团队中其他CGA，从而增强团队求解问题的能力，提高团队的适应性和鲁棒性。当基于随机对策的团队CGA学习出现多个平衡解时，必须解决平衡的选择问题。提出了一种团队CGA学习方法TCCLA，该方法把团队CGA的学习分为两个层次：管理成员的学习和非管理成员的学习，团队中所有成员根据偏好选择最优行为，非管理成员在管理成员的引导下学习到最优平衡，解决了平衡的选择问题，改进了IPL算法，实验表明TCCLA算法的高效性。

关键词: 团队CGA, 学习, 对策, 平衡, 偏好

Abstract: In distributed virtual environment，through learning，individual CGA can adapt environment and other CGA in team，so the capability of team problems solving，the adaptability and robust of CGA team have been increased.When the learning based on random games of team CGA has much equilibrium，the equilibrium selection problem of every member in team must be solved.This paper gives a learning method for team CGA called TCCLA.It divides the learning into two levels：manager learning and non manager learning.Every member in team selects its optimization actions according to its preference.Non-manager learns the optimization equilibrium under the direction of manager.So the problem of equilibrium selection has been solved.The IPL algorithm has been improved.The efficiency of TCCLA has been validated through experimentation.

Key words: team CGA（Computer Generated Actor）, learn, game, equilibrium, preference

中图分类号:

TP18

郑延斌，牛丽平. 基于随机对策的团队CGA学习[J]. 计算机工程与应用, 2009, 45(23): 52-54.

ZHENG Yan-bin，NIU Li-ping
. Research on team CGA learning based on stochastic game[J]. Computer Engineering and Applications, 2009, 45(23): 52-54.

[1]	桑江徽，姜海燕. 基于联合分布的多标记迁移学习[J]. 计算机工程与应用, 2021, 57(9): 154-161.
[2]	黄冬宜，杨兵，吴子豪，匡佳一，颜泽明. 用于全市蜂窝流量预测的时空全连接卷积网络[J]. 计算机工程与应用, 2021, 57(9): 168-175.
[3]	周伦钢，孙怡峰，王坤，吴疆，黄维贵，李炳龙. 目标多种多值属性的端端快速识别网络[J]. 计算机工程与应用, 2021, 57(9): 182-190.
[4]	张成，戴俊峰，熊闻心. 融合LeNet-5改进的扫描文档手写日期识别[J]. 计算机工程与应用, 2021, 57(9): 207-211.
[5]	徐承志，万方. 两级邻域采样的孪生网络在流形学习中的应用[J]. 计算机工程与应用, 2021, 57(9): 233-239.
[6]	张旭，袁旭梅，袁继革. 中介视角下供需匹配决策方法研究[J]. 计算机工程与应用, 2021, 57(9): 240-246.
[7]	吴文龙，周喜，王轶，王保全. WKAG：一种针对不平衡医保数据的欺诈检测方法[J]. 计算机工程与应用, 2021, 57(9): 247-254.
[8]	武文杰，宋文爱，高雪梅，杨吉江，王青，黄丽萍，雷毅. 基于X线的成人OSA计算机辅助诊断综述[J]. 计算机工程与应用, 2021, 57(9): 1-8.
[9]	冉蓉，徐兴华，邱少华，崔小鹏，欧阳斌. 基于深度卷积神经网络的裂纹检测方法综述[J]. 计算机工程与应用, 2021, 57(9): 23-35.
[10]	贾香恩，董一鸿，朱锋，钱江波. 异构图卷积网络研究进展[J]. 计算机工程与应用, 2021, 57(9): 36-49.
[11]	李晓筱，胡晓光，王梓强，杜卓群. 基于深度学习的实例分割研究进展[J]. 计算机工程与应用, 2021, 57(9): 60-67.
[12]	闫晓燊，高强，朱思萌，奚学程，赵万生. 亮度不均匀低质量图像中压印字符分割方法[J]. 计算机工程与应用, 2021, 57(8): 185-191.
[13]	李明山，韩清鹏，张天宇，王道累. 改进SSD的安全帽检测方法[J]. 计算机工程与应用, 2021, 57(8): 192-197.
[14]	曾春艳，严康，王志锋，余琰，纪纯妹. 深度学习模型可解释性研究综述[J]. 计算机工程与应用, 2021, 57(8): 1-9.
[15]	许德刚，王露，李凡. 深度学习的典型目标检测算法研究综述[J]. 计算机工程与应用, 2021, 57(8): 10-25.

基于随机对策的团队CGA学习

Research on team CGA learning based on stochastic game

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics