基于先验知识的改进强化学习及其在MAS中应用

doi:10.3778/j.issn.1002-8331.2008.24.047

计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (24): 156-158.DOI: 10.3778/j.issn.1002-8331.2008.24.047

• 数据库、信号与信息处理 • 上一篇下一篇

基于先验知识的改进强化学习及其在MAS中应用

毛俊杰,刘国栋

江南大学通信与控制工程学院，江苏无锡 214122

收稿日期:2007-10-22 修回日期:2008-01-22 出版日期:2008-08-21 发布日期:2008-08-21
通讯作者: 毛俊杰

Modified reinforcement learning based on experience konwledge and its application in MAS

MAO Jun-jie,LIU Guo-dong

School of Communications and Control Engineering，Jiangnan University，Wuxi，Jiangsu 214122，China

Received:2007-10-22 Revised:2008-01-22 Online:2008-08-21 Published:2008-08-21
Contact: MAO Jun-jie

摘要/Abstract

摘要： 针对传统的多Agent强化学习算法中，Agent学习效率低的问题，在传统强化学习算法中加入具有经验知识的函数；从心理学角度引入内部激励的概念，并将其作为强化学习的激励信号，与外部激励信号一同作用于强化学习的整个过程。最后将此算法运用到RoboCup仿真中，仿真结果表明该算法的学习效率和收敛速度明显优于传统的强化学习。

关键词: 多智能体系统, 先验知识, 内在激励, 强化学习

Abstract: In order to increase the speed of the agent learning，which is deficient in the triditional reinforcement learing in MAS.The experience konwledge is used in it，and the conception of intrinsic motivation from psychology is introduced.The intrinsic reinforcement，together with extrinsic reinforcement signal act on the whole process of the learning.At last，this algorithm is used for RoboCup simulation，the results of experiment show that the modified algorithm has faster speed to converge and better performance.

Key words: Multi-Agent System（MAS）, experience konwledge, intrinsic motivation, reinforcement learning

毛俊杰,刘国栋. 基于先验知识的改进强化学习及其在MAS中应用[J]. 计算机工程与应用, 2008, 44(24): 156-158.

MAO Jun-jie,LIU Guo-dong. Modified reinforcement learning based on experience konwledge and its application in MAS[J]. Computer Engineering and Applications, 2008, 44(24): 156-158.

[1]	张鑫，张席. 优先状态估计的双深度Q网络[J]. 计算机工程与应用, 2021, 57(8): 78-83.
[2]	王晓，唐伦，贺小雨，陈前斌. 基于深度强化学习的服务功能链多维资源优化[J]. 计算机工程与应用, 2021, 57(4): 68-76.
[3]	陈世明，林子朋，高彦丽，裴惠琴. 自适应耦合权重下的异质群体一致性研究[J]. 计算机工程与应用, 2021, 57(4): 231-235.
[4]	赖俊，魏竞毅，陈希亮. 分层强化学习综述[J]. 计算机工程与应用, 2021, 57(3): 72-79.
[5]	马志豪，朱响斌. 拟双曲动量梯度的对抗深度强化学习研究[J]. 计算机工程与应用, 2021, 57(24): 90-99.
[6]	李宝帅，叶春明. 深度强化学习算法求解作业车间调度问题[J]. 计算机工程与应用, 2021, 57(23): 248-254.
[7]	王军，曹雷，陈希亮，赖俊，章乐贵. 多智能体博弈强化学习研究综述[J]. 计算机工程与应用, 2021, 57(21): 1-13.
[8]	李振涛，冯元珍，王正新. 事件触发下多智能体系统固定时间二分一致性[J]. 计算机工程与应用, 2021, 57(21): 80-86.
[9]	成怡，郝密密. 改进深度强化学习的室内移动机器人路径规划[J]. 计算机工程与应用, 2021, 57(21): 256-262.
[10]	况立群，李思远，冯利，韩燮，徐清宇. 深度强化学习算法在智能军事决策中的应用[J]. 计算机工程与应用, 2021, 57(20): 271-278.
[11]	李浩，宁浩宇，康雁，梁文韬，霍雯. 针对文本情感转换的SMRFGAN模型[J]. 计算机工程与应用, 2021, 57(2): 170-176.
[12]	孔松涛，刘池池，史勇，谢义，王堃. 深度强化学习在智能制造中的应用展望综述[J]. 计算机工程与应用, 2021, 57(2): 49-59.
[13]	张荣霞，武长旭，孙同超，赵增顺. 深度强化学习及在路径规划中的研究进展[J]. 计算机工程与应用, 2021, 57(19): 44-56.
[14]	杨薛钰，陈建平，傅启明，陆悠，吴宏杰. 基于随机方差减小方法的DDPG算法[J]. 计算机工程与应用, 2021, 57(19): 104-111.
[15]	宋浩楠，赵刚，王兴芬. 融合知识表示和深度强化学习的知识推理方法[J]. 计算机工程与应用, 2021, 57(19): 189-197.

基于先验知识的改进强化学习及其在MAS中应用

Modified reinforcement learning based on experience konwledge and its application in MAS

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics