摘要: 基于神经网络的连续状态空间Q学习已应用在机器人导航领域。针对神经网络易陷入局部极小,提出了将支持向量机与Q学习相结合的移动机器人导航方法。首先以研制的CASIA-I移动机器人和它的工作环境为实验平台,确定出Q学习的回报函数;然后利用支持向量机对Q学习的状态——动作对的Q值进行在线估计,同时,为了提高估计速度,引入滚动时间窗机制;最后对所提方法进行了实验,实验结果表明所提方法能够使机器人无碰撞的到达目的地。
侯艳丽. 基于支持向量机和Q学习的移动机器人导航[J]. 计算机工程与应用, 2011, 47(23): 242-244.
HOU Yanli. Mobile robot navigation based on support vector machine and Q-learning[J]. Computer Engineering and Applications, 2011, 47(23): 242-244.