计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (17): 156-160.DOI: 10.3778/j.issn.1002-8331.1907-0044
赖俊,饶瑞
LAI Jun, RAO Rui
摘要:
针对室内无人机随机目标搜索效率不高、准确率低等问题,提出了一种基于空间位置标注的好奇心驱动的深度强化学习方法。用正六边形对探索空间进行区域划分,并标记无人机在各区域的访问次数,将其作为好奇心,产生内部奖励,以鼓励无人机不断探索新领域,有效避免其陷入到局部区域;训练时采用近端策略优化算法(PPO)优化神经网络参数,该算法能使无人机更快找到最优搜索策略,较好躲避障碍物,有效缩短训练周期,提升搜索效率和准确率。