计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (36): 80-82.
刘智斌1,朱晓龙2,曹宝香1
LIU Zhibin1,ZHU Xiaolong2,CAO Baoxiang1
摘要: 当前的程序设计都是人工设计执行流程,这种方法具有被动性、机械性、缺乏灵活性等缺点。提出一种基于强化学习的程序设计机制,并实现了相应的算法。根据环境情况和问题要求让计算机自主选择执行流程,通过学习使结果达到最优,同时能实现分层调用。采用这种方法,程序执行可以自主决策,较好地实现了自适应,减少了对设计者的依赖。结果显示,这种方法能取得较好的运行效率。