[1] |
韩润海, 陈浩, 刘权, 黄健. 基于对手动作预测的智能博弈对抗算法[J]. 计算机工程与应用, 2023, 59(7): 190-197. |
[2] |
黄晓辉, 凌嘉壕, 张雄, 熊李艳, 曾辉. 基于局部位置感知的多智能体网约车调度方法[J]. 计算机工程与应用, 2023, 59(7): 294-301. |
[3] |
刘剑锋, 普杰信, 孙力帆. 融合对比预测编码的深度双Q网络[J]. 计算机工程与应用, 2023, 59(6): 162-170. |
[4] |
杨笑笑, 柯琳, 陈智斌. 深度强化学习求解车辆路径问题的研究综述[J]. 计算机工程与应用, 2023, 59(5): 1-13. |
[5] |
赵英, 秦进, 袁琳琳. 结合新颖性和风险评估的内在奖励方法[J]. 计算机工程与应用, 2023, 59(5): 148-154. |
[6] |
陈海涛, 龚广伟, 张姣, 赵海涛, 熊俊, 魏急波, 詹德川. 基于NS3-gym框架的智能干扰规避系统设计与实现[J]. 计算机工程与应用, 2023, 59(4): 252-260. |
[7] |
魏婷婷, 袁唯淋, 罗俊仁, 张万鹏. 智能博弈对抗中的对手建模方法及其应用综述[J]. 计算机工程与应用, 2022, 58(9): 19-29. |
[8] |
高敬鹏, 胡欣瑜, 江志烨. 改进DDPG无人机航迹规划算法[J]. 计算机工程与应用, 2022, 58(8): 264-272. |
[9] |
司彦娜, 普杰信, 孙力帆. 近似强化学习算法研究综述[J]. 计算机工程与应用, 2022, 58(8): 33-44. |
[10] |
许杰, 祝玉坤, 邢春晓. 基于深度强化学习的金融交易算法研究[J]. 计算机工程与应用, 2022, 58(7): 276-285. |
[11] |
赵庶旭, 元琳, 张占平. 多智能体边缘计算任务卸载[J]. 计算机工程与应用, 2022, 58(6): 177-182. |
[12] |
邓心, 那俊, 张瀚铎, 王昱林, 张斌. 基于深度强化学习的智能灯个性化调节方法[J]. 计算机工程与应用, 2022, 58(6): 264-270. |
[13] |
谌钟毓, 韩燮, 谢剑斌, 熊风光, 况立群. 双损失估计下强化学习型图像匹配方法[J]. 计算机工程与应用, 2022, 58(5): 240-246. |
[14] |
徐博, 周建国, 吴静, 罗威. 可编程数据平面下基于DDPG的路由优化方法[J]. 计算机工程与应用, 2022, 58(3): 143-150. |
[15] |
谢斌红, 王恩慧, 张英俊. 结合噪声网络的强化学习远程监督关系抽取[J]. 计算机工程与应用, 2022, 58(23): 169-177. |