[1] |
宁强, 刘元盛, 谢龙洋. 基于SAC的自动驾驶车辆控制方法应用[J]. 计算机工程与应用, 2023, 59(8): 306-314. |
[2] |
黄晓辉, 凌嘉壕, 张雄, 熊李艳, 曾辉. 基于局部位置感知的多智能体网约车调度方法[J]. 计算机工程与应用, 2023, 59(7): 294-301. |
[3] |
杨笑笑, 柯琳, 陈智斌. 深度强化学习求解车辆路径问题的研究综述[J]. 计算机工程与应用, 2023, 59(5): 1-13. |
[4] |
魏婷婷, 袁唯淋, 罗俊仁, 张万鹏. 智能博弈对抗中的对手建模方法及其应用综述[J]. 计算机工程与应用, 2022, 58(9): 19-29. |
[5] |
高敬鹏, 胡欣瑜, 江志烨. 改进DDPG无人机航迹规划算法[J]. 计算机工程与应用, 2022, 58(8): 264-272. |
[6] |
赵庶旭, 元琳, 张占平. 多智能体边缘计算任务卸载[J]. 计算机工程与应用, 2022, 58(6): 177-182. |
[7] |
邓心, 那俊, 张瀚铎, 王昱林, 张斌. 基于深度强化学习的智能灯个性化调节方法[J]. 计算机工程与应用, 2022, 58(6): 264-270. |
[8] |
徐博, 周建国, 吴静, 罗威. 可编程数据平面下基于DDPG的路由优化方法[J]. 计算机工程与应用, 2022, 58(3): 143-150. |
[9] |
温建伟, 姚冰冰, 万剑雄, 李雷孝. 结合深度强化学习的区块链分片系统性能优化[J]. 计算机工程与应用, 2022, 58(19): 116-123. |
[10] |
靳栋银, 李跃, 邵振洲, 施智平, 关永. 面向机械臂轨迹规划的强化学习奖励函数设计[J]. 计算机工程与应用, 2022, 58(19): 302-308. |
[11] |
吴亚丽, 王君虎, 郑帅龙. 基于改进双重深度Q网络的入侵检测模型[J]. 计算机工程与应用, 2022, 58(16): 102-110. |
[12] |
宋浩楠, 赵刚, 孙若莹. 基于深度强化学习的知识推理研究进展综述[J]. 计算机工程与应用, 2022, 58(1): 12-25. |
[13] |
牛鹏飞, 王晓峰, 芦磊, 张九龙. 强化学习在车辆路径问题中的研究综述[J]. 计算机工程与应用, 2022, 58(1): 41-55. |
[14] |
马志豪,朱响斌. 拟双曲动量梯度的对抗深度强化学习研究[J]. 计算机工程与应用, 2021, 57(24): 90-99. |
[15] |
李宝帅,叶春明. 深度强化学习算法求解作业车间调度问题[J]. 计算机工程与应用, 2021, 57(23): 248-254. |