基于强化学习和半马氏过程的供应链优化

计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (4): 240-242.

基于强化学习和半马氏过程的供应链优化

杨鹏赵辉呼生刚

南开大学信息学院空军工程大学工程学院

收稿日期:2006-03-07 修回日期:1900-01-01 出版日期:2007-02-01 发布日期:2007-02-01
通讯作者: 杨鹏

Applying Reinforcement Learning and Semi-Markov Decision Process to Optimize Supply Chain Performance

Received:2006-03-07 Revised:1900-01-01 Online:2007-02-01 Published:2007-02-01

摘要/Abstract

摘要： 在网络化制造环境下，供应链在地理分布上的分散性、市场需求的随机性都使得供应链的管理越来越复杂。本文应用强化学习和半马氏过程理论针对跨地区且存在地区生产成本差异的供应链管理问题进行了建模，分析了在随机需求的情况下，供应链的库存决策问题。应用实例说明本文方法的可行性和有效性。

关键词: 供应链管理, 库存控制, 强化学习, 半马氏过程

Abstract: In the networked manufacturing environment, the geographical dispersal of supply chains, and the stochastic demands of the markets increase the complexity of the system. In this paper, reinforcement learning and semi-Markov process were applied to inventory control of supply chain management ranged among regions with different production costs. The inventory decision under stochastic demands was analyzed. The simulation result showed that the proposed method is promising.

Key words: supply chain management, inventory control, reinforcement learning, semi-Markov process

杨鹏赵辉呼生刚. 基于强化学习和半马氏过程的供应链优化[J]. 计算机工程与应用, 2007, 43(4): 240-242.

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	29

	来源	本网站

	次数	29
	比例	100%

摘要

最新录用	在线预览	正式出版

0	0	75

	来源	本网站

	次数	75
	比例	100%

[1]	魏婷婷, 袁唯淋, 罗俊仁, 张万鹏. 智能博弈对抗中的对手建模方法及其应用综述[J]. 计算机工程与应用, 2022, 58(9): 19-29.
[2]	司彦娜, 普杰信, 孙力帆. 近似强化学习算法研究综述[J]. 计算机工程与应用, 2022, 58(8): 33-44.
[3]	高敬鹏, 胡欣瑜, 江志烨. 改进DDPG无人机航迹规划算法[J]. 计算机工程与应用, 2022, 58(8): 264-272.
[4]	许杰, 祝玉坤, 邢春晓. 基于深度强化学习的金融交易算法研究[J]. 计算机工程与应用, 2022, 58(7): 276-285.
[5]	赵庶旭, 元琳, 张占平. 多智能体边缘计算任务卸载[J]. 计算机工程与应用, 2022, 58(6): 177-182.
[6]	邓心, 那俊, 张瀚铎, 王昱林, 张斌. 基于深度强化学习的智能灯个性化调节方法[J]. 计算机工程与应用, 2022, 58(6): 264-270.
[7]	谌钟毓, 韩燮, 谢剑斌, 熊风光, 况立群. 双损失估计下强化学习型图像匹配方法[J]. 计算机工程与应用, 2022, 58(5): 240-246.
[8]	徐博, 周建国, 吴静, 罗威. 可编程数据平面下基于DDPG的路由优化方法[J]. 计算机工程与应用, 2022, 58(3): 143-150.
[9]	王军, 曹雷, 陈希亮, 陈英, 赵芷若. 纯策略纳什均衡的博弈强化学习[J]. 计算机工程与应用, 2022, 58(15): 78-86.
[10]	吕冬健, 王春立. 可变尺寸循环注意力模型及应用研究[J]. 计算机工程与应用, 2022, 58(12): 243-248.
[11]	王祎, 葛静怡, 薛昕惟, 王胜法, 李凤岐. 改进Q学习的薄壁结构3D打印路径规划[J]. 计算机工程与应用, 2022, 58(12): 299-303.
[12]	宋浩楠, 赵刚, 孙若莹. 基于深度强化学习的知识推理研究进展综述[J]. 计算机工程与应用, 2022, 58(1): 12-25.
[13]	牛鹏飞, 王晓峰, 芦磊, 张九龙. 强化学习在车辆路径问题中的研究综述[J]. 计算机工程与应用, 2022, 58(1): 41-55.
[14]	张鑫，张席. 优先状态估计的双深度Q网络[J]. 计算机工程与应用, 2021, 57(8): 78-83.
[15]	王晓，唐伦，贺小雨，陈前斌. 基于深度强化学习的服务功能链多维资源优化[J]. 计算机工程与应用, 2021, 57(4): 68-76.