基于实例的POMDP问题的近似求解

doi:10.3778/j.issn.1002-8331.2008.29.022

计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (29): 82-85.DOI: 10.3778/j.issn.1002-8331.2008.29.022

基于实例的POMDP问题的近似求解

修国明,张积滨,潘启树

哈尔滨工业大学计算机科学与技术学院，哈尔滨 150001

收稿日期:2007-11-06 修回日期:2008-02-26 出版日期:2008-10-11 发布日期:2008-10-11
通讯作者: 修国明

Instance based approximate solution to POMDP problem

XIU Guo-ming,ZHANG Ji-bin,PAN Qi-shu

School of Computer Science and Technology，Harbin Institute of Technology，Harbin 150001，China

Received:2007-11-06 Revised:2008-02-26 Online:2008-10-11 Published:2008-10-11
Contact: XIU Guo-ming

摘要/Abstract

摘要： 结合启发式求解和增强学习技术，深入研究了基于实例的POMDP问题的近似求解算法，包括基于最近邻算法法的NNI及它的参数化增强版本ENNI和基于局部加权回归算法的LWI，并通过实验对比，给出了相应算法在实际应用中的性能。实验证明，基于实例的方法来求解POMDP问题，能够获得性能较好的次优解。

关键词: 基于实例的方法, 部分可观察马尔可夫决策过程（POMDP）, 启发式求解, 增强学习, 最近邻, 局部加权回归

Abstract: In this paper，with the idea of combining heuristic solution and reinforcement learning technique，the instance based approximate solution to POMDP problem is studied and Nearest Neighbor based algorithm NNI and its extended parameterized version ENNI and Local Weighted Regression based algorithm LWI are presented.With the performance analyzed and compared through experiments on common workbench，solving POMDP problems using instance based methods can produce good sub-optimal solutions.

Key words: instance based method, Partially Observable Markov Decision Process（POMDP）, heuristic solution, reinforcement learning, nearest neighbor, local weighted regression

修国明,张积滨,潘启树. 基于实例的POMDP问题的近似求解[J]. 计算机工程与应用, 2008, 44(29): 82-85.

XIU Guo-ming,ZHANG Ji-bin,PAN Qi-shu. Instance based approximate solution to POMDP problem[J]. Computer Engineering and Applications, 2008, 44(29): 82-85.

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	76

来源	本网站	其他网站

次数	56	20
比例	74%	26%

摘要

151

最新录用	在线预览	正式出版

0	0	151

	来源	本网站

	次数	151
	比例	100%

[1]	雷恒林，古兰拜尔·吐尔洪，买日旦·吾守尔，张东梅. 新奇检测综述[J]. 计算机工程与应用, 2021, 57(5): 47-55.
[2]	孟东霞，李玉鑑. 利用自然最近邻的不平衡数据过采样方法[J]. 计算机工程与应用, 2021, 57(2): 91-96.
[3]	王永，赵旭辉，李晓光，肖玲. 一种面向协同过滤的快速最近邻居搜索方法[J]. 计算机工程与应用, 2021, 57(17): 96-105.
[4]	李文杰，闫世强，蒋莹，张松芝，王成良. 自适应确定DBSCAN算法参数的算法研究[J]. 计算机工程与应用, 2019, 55(5): 1-7.
[5]	龚彦鹭，吕佳. 结合半监督聚类和加权KNN的协同训练方法[J]. 计算机工程与应用, 2019, 55(22): 114-118.
[6]	季挺，张华. 基于CMAC的非参数化近似策略迭代增强学习[J]. 计算机工程与应用, 2019, 55(2): 128-136.
[7]	季长清1，2，肖鹏3，刘畅4，汪祖民2，西方2，邵寅博1，李泽宇2. 基于空间近邻查询的移动医疗呼叫算法[J]. 计算机工程与应用, 2019, 55(2): 206-212.
[8]	朱艳辉1，2，李飞1，2，胡骏飞1，2，钱继胜3，王天吉1，2. 基于三支决策的两阶段实体关系抽取研究[J]. 计算机工程与应用, 2018, 54(9): 145-150.
[9]	王颖，王欣，唐万梅. 融合用户自然最近邻的协同过滤推荐算法[J]. 计算机工程与应用, 2018, 54(7): 77-83.
[10]	邓廷权，刘金艳，王宁. 高维数据离群点检测的局部线性嵌入方法[J]. 计算机工程与应用, 2018, 54(6): 115-122.
[11]	陈建峡1，朱季骐1，张月1，张晓星2，吕俊涛3，白德盟3. 基于Spark的输变电线路实时故障监测研究[J]. 计算机工程与应用, 2018, 54(5): 265-270.
[12]	龚敏1，邓珍荣2，黄文明2. 基于用户聚类与Slope One填充的协同推荐算法[J]. 计算机工程与应用, 2018, 54(22): 139-143.
[13]	陈辉1，关凯胜1，李嘉兴1，2. 基于对象数量的宽度加权聚类kNN算法[J]. 计算机工程与应用, 2018, 54(19): 1-9.
[14]	杨恢先，刘凡，贺迪龙. 拉普拉斯滤波结合CS-LBP的单样本人脸识别[J]. 计算机工程与应用, 2017, 53(7): 165-170.
[15]	姜文，刘立康. 基于联合两种特征的手写体维文字符识别[J]. 计算机工程与应用, 2017, 53(5): 192-196.

基于实例的POMDP问题的近似求解

Instance based approximate solution to POMDP problem

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐 0

Metrics