一种基于信念状态压缩的实时POMDP算法

被引:6
作者
仵博
吴敏
机构
[1] 中南大学信息科学与工程学院
关键词
马尔可夫; 可观察马尔可夫决策过程; 决策算法; 决策树;
D O I
10.13195/j.cd.2007.12.99.wub.006
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
针对求解部分可观察马尔可夫决策过程(POMDP)信念状态空间是NP难问题,提出一种信念状态空间压缩(BSSC)算法.将信念状态空间的高维压缩到低维,利用动态贝叶斯网络对状态转移函数、观察函数和报酬函数进行压缩,降低求解规模,达到实时决策的目的.对比实验表明,所提出的算法可以快速求解最优策略和最优值函数.
引用
收藏
页码:1417 / 1420
页数:4
相关论文
共 1 条
[1]  
Planning and acting in partially observable stochastic domains[J] . Leslie Pack Kaelbling,Michael L. Littman,Anthony R. Cassandra.Artificial Intelligence . 1998 (1)