并行强化学习算法及其应用研究

被引:6
作者
孟伟 [1 ]
韩学东 [2 ]
机构
[1] 北京林业大学信息学院
[2] 中国航天科工集团所
关键词
并行算法; 强化学习; Q-学习; D-S证据理论; 路径规划;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
强化学习是一种重要的机器学习方法,然而在实际应用中,收敛速度缓慢是其主要不足之一。为了提高强化学习的效率,提出了一种并行强化学习算法。多个同时学习,在各自学习一定周期后,利用D-S证据利用对学习结果进行融合,然后在融合结果的基础上,各进行下一周期的学习,从而实现提高整个系统学习效率的目的。实验结果表明了该方法的可行性和有效性。
引用
收藏
页码:25 / 28+52 +52
页数:5
相关论文
共 10 条
[1]   基于先验知识的改进强化学习及其在MAS中应用 [J].
毛俊杰 ;
刘国栋 .
计算机工程与应用, 2008, (24) :156-158
[2]   一种快速强化学习方法研究 [J].
童亮 ;
陆际联 ;
龚建伟 .
北京理工大学学报, 2005, (04) :328-331
[3]   多智能体系统中的分布式强化学习研究现状 [J].
仲宇 ;
顾国昌 ;
张汝波 .
控制理论与应用, 2003, (03) :317-322
[4]   基于动作选择级的多机器人协作(英文) [J].
褚海涛 ;
洪炳熔 .
软件学报, 2002, (09) :1773-1778
[5]   提高强化学习速度的方法研究 [J].
张汝波 .
计算机工程与应用, 2001, (22) :38-40
[6]  
并行算法的设计与分析[M]. 高等教育出版社 , 陈国良编著, 2002
[7]  
强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001
[8]  
多传感器信息融合及应用[M]. 电子工业出版社 , 何友等著, 2000
[9]  
Q -learning[J] . Christopher J. C. H. Watkins,Peter Dayan.Machine Learning . 1992 (3)
[10]  
Associative search network: A reinforcement learning associative memory[J] . Andrew G. Barto,Richard S. Sutton,Peter S. Brouwer.Biological Cybernetics . 1979 (3)