基于经验知识的Q-学习算法

被引:5
作者
宋清昆
胡子婴
机构
[1] 哈尔滨理工大学自动化学院
关键词
强化学习; Q-学习算法; 智能体; 经验知识;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为了提高智能体系统中的典型的强化学习——Q-学习的学习速度和收敛速度,使学习过程充分利用环境信息,本文提出了一种基于经验知识的Q-学习算法。该算法利用具有经验知识信息的函数,使智能体在进行无模型学习的同时学习系统模型,避免对环境模型的重复学习,从而加速智能体的学习速度。仿真实验结果表明:该算法使学习过程建立在较好的学习基础上,从而更快地趋近于最优状态,其学习效率和收敛速度明显优于标准的Q-学习。
引用
收藏
页码:10 / 12
页数:3
相关论文
共 4 条
[1]   多智能体系统混合智能学习算法研究 [J].
张淑军 ;
孟庆春 ;
宋长虹 ;
张艳 ;
张文 .
哈尔滨工业大学学报, 2003, (09) :1083-1085
[2]   基于强化学习的多Agent系统 [J].
唐文彬 ;
朱淼良 .
计算机科学, 2003, (04) :16-18
[3]   提高强化学习速度的方法研究 [J].
张汝波 .
计算机工程与应用, 2001, (22) :38-40
[4]  
机器学习[M]. 机械工业出版社 , (美)TomM.Mitchell著, 2003