基于经验知识的Q-学习算法

被引：5

作者：

宋清昆

胡子婴

机构：

[1] 哈尔滨理工大学自动化学院

来源：

自动化技术与应用 | 2006年 / 11期

关键词：

强化学习; Q-学习算法; 智能体; 经验知识;

D O I：

暂无

中图分类号：

TP181 [自动推理、机器学习];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

为了提高智能体系统中的典型的强化学习——Q-学习的学习速度和收敛速度,使学习过程充分利用环境信息,本文提出了一种基于经验知识的Q-学习算法。该算法利用具有经验知识信息的函数,使智能体在进行无模型学习的同时学习系统模型,避免对环境模型的重复学习,从而加速智能体的学习速度。仿真实验结果表明:该算法使学习过程建立在较好的学习基础上,从而更快地趋近于最优状态,其学习效率和收敛速度明显优于标准的Q-学习。

引用

页码：10 / 12

页数：3