多智能体系统中具有先验知识的Q学习算法

被引：23

作者：

杜春侠

高云

张文

机构：

[1] 中国海洋大学计算机科学系

来源：

清华大学学报(自然科学版) | 2005年 / 07期

关键词：

机器学习; Q学习; 模糊综合决策; 多智能体系统;

D O I：

10.16511/j.cnki.qhdxxb.2005.07.031

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

为了提高多智能体系统中的典型的强化学习——Q学习的学习效率和收敛速度,充分利用环境信息和相关的专家经验,提出了具有先验知识的Q学习算法。利用模糊综合决策方法处理专家经验和环境信息得到Q学习的先验知识,对Q学习的初始状态进行优化。典型的足球机器人系统中的仿真实验结果表明:该算法使学习过程建立在较好的学习基础上,从而更快地趋近于最优状态,其学习效率和收敛速度明显优于普通的Q学习。

引用

页码：981 / 984

页数：4