学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
多智能体系统中具有先验知识的Q学习算法
被引:23
作者
:
杜春侠
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
杜春侠
论文数:
引用数:
h-index:
机构:
高云
张文
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
张文
机构
:
[1]
中国海洋大学计算机科学系
来源
:
清华大学学报(自然科学版)
|
2005年
/ 07期
关键词
:
机器学习;
Q学习;
模糊综合决策;
多智能体系统;
D O I
:
10.16511/j.cnki.qhdxxb.2005.07.031
中图分类号
:
TP18 [人工智能理论];
学科分类号
:
081104 ;
0812 ;
0835 ;
1405 ;
摘要
:
为了提高多智能体系统中的典型的强化学习——Q学习的学习效率和收敛速度,充分利用环境信息和相关的专家经验,提出了具有先验知识的Q学习算法。利用模糊综合决策方法处理专家经验和环境信息得到Q学习的先验知识,对Q学习的初始状态进行优化。典型的足球机器人系统中的仿真实验结果表明:该算法使学习过程建立在较好的学习基础上,从而更快地趋近于最优状态,其学习效率和收敛速度明显优于普通的Q学习。
引用
收藏
页码:981 / 984
页数:4
相关论文
未找到相关数据
未找到相关数据