学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于经验知识的Q-学习算法
被引:5
作者
:
论文数:
引用数:
h-index:
机构:
宋清昆
胡子婴
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨理工大学自动化学院
胡子婴
机构
:
[1]
哈尔滨理工大学自动化学院
来源
:
自动化技术与应用
|
2006年
/ 11期
关键词
:
强化学习;
Q-学习算法;
智能体;
经验知识;
D O I
:
暂无
中图分类号
:
TP181 [自动推理、机器学习];
学科分类号
:
081104 ;
0812 ;
0835 ;
1405 ;
摘要
:
为了提高智能体系统中的典型的强化学习——Q-学习的学习速度和收敛速度,使学习过程充分利用环境信息,本文提出了一种基于经验知识的Q-学习算法。该算法利用具有经验知识信息的函数,使智能体在进行无模型学习的同时学习系统模型,避免对环境模型的重复学习,从而加速智能体的学习速度。仿真实验结果表明:该算法使学习过程建立在较好的学习基础上,从而更快地趋近于最优状态,其学习效率和收敛速度明显优于标准的Q-学习。
引用
收藏
页码:10 / 12
页数:3
相关论文
共 4 条
[1]
多智能体系统混合智能学习算法研究
[J].
张淑军
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
张淑军
;
孟庆春
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
孟庆春
;
宋长虹
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
宋长虹
;
张艳
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
张艳
;
张文
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
张文
.
哈尔滨工业大学学报,
2003,
(09)
:1083
-1085
[2]
基于强化学习的多Agent系统
[J].
唐文彬
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学人工智能研究所
唐文彬
;
朱淼良
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学人工智能研究所
朱淼良
.
计算机科学,
2003,
(04)
:16
-18
[3]
提高强化学习速度的方法研究
[J].
论文数:
引用数:
h-index:
机构:
张汝波
.
计算机工程与应用,
2001,
(22)
:38
-40
[4]
机器学习[M]. 机械工业出版社 , (美)TomM.Mitchell著, 2003
←
1
→
共 4 条
[1]
多智能体系统混合智能学习算法研究
[J].
张淑军
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
张淑军
;
孟庆春
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
孟庆春
;
宋长虹
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
宋长虹
;
张艳
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
张艳
;
张文
论文数:
0
引用数:
0
h-index:
0
机构:
中国海洋大学计算机科学系
张文
.
哈尔滨工业大学学报,
2003,
(09)
:1083
-1085
[2]
基于强化学习的多Agent系统
[J].
唐文彬
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学人工智能研究所
唐文彬
;
朱淼良
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学人工智能研究所
朱淼良
.
计算机科学,
2003,
(04)
:16
-18
[3]
提高强化学习速度的方法研究
[J].
论文数:
引用数:
h-index:
机构:
张汝波
.
计算机工程与应用,
2001,
(22)
:38
-40
[4]
机器学习[M]. 机械工业出版社 , (美)TomM.Mitchell著, 2003
←
1
→