竞争式Takagi-Sugeno模糊再励学习

被引：11

作者：

晏雄伟

邓志东

孙增圻

机构：

[1] 清华大学计算机科学与技术系智能技术与系统国家重点实验室

[2] 清华大学计算机科学与技术系智能技术与系统国家重点实验室北京

来源：

自动化学报 | 2002年 / 06期

关键词：

再励学习; 函数逼近; T-S模糊推理系统;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

140502 [人工智能];

摘要：

针对连续空间的复杂学习任务 ,提出了一种竞争式 Takagi- Sugeno模糊再励学习网络(CTSFRLN) ,该网络结构集成了 Takagi- Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法 .文中相应提出了两种学习算法 ,即竞争式 Takagi- Sugeno模糊 Q-学习算法和竞争式 Takagi- Sugeno模糊优胜学习算法 ,其把 CTSFRLN训练成为一种所谓的 Takagi- Sugeno模糊变结构控制器 .以二级倒立摆控制系统为例 ,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法 .

引用

页码：873 / 880

页数：8