基于神经网络的Agent增强学习模型

被引：3

作者：

唐亮贵 ^{[1
]}

刘波 ^{[1
]}

唐灿 ^{[1
]}

程代杰 ^{[2
]}

机构：

[1] 重庆工商大学计算机学院

[2] 重庆大学计算机学院

来源：

计算机科学 | 2007年 / 11期

关键词：

Agent; 强化学习; 神经网络; Markov决策过程;

D O I：

暂无

中图分类号：

TP183 [人工神经网络与计算];

学科分类号：

摘要：

在深入分析Agent决策过程中状态与行为空间的迁移与构造的基础上,设计了Agent基于强化学习的最优行为选择策略和Agent强化学习的神经网络模型与算法,并对算法的收敛性进行了证明。通过对多Agent电子商务系统中Agent竞价行为的预测仿真实验,验证了基于神经网络的Agent强化学习算法具有良好的性能和行为逼近能力。

引用

页码：156 / 158+297 +297

页数：4

共 4 条

[1] 强化学习研究综述 [J].