基于神经网络的Agent增强学习模型

被引:3
作者
唐亮贵 [1 ]
刘波 [1 ]
唐灿 [1 ]
程代杰 [2 ]
机构
[1] 重庆工商大学计算机学院
[2] 重庆大学计算机学院
关键词
Agent; 强化学习; 神经网络; Markov决策过程;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算];
学科分类号
摘要
在深入分析Agent决策过程中状态与行为空间的迁移与构造的基础上,设计了Agent基于强化学习的最优行为选择策略和Agent强化学习的神经网络模型与算法,并对算法的收敛性进行了证明。通过对多Agent电子商务系统中Agent竞价行为的预测仿真实验,验证了基于神经网络的Agent强化学习算法具有良好的性能和行为逼近能力。
引用
收藏
页码:156 / 158+297 +297
页数:4
相关论文
共 4 条
[1]   强化学习研究综述 [J].
高阳 ;
陈世福 ;
陆鑫 .
自动化学报, 2004, (01) :86-100
[2]   多智能体系统中的分布式强化学习研究现状 [J].
仲宇 ;
顾国昌 ;
张汝波 .
控制理论与应用, 2003, (03) :317-322
[3]   Convergence Results for Single-Step On-Policy Reinforcement-Learning Algorithms [J].
Satinder Singh ;
Tommi Jaakkola ;
Michael L. Littman ;
Csaba Szepesvári .
Machine Learning, 2000, 38 :287-308
[4]  
Christopher J.C.H. Watkins,Peter Dayan.Technical Note Q-Learning[J].Machine Learning,1992