基于增强学习的代理谈判模型

被引:7
作者
张化祥
黄上腾
机构
[1] 上海交通大学计算机科学与工程系
[2] 上海交通大学计算机科学与工程系 上海
[3] 上海
关键词
代理; 增强学习; 报价; 时间信念; 价格信念;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
利用增强学习的Q-learning理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值。代理可以通过修改信念函数及时间贴现率来调整报价。该文实现了谈判模型的报价算法,并从理论和实验数据两方面进行了分析比较。
引用
收藏
页码:137 / 139
页数:3
相关论文
共 1 条
[1]   Pricing in agent economies using multi-agent Q-learning [J].
Tesauro, G ;
Kephart, JO .
AUTONOMOUS AGENTS AND MULTI-AGENT SYSTEMS, 2002, 5 (03) :289-304