基于增强学习的代理谈判模型

被引：7

作者：

张化祥

黄上腾

机构：

[1] 上海交通大学计算机科学与工程系

[2] 上海交通大学计算机科学与工程系上海

[3] 上海

来源：

计算机工程 | 2004年 / 10期

关键词：

代理; 增强学习; 报价; 时间信念; 价格信念;

D O I：

暂无

中图分类号：

TP181 [自动推理、机器学习];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

利用增强学习的Q-learning理论，构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动，实现状态的迁移，可以计算出代理在不同状态采取行动的Q值。代理可以通过修改信念函数及时间贴现率来调整报价。该文实现了谈判模型的报价算法，并从理论和实验数据两方面进行了分析比较。

引用

页码：137 / 139

页数：3