共 1 条
基于增强学习的代理谈判模型
被引:7
作者:
张化祥
黄上腾
机构:
[1] 上海交通大学计算机科学与工程系
[2] 上海交通大学计算机科学与工程系 上海
[3] 上海
来源:
关键词:
代理;
增强学习;
报价;
时间信念;
价格信念;
D O I:
暂无
中图分类号:
TP181 [自动推理、机器学习];
学科分类号:
081104 ;
0812 ;
0835 ;
1405 ;
摘要:
利用增强学习的Q-learning理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值。代理可以通过修改信念函数及时间贴现率来调整报价。该文实现了谈判模型的报价算法,并从理论和实验数据两方面进行了分析比较。
引用
收藏
页码:137 / 139
页数:3
相关论文