共 10 条
[8]
强化学习理论及应用[M]. 哈尔滨工程大学出版社 , 张汝波编著, 2001
[9]
马尔可夫决策过程引论[M]. 西安电子科技大学出版社 , 胡奇英, 2000