共 10 条
[9]
Technical Note: Q-Learning.[J].Christopher J.C.H. Watkins;Peter Dayan.Machine Learning.1992, 3
[10]
马尔可夫决策过程引论.[M].胡奇英;刘建庸著;.西安电子科技大学出版社.2000,