基于强化学习的推荐研究综述

被引：61

作者：

余力 ^{[1
]}

杜启翰 ^{[1
]}

岳博妍 ^{[1
]}

向君瑶 ^{[1
]}

徐冠宇 ^{[2
]}

冷友方 ^{[1
]}

机构：

[1] 中国人民大学信息学院

[2] 北京理工大学徐特立学院

来源：

计算机科学 | 2021年 / 48卷 / 10期

关键词：

推荐系统; 强化学习; 深度强化学习; 马尔可夫决策过程; 多臂老虎机;

D O I：

暂无

中图分类号：

TP18 [人工智能理论]; TP391.3 [检索机];

学科分类号：

080201 [机械制造及其自动化]; 140502 [人工智能];

摘要：

推荐系统致力于从海量数据中为用户寻找并自动推荐有价值的信息和服务,可有效解决信息过载问题,成为大数据时代一种重要的信息技术。但推荐系统的数据稀疏性、冷启动和可解释性等问题,仍是制约推荐系统广泛应用的关键技术难点。强化学习是一种交互学习技术,该方法通过与用户交互并获得反馈来实时捕捉其兴趣漂移,从而动态地建模用户偏好,可以较好地解决传统推荐系统面临的经典关键问题。强化学习已成为近年来推荐系统领域的研究热点。文中从综述的角度,首先在简要回顾推荐系统和强化学习的基础上,分析了强化学习对推荐系统的提升思路,对近年来基于强化学习的推荐研究进行了梳理与总结,并分别对传统强化学习推荐和深度强化学习推荐的研究情况进行总结;在此基础上,重点总结了近年来强化学习推荐研究的若干前沿,以及其应用研究情况。最后,对强化学习在推荐系统中应用的未来发展趋势进行分析与展望。

引用

页码：1 / 18

页数：18

共 16 条

[1]

Top-aware reinforcement learning based recommendation.[J].Feng Liu;Ruiming Tang;Huifeng Guo;Xutao Li;Yunming Ye;Xiuqiang He.Neurocomputing.2020,

[2]

Reinforcement Learning Based on Contextual Bandits for Personalized Online Learning Recommendation Systems [J].

Intayoad, Wacharawan ;

Kamyod, Chayapol ;

Temdee, Punnarumol .

WIRELESS PERSONAL COMMUNICATIONS, 2020, 115 (04) :2917-2932

[3]

Virtual-Taobao: Virtualizing Real-World Online Retail Environment for Reinforcement Learning.[J].Jing Cheng Shi;Yang Yu;Qing Da;Shi Yong Chen;An Xiang Zeng.Proceedings of the AAAI Conference on Artificial Intelligence.2019,

[4]

A review on deep learning for recommender systems: challenges and remedies [J].

Batmaz, Zeynep ;

Yurekli, Ali ;

Bilge, Alper ;

Kaleli, Cihan .

ARTIFICIAL INTELLIGENCE REVIEW, 2019, 52 (01) :1-37

[5]

Deep Learning Based Recommender System.[J].Shuai Zhang;Lina Yao;Aixin Sun;Yi Tay.ACM Computing Surveys (CSUR).2019, 1

[6]

Partially Observable Markov Decision Process for Recommender Systems..[J].Zhongqi Lu;Qiang Yang 0001.CoRR.2016,

[7]

Human-level control through deep reinforcement learning [J].

Mnih, Volodymyr ;

Kavukcuoglu, Koray ;

Silver, David ;

Rusu, Andrei A. ;

Veness, Joel ;

Bellemare, Marc G. ;

Graves, Alex ;

Riedmiller, Martin ;

Fidjeland, Andreas K. ;

Ostrovski, Georg ;

Petersen, Stig ;

Beattie, Charles ;

Sadik, Amir ;

Antonoglou, Ioannis ;

King, Helen ;

Kumaran, Dharshan ;

Wierstra, Daan ;

Legg, Shane ;

Hassabis, Demis .

NATURE, 2015, 518 (7540) :529-533

[8]

Recommender systems survey.[J].J. Bobadilla;F. Ortega;A. Hernando;A. Gutiérrez.Knowledge-Based Systems.2013,

[9]

Reinforcement Learning Strategies for Clinical Trials in Nonsmall Cell Lung Cancer [J].

Zhao, Yufan ;

Zeng, Donglin ;

Socinski, Mark A. ;

Kosorok, Michael R. .

BIOMETRICS, 2011, 67 (04) :1422-1433

[10]

An MDP-Based Recommender System..[J].Guy Shani;David Heckerman;Ronen I. Brafman.Journal of Machine Learning Research.2005,

← 1 2 →