随机森林方法及其在客户流失预测中的应用研究

被引:20
作者
应维云
机构
[1] 上海财经大学信息管理与工程学院
关键词
流失预测; 不平衡数据; 随机森林;
D O I
10.14120/j.cnki.cn11-5057/f.2012.02.005
中图分类号
F274 [企业供销管理]; F224 [经济数学方法];
学科分类号
1201 ; 0701 ; 070104 ;
摘要
在全球化的市场竞争中,企业如何利用现有资源,提高客户满意度,保住现有客户,已成为企业面临的主要问题,客户流失预测越来越受到企业关注。本文针对实际客户流失数据中正负样本数量不平衡而且数据量大的特点,提出一种改进的平衡随机森林算法,并将其应用于某商业银行的客户流失预测。实际数据集测试结果表明,与传统的预测算法比较,这种算法集成了抽样技术和代价敏感学习的优点,适合解决大数据集和不平衡数据,具有更高的精确度。
引用
收藏
页码:140 / 145
页数:6
相关论文
共 9 条
[1]   SVM方法及其在客户流失预测中的应用研究 [J].
应维云 ;
覃正 ;
赵宇 ;
李兵 ;
李秀 .
系统工程理论与实践, 2007, (07) :105-110
[2]   数据挖掘中聚类算法的综述 [J].
胡庆林 ;
叶念渝 ;
朱明富 .
计算机与数字工程, 2007, (02) :17-20+188
[3]   基于改进支持向量机的客户流失分析研究 [J].
赵宇 ;
李兵 ;
李秀 ;
刘文煌 ;
任守榘 .
计算机集成制造系统, 2007, (01) :202-207
[4]   基于随机森林的文本分类模型研究 [J].
张华伟 ;
王明文 ;
甘丽新 .
山东大学学报(理学版), 2006, (03) :139-143
[5]   基于贝叶斯网络的客户流失分析 [J].
郭明 ;
郑惠莉 ;
卢毓伟 .
南京邮电学院学报, 2005, (05) :79-83
[6]   Bagging and boosting classification trees to predict churn [J].
Lemmens, A ;
Croux, C .
JOURNAL OF MARKETING RESEARCH, 2006, 43 (02) :276-286
[7]   Predicting customer retention and profitability by using random forests and regression forests techniques [J].
Larivière, B ;
Van den Poel, D .
EXPERT SYSTEMS WITH APPLICATIONS, 2005, 29 (02) :472-484
[8]  
Goal-oriented sequential pattern for network banking churn analysis[J] . Ding-An Chiang,Yi-Fan Wang,Shao-Lun Lee,Cheng-Jung Lin.Expert Systems With Applications . 2003 (3)
[9]   Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32