基于剪枝随机森林的电信行业客户流失预测

被引:30
作者
邱一卉
机构
[1] 厦门理工学院管理学院
关键词
客户流失预测; 随机森林; 组合分类器; 剪枝技术;
D O I
暂无
中图分类号
F626 [电信企业组织和经营管理]; TP18 [人工智能理论];
学科分类号
020218 [数字经济学]; 140502 [人工智能];
摘要
针对电信行业客户流失预测问题的复杂性,本文将能够处理大规模数据、容噪性能较好的组合分类器算法——随机森林方法应用于电信行业的客户流失预测中.针对影响组合分类器性能的关键指标——差异度,提出了一种新的基于随机森林相似度矩阵的差异度测度,并在此基础上提出了一种改进的组合剪枝技术,对随机森林的基分类器进行剪枝,得到规模较小但泛化性能更优的基于剪枝随机森林的客户流失预测模型.实验结果表明,与其他方法相比,新的差异度测度方法更好地描述单个分类器之间的差异度,本文提出的基于剪枝随机森林的客户流失预测模型具有更高的预测准确率、更小的组合分类器规模和更好的效率,有望成为该领域一种可行且有效的方案.
引用
收藏
页码:817 / 823
页数:7
相关论文
共 9 条
[1]
基于多分类器动态选择与成本敏感优化集成的电信客户流失预测研究 [J].
罗彬 ;
邵培基 ;
夏国恩 .
管理学报, 2012, 9 (09) :1373-1381
[2]
基于粗糙集理论-神经网络-蜂群算法集成的客户流失研究 [J].
罗彬 ;
邵培基 ;
罗尽尧 ;
刘独玉 ;
夏国恩 .
管理学报, 2011, 8 (02) :265-272
[3]
基于SODM的贝叶斯分类器结构学习及其在客户分类中的应用 [J].
肖进 ;
贺昌政 .
管理科学, 2008, (04) :54-60
[4]
SVM方法及其在客户流失预测中的应用研究 [J].
应维云 ;
覃正 ;
赵宇 ;
李兵 ;
李秀 .
系统工程理论与实践, 2007, (07) :105-110
[5]
Determinants of subscriber churn and customer loyalty in the Korean mobile telephony market.[J].Hee-Su Kim;Choong-Han Yoon.Telecommunications Policy.2004, 9
[6]
Clustering ensembles of neural network models [J].
Bakker, B ;
Heskes, T .
NEURAL NETWORKS, 2003, 16 (02) :261-269
[7]
Cost Complexity-Based Pruning of Ensemble Classifiers..[J].Andreas L. Prodromidis;Salvatore J. Stolfo.Knowl. Inf. Syst..2001, 4
[8]
Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32
[9]
When customers are members: Customer retention in paid membership contexts [J].
Bhattacharya, CB .
JOURNAL OF THE ACADEMY OF MARKETING SCIENCE, 1998, 26 (01) :31-44