大数据驱动的投诉预测模型

被引:9
作者
周文杰 [1 ]
杨璐 [1 ,2 ]
严建峰 [1 ,2 ]
机构
[1] 苏州大学计算机科学与技术学院
[2] 香港城市大学创意媒体学院
关键词
大数据; 投诉预测模型; 特征工程; 二阶特征; 图特征; 随机森林;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着电信行业市场竞争的不断加剧,用户对服务质量要求逐步提高,导致用户投诉率不断攀升。在此情况下,通过准确预测用户投诉行为来降低用户投诉率成为运营商关注的重点。目前传统的投诉预测模型仅从分类算法和人工调研特征来讨论,而没有充分利用运营商的大数据。因此,提出了在Hadoop/Spark大数据平台上使用并行随机森林来构建用户预测投诉模型,它不仅用到了业务支持系统数据,而且还用到了运营支持系统数据和客服工单数据,并在此基础上进一步增加了反映用户相互关系的图特征和二阶特征。基于上海市某运营商数据的实验结果表明,利用多来源、高维度的特征来训练用户投诉预测模型的精度会明显高于传统方法,在此基础上有针对性地对目标用户采取安抚措施,可以降低用户投诉率,获得较高的商业价值。
引用
收藏
页码:217 / 223
页数:7
相关论文
共 12 条
[1]  
基于数据挖掘的移动用户投诉行为研究.[D].龙雯雯.重庆理工大学.2014, 05
[2]  
基于投诉历史数据的分析和预测系统设计.[D].褚卫艳.北京邮电大学.2013, 11
[3]  
基于HADOOP的数据挖掘研究.[D].杨宸铸.重庆大学.2010, 07
[4]   KEY PERFORMANCE INDICATORS [J].
Chambers, David W. .
JOURNAL OF THE AMERICAN DENTAL ASSOCIATION, 2013, 144 (03) :242-+
[5]   Confidence limits for the indirect effect: Distribution of the product and resampling methods [J].
MacKinnon, DP ;
Lockwood, CM ;
Williams, J .
MULTIVARIATE BEHAVIORAL RESEARCH, 2004, 39 (01) :99-128
[6]  
A Formula for the Gini Coefficient.[J]..The Review of Economics and Statistics.1979, 1
[7]  
Induction of decision trees.[J].J. R. Quinlan.Machine Learning.1986, 1
[8]   Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32
[9]   深度学习研究进展 [J].
郭丽丽 ;
丁世飞 .
计算机科学, 2015, 42 (05) :28-33
[10]   基于信令的GPRS潜在投诉客户预测模型 [J].
赵业祯 ;
黄晓弟 .
电信快报, 2014, (08) :29-32