一种用户成长性画像的建模方法

被引:8
作者
董哲瑾
王健
钱凌飞
林鸿飞
机构
[1] 大连理工大学计算机科学与技术学院
基金
国家重点研发计划;
关键词
用户成长值; 用户画像; 特征提取; 半监督回归; 模型融合;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
用户成长值反映用户粘性,预测用户成长值有助于实现精准营销。聚焦用户成长性画像研究,针对用户原始数据记录复杂多样、难以提取有效特征的问题,通过散点图分析挖掘影响用户成长值的因素,提取行为特征和相对稳定的时间特征,并对比基于树的特征筛选算法和L1范数进行特征筛选。针对已标注成长值的用户数据不足问题,改进COREG算法,通过半监督学习模型丰富训练数据,提高模型的预测准确度,同时降低原算法的时间复杂度,最后采用模型融合整合不同模型的优势。在CSDN博客平台提供的SMP CUP 2017数据集上进行实验,结果表明,建立的模型有效地提高了泛化能力和预测准确度。
引用
收藏
页码:38 / 45
页数:8
相关论文
共 11 条
[1]  
StackTIS: A stacked generalization approach for effective prediction of translation initiation sites[J] . George Tzanis,Christos Berberidis,Ioannis Vlahavas. &nbspComputers in Biology and Medicine . 2011 (1)
[2]   半监督学习方法 [J].
刘建伟 ;
刘媛 ;
罗雄麟 .
计算机学报, 2015, 38 (08) :1592-1617
[3]   网络用户粘性行为测评研究 [J].
赵青 ;
薛君 .
统计与信息论坛, 2014, 29 (10) :72-78
[4]   基于SVM的新浪热门微博预测 [J].
陈梦秋 ;
周安民 .
现代计算机(专业版), 2017, (09) :23-27
[5]   基于理性行为理论的微博用户转发行为影响因素研究 [J].
陈姝 ;
窦永香 ;
张青杰 .
情报杂志, 2017, 36 (11) :147-152+160
[6]   A framework for validating the merit of properties that predict the influence of a twitter user [J].
Rabiger, Stefan ;
Spiliopoulou, Myra .
EXPERT SYSTEMS WITH APPLICATIONS, 2015, 42 (05) :2824-2834
[7]  
Sentiment analysis on twitter data using KNN and SVM. REZWANUL M,ALI A,RAHMAN A. International Journal of Advanced Computer Science and Applications . 2017
[8]  
Semi-supervised regression with co-training. ZHOU Zhihua,LI Ming. International Joint Conference on Artificial Intelligence . 2005
[9]  
Identification of influential online social network users based on multi-features. SUN Q D,WANG N,ZHOU Y D, et al. International Journal of Pattern Recognition and Artificial Intelligence . 2016
[10]  
Cost-based Feature Selection for Support Vector Machines:An Application in Credit Scoring. Maldonado S,Pérez J,Bravo C. European Journal of Operational Research . 2017