大数据背景下用户画像的统计方法实践研究

被引:0
作者
李映坤
机构
[1] 首都经济贸易大学
关键词
大数据; mahout; 用户画像; 用户流失预测; 用户行为分析;
D O I
暂无
年度学位
2016
学位类型
硕士
摘要
21世纪以来,随着智能手机与互联网技术的不断发展与革新,移动互联网作为二者结合的产物,近年来发展迅猛。数据显示,2014年中国智能手机保有量达到7.8亿台,移动网民达到5.7亿人,且以飞快的速度在不断增长。随着人们使用智能手机的时长和频数的不断增加,其用户行为数据呈指数级增加。且从智能终端收集的数据具有大数据量、实时性、准确性、空间性、动态性的基本特征。为了解决这一大数据的分析需求,本文从用户角度出发,以2014年第四季度部分手机用户使用APP的行为数据为研究对象,从用户画像的用户属性、用户流失、用户行为三个主要方面进行了研究。首先,研究认为用户画像其是对现实世界中用户的数学建模。用户画像的核心是标签体系的建立。标签是某一种用户特征的符号表示,用户画像可以用标签的集合来表示。其次,依据用户一段时间内的使用行为数据,通过支持向量机、生存分析两种分析方法建立了用户流失预测模型。模型结果表明,对于用户流失的预测准确率基本能达到90%以上,模型预测召回率达到80%以上。最后,使用hadoop中的mahout分析框架,对用户20多项行为指标进行了聚类分析,分析得出了不同阶层的用户人群对于APP的偏好和使用习惯特征。并抽取了某一APP用户行为数据,对其进行了聚类分析,分析认为用户基本可以分为六类人群,依据不同的类型,也给出了相应的挽留策略与营销建议。本文总结和概述了用户画像的定义,分析了标签体系建立的基本流程和统计分析方法。创新性的提出了用户画像研究的三个基本构成要素,即代表用户出生的用户属性、记录用户一生的用户行为、描述用户消失的用户流失。参照流失的定义,依据实际场景对APP用户的流失作了新的定义,并建立模型预测用户流失行为。对于用户画像中用户行为的研究,文章将营销中的FRM指标用于用户行为的分析,结合聚类分析的统计方法,更好的解释和描述了用户的行为特征。
引用
收藏
页数:64
共 28 条
[1]
基于Hadoop用户行为分析系统设计与实现 [D]. 
郝增勇 .
北京交通大学,
2014
[2]
在线社会网络用户行为模型与应用算法研究.[D].肖云鹏.北京邮电大学.2013, 01
[3]
基于MMOI方法的电信客户流失预测与挽留研究 [D]. 
罗彬 .
电子科技大学,
2010
[4]
网络用户行为分析的若干问题研究 [D]. 
刘鹏 .
北京邮电大学,
2010
[5]
网络大数据:现状与展望 [J].
王元卓 ;
靳小龙 ;
程学旗 .
计算机学报, 2013, 36 (06) :1125-1138
[6]
大数据时代的挑战、价值与应对策略 [J].
陈如明 .
移动通信, 2012, 36 (17) :14-15
[7]
基于蚁群算法的成本敏感线性集成多分类器的客户流失研究 [J].
罗彬 ;
邵培基 ;
罗尽尧 ;
刘独玉 ;
夏国恩 .
中国管理科学, 2010, 18 (03) :58-67
[8]
结合K-means的分类方法在电信客户流失中的应用 [J].
王颖 ;
陈治平 .
佳木斯大学学报(自然科学版), 2010, 28 (02) :175-179
[9]
人类行为的动力学与统计力学研究 [J].
汪秉宏 ;
韩筱璞 .
物理, 2010, 39 (01) :28-37
[10]
基于贝叶斯网络的移动业务客户流失预测研究 [J].
桂宏新 ;
杨昌昊 ;
程飞 .
电信科学, 2009, 25 (03) :70-75