一种用户画像系统的设计与实现

被引:30
作者
王洋 [1 ,2 ]
丁志刚 [2 ,3 ,4 ]
郑树泉 [2 ,3 ,4 ]
齐文秀 [1 ,2 ]
机构
[1] 上海市计算技术研究所
[2] 上海产业技术研究院
[3] 上海计算机软件技术开发中心
[4] 上海嵌入式系统应用工程技术研究中心
关键词
用户行为分析; 基于Hadoop的大数据分析平台; 用户画像系统; 用户价值模型; K-means;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
用户画像系统通过结合用户浏览行为日志以及爬取数据作为补充,构成用户浏览行为的完整数据集。通过以Hadoop分布式集群为基础的大数据平台结合数据分析算法对该数据集进行清洗、规范化、分析与处理,分析出用户兴趣偏好,为用户标记不同权重的标签,使得企业更了解用户以及为之后针对用户精准推荐铺平道路。此外,针对K-means算法依赖初始化中心的缺陷进行了改进,从测试结果可以看出改进后的K-means准确率得到了较大提升。
引用
收藏
页码:8 / 14
页数:7
相关论文
共 6 条
[1]   基于半监督K-Means的属性加权聚类算法 [J].
潘巍 ;
周晓英 ;
吴立锋 ;
王国辉 .
计算机应用与软件, 2017, 34 (03) :189-193+242
[2]   SSM框架在Web应用开发中的设计与实现 [J].
李洋 .
计算机技术与发展, 2016, 26 (12) :190-194
[3]   基于微博的大数据用户画像与精准营销 [J].
曾鸿 ;
吴苏倪 .
现代经济信息, 2016, (16) :306-308
[4]   基于HDFS的创新知识云平台存储架构的研究与设计 [J].
马建红 ;
霍振奇 .
计算机应用与软件, 2016, 33 (03) :62-66
[5]   一种基于最大最小距离和SSE的自适应聚类算法 [J].
成卫青 ;
卢艳红 .
南京邮电大学学报(自然科学版), 2015, 35 (02) :102-107
[6]   高性能网络爬虫:研究综述 [J].
周德懋 ;
李舟军 .
计算机科学, 2009, 36 (08) :26-29+53