基于KNN算法的新浪微博用户行为分析及预测

被引:18
作者
解军
邢进生
机构
[1] 山西师范大学数学与计算机科学学院
关键词
KNN; 微博; 信息增益;
D O I
10.16207/j.cnki.1009-4490.2016.02.008
中图分类号
TP393.092 []; G206 [传播理论];
学科分类号
050302 [传播学];
摘要
本文对新浪微博的博文发布一周后受到的转发、评价、点赞的次数进行了分析及预测.首先采用聚类分析法,从训练集横向和纵向、微博特征及用户行为特点三个角度做了分析,得出了三种用户行为与微博数量的关系、三种用户行为之间的关系及用户行为具有均值的特点,然后结合分析结果,提出使用计算类别集合代替传统的求距离,使用双层对象代替单层对象的改进的KNN算法,使传统KNN算法成为可预测模型.最后的实例仿真表明改进后的KNN算法相对于其他传统预测方法 F1评估值平均提高了5.15%.
引用
收藏
页码:38 / 45
页数:8
相关论文
共 4 条
[1]
反垃圾邮件技术的研究 [D]. 
詹川 .
电子科技大学,
2005
[2]
基于语义的微博短信息分类 [J].
崔争艳 .
现代计算机(专业版), 2010, (08) :18-20+24
[3]
Using <Emphasis Type="Italic">k</Emphasis>NN model for automatic text categorization.[J].Gongde Guo;Hui Wang;David Bell;Yaxin Bi;Kieran Greer.Soft Computing.2006, 5
[4]
An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90