基于用户聚类的热门微博分类研究

被引:11
作者
张士豪
顾益军
张俊豪
机构
[1] 中国人民公安大学网络安全保卫学院
关键词
用户聚类; 热门微博; 分类;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
文章在已有的微博分类研究的基础上,提出一种基于热门微博下转发用户聚类的微博分类方法,使得分类结果能够在公安工作中有更大的利用价值。文章所使用的聚类算法采用了现如今比较成熟的K-means聚类算法以及对其进行改进之后的X-means聚类算法,X-means算法使用了更加科学的BIC准则作为类别之间的相似性度量,而且用户在使用X-means算法时无需再指定聚类个数,只需要划定聚类范围就可以了,通过这样的机制,X-means算法提高了聚类的准确性和科学性。经过对实验结果的对比分析,发现X-means算法得出的聚类结果拟合性更好。因此,在微博分类研究中将会使用X-means算法进行用户聚类。另外,文章还列举了不同种类的微博下的用户聚集情况,并为网络安全主管部门提出了针对不同种类微博的应对策略。
引用
收藏
页码:84 / 89
页数:6
相关论文
共 14 条
[1]   基于Python的微博用户关系挖掘研究 [J].
林晓丽 ;
胡可可 ;
胡青 .
情报杂志, 2014, 33 (06) :144-148
[2]   面向舆情主题的微博用户行为聚类实证分析 [J].
李磊 ;
刘继 .
情报杂志, 2014, (03) :118-121
[3]   结合X-means聚类的自适应随机子空间组合分类算法 [J].
曹鹏 ;
李博 ;
栗伟 ;
赵大哲 .
计算机应用, 2013, 33 (02) :550-553
[4]   基于关键字的用户聚类算法 [J].
王荣 ;
李晋宏 ;
宋威 .
计算机工程与设计, 2012, 33 (09) :3553-3557+3568
[5]   基于中心化的微博热点发现方法 [J].
蔡淑琴 ;
张静 ;
王旸 ;
马玉涛 ;
林勇 .
管理学报, 2012, 9 (06) :874-879
[6]   微博用户特征分析和核心用户挖掘 [J].
何黎 ;
何跃 ;
霍叶青 .
情报理论与实践, 2011, 34 (11) :121-125
[7]   基于聚类准则函数的改进K-means算法 [J].
张雪凤 ;
张桂珍 ;
刘鹏 .
计算机工程与应用 , 2011, (11) :123-127
[8]   基于BIC准则和Gibbs采样的有限混合模型无监督学习算法 [J].
刘伟峰 ;
杨爱兰 .
电子学报, 2011, 39(S1) (S1) :134-139
[9]   基于轮廓系数的聚类有效性分析 [J].
朱连江 ;
马炳先 ;
赵学泉 .
计算机应用, 2010, 30(S2) (S2) :139-141+198
[10]   基于社会网络中心性分析的微博信息传播研究——以Sina微博为例 [J].
平亮 ;
宗利永 .
图书情报知识, 2010, (06) :92-97