中文微博客的垃圾用户检测

被引:9
作者
李赫元 [1 ,2 ]
俞晓明 [1 ]
刘悦 [1 ]
程学旗 [1 ]
程工 [3 ]
机构
[1] 中国科学院计算技术研究所
[2] 中国科学院大学
[3] 国家计算机网络应急技术处理协调中心
关键词
微博客; 垃圾用户; 检测;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户资料、微博内容的3大类7种检测特征。随后,讨论了基于SVM分类器的垃圾用户检测方法。最后,我们对采集的微博数据进行了标注,并评价了分类器的效果。实验表明:分类器具有较高的准确率和召回率,该文提出的特征具有较好的区分度。
引用
收藏
页码:62 / 67+74 +74
页数:7
相关论文
共 1 条