共 1 条
中文微博客的垃圾用户检测
被引:9
作者:
李赫元
[1
,2
]
俞晓明
[1
]
刘悦
[1
]
程学旗
[1
]
程工
[3
]
机构:
[1] 中国科学院计算技术研究所
[2] 中国科学院大学
[3] 国家计算机网络应急技术处理协调中心
来源:
关键词:
微博客;
垃圾用户;
检测;
D O I:
暂无
中图分类号:
TP393.092 [];
学科分类号:
摘要:
微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户资料、微博内容的3大类7种检测特征。随后,讨论了基于SVM分类器的垃圾用户检测方法。最后,我们对采集的微博数据进行了标注,并评价了分类器的效果。实验表明:分类器具有较高的准确率和召回率,该文提出的特征具有较好的区分度。
引用
收藏
页码:62 / 67+74
+74
页数:7
相关论文