网络博客空间中基于半监督学习的垃圾评论检测

被引:5
作者
郭利强
机构
[1] 洛阳师范学院教育科学学院
关键词
半监督学习; 检测技术; 网络博客空间; 垃圾评论;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP393.092 [];
学科分类号
140502 [人工智能];
摘要
针对网络博客空间中垃圾评论泛滥的问题,给出一种半监督学习式网络垃圾评论检测方案。基于评论内容的统计分析,设计相关度、词组重复率、超链接数目、内容淫秽度、句子长度共5个特征指标,给出网络垃圾评论检测系统的框架,并进行实验验证。实验结果表明,本方法能有效检测出网络博客空间中的垃圾评论,具有较好的应用价值。
引用
收藏
页码:52 / 55
页数:4
相关论文
共 3 条
[1]
免疫聚类算法在基因表达数据分析中的应用 [J].
朱思峰 ;
刘芳 ;
柴争义 .
北京邮电大学学报, 2010, 33 (02) :54-57
[2]
由Logistic回归识别Web社区的垃圾评论 [J].
何海江 ;
凌云 .
计算机工程与应用, 2009, 45 (23) :140-143
[3]
由向量空间相关模型识别博客文章的垃圾评论 [J].
何海江 ;
凌云 .
长沙大学学报, 2008, (02) :63-66