学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
网络博客空间中基于半监督学习的垃圾评论检测
被引:5
作者
:
论文数:
引用数:
h-index:
机构:
郭利强
机构
:
[1]
洛阳师范学院教育科学学院
来源
:
图书情报工作
|
2012年
/ 04期
关键词
:
半监督学习;
检测技术;
网络博客空间;
垃圾评论;
D O I
:
暂无
中图分类号
:
TP18 [人工智能理论];
TP393.092 [];
学科分类号
:
140502
[人工智能]
;
摘要
:
针对网络博客空间中垃圾评论泛滥的问题,给出一种半监督学习式网络垃圾评论检测方案。基于评论内容的统计分析,设计相关度、词组重复率、超链接数目、内容淫秽度、句子长度共5个特征指标,给出网络垃圾评论检测系统的框架,并进行实验验证。实验结果表明,本方法能有效检测出网络博客空间中的垃圾评论,具有较好的应用价值。
引用
收藏
页码:52 / 55
页数:4
相关论文
共 3 条
[1]
免疫聚类算法在基因表达数据分析中的应用
[J].
朱思峰
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学计算机学院
周口师范学院数学与信息科学系
西安电子科技大学计算机学院
朱思峰
;
论文数:
引用数:
h-index:
机构:
刘芳
;
论文数:
引用数:
h-index:
机构:
柴争义
.
北京邮电大学学报,
2010,
33
(02)
:54
-57
[2]
由Logistic回归识别Web社区的垃圾评论
[J].
论文数:
引用数:
h-index:
机构:
何海江
;
论文数:
引用数:
h-index:
机构:
凌云
.
计算机工程与应用,
2009,
45
(23)
:140
-143
[3]
由向量空间相关模型识别博客文章的垃圾评论
[J].
论文数:
引用数:
h-index:
机构:
何海江
;
凌云
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学计算机中心
凌云
.
长沙大学学报,
2008,
(02)
:63
-66
←
1
→
共 3 条
[1]
免疫聚类算法在基因表达数据分析中的应用
[J].
朱思峰
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学计算机学院
周口师范学院数学与信息科学系
西安电子科技大学计算机学院
朱思峰
;
论文数:
引用数:
h-index:
机构:
刘芳
;
论文数:
引用数:
h-index:
机构:
柴争义
.
北京邮电大学学报,
2010,
33
(02)
:54
-57
[2]
由Logistic回归识别Web社区的垃圾评论
[J].
论文数:
引用数:
h-index:
机构:
何海江
;
论文数:
引用数:
h-index:
机构:
凌云
.
计算机工程与应用,
2009,
45
(23)
:140
-143
[3]
由向量空间相关模型识别博客文章的垃圾评论
[J].
论文数:
引用数:
h-index:
机构:
何海江
;
凌云
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学计算机中心
凌云
.
长沙大学学报,
2008,
(02)
:63
-66
←
1
→