学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种应用于博客的垃圾评论识别方法
被引:6
作者
:
邓冰娜
论文数:
0
引用数:
0
h-index:
0
机构:
河北大学数学与计算机系
邓冰娜
王煜
论文数:
0
引用数:
0
h-index:
0
机构:
河北大学数学与计算机系
王煜
刘宇
论文数:
0
引用数:
0
h-index:
0
机构:
河北大学数学与计算机系
刘宇
机构
:
[1]
河北大学数学与计算机系
来源
:
郑州大学学报(理学版)
|
2011年
/ 43卷
/ 01期
关键词
:
博客垃圾评论;
相似度;
语义信息;
D O I
:
暂无
中图分类号
:
TP393.092 [];
学科分类号
:
080402 ;
摘要
:
针对博客垃圾评论泛滥的问题,提出了一种识别博客垃圾评论的新方法.利用网络常用语对短小评论先进行评论的识别,然后利用改进的相似度公式对评论进行了K轮评论的识别,在每轮识别之后,对主题词进行权重的调整和主题词扩展;待所有评论识别完毕,再利用网络常用语和主题词对识别出的垃圾评论进行第二次过滤,过滤出垃圾评论中的合法评论.实验结果表明,利用该方法进行评论识别在一定程度上提高了识别垃圾评论的准确率和召回率.
引用
收藏
页码:65 / 69+74 +74
页数:6
相关论文
共 3 条
[1]
中文产品评论挖掘关键技术研究.[D].黄永文.重庆大学.2009, 12
[2]
基于统计特征的垃圾博客过滤
[J].
论文数:
引用数:
h-index:
机构:
刘玮
;
论文数:
引用数:
h-index:
机构:
廖祥文
;
论文数:
引用数:
h-index:
机构:
许洪波
;
王丽宏
论文数:
0
引用数:
0
h-index:
0
机构:
国家计算机网络与信息安全管理中心
中国科学院计算技术研究所信息智能与信息安全研究中心
王丽宏
.
中文信息学报,
2008,
22
(06)
:86
-91
[3]
由向量空间相关模型识别博客文章的垃圾评论
[J].
何海江
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学计算机中心
何海江
;
凌云
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学计算机中心
凌云
.
长沙大学学报,
2008,
(02)
:63
-66
←
1
→
共 3 条
[1]
中文产品评论挖掘关键技术研究.[D].黄永文.重庆大学.2009, 12
[2]
基于统计特征的垃圾博客过滤
[J].
论文数:
引用数:
h-index:
机构:
刘玮
;
论文数:
引用数:
h-index:
机构:
廖祥文
;
论文数:
引用数:
h-index:
机构:
许洪波
;
王丽宏
论文数:
0
引用数:
0
h-index:
0
机构:
国家计算机网络与信息安全管理中心
中国科学院计算技术研究所信息智能与信息安全研究中心
王丽宏
.
中文信息学报,
2008,
22
(06)
:86
-91
[3]
由向量空间相关模型识别博客文章的垃圾评论
[J].
何海江
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学计算机中心
何海江
;
凌云
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学计算机中心
凌云
.
长沙大学学报,
2008,
(02)
:63
-66
←
1
→