一种应用于博客的垃圾评论识别方法

被引:6
作者
邓冰娜
王煜
刘宇
机构
[1] 河北大学数学与计算机系
关键词
博客垃圾评论; 相似度; 语义信息;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
针对博客垃圾评论泛滥的问题,提出了一种识别博客垃圾评论的新方法.利用网络常用语对短小评论先进行评论的识别,然后利用改进的相似度公式对评论进行了K轮评论的识别,在每轮识别之后,对主题词进行权重的调整和主题词扩展;待所有评论识别完毕,再利用网络常用语和主题词对识别出的垃圾评论进行第二次过滤,过滤出垃圾评论中的合法评论.实验结果表明,利用该方法进行评论识别在一定程度上提高了识别垃圾评论的准确率和召回率.
引用
收藏
页码:65 / 69+74 +74
页数:6
相关论文
共 3 条
[1]  
中文产品评论挖掘关键技术研究.[D].黄永文.重庆大学.2009, 12
[2]   基于统计特征的垃圾博客过滤 [J].
刘玮 ;
廖祥文 ;
许洪波 ;
王丽宏 .
中文信息学报, 2008, 22 (06) :86-91
[3]   由向量空间相关模型识别博客文章的垃圾评论 [J].
何海江 ;
凌云 .
长沙大学学报, 2008, (02) :63-66