基于AdaBoost的微博垃圾评论识别方法

被引:21
作者
黄铃
李学明
机构
[1] 重庆大学计算机学院
关键词
微博; 垃圾评论识别; 特征值向量; AdaBoost算法; 弱分类器;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
针对微博上存在的大量垃圾评论,提出一种基于AdaBoost的微博垃圾评论识别方法。该方法首先提取表示微博评论的特征值向量,由8个特征值组成,然后通过AdaBoost算法在这些特征上训练出若干个比随机预测好的弱分类器,最后将得到的弱分类器加权集合成高精度的强分类器。从实际的热门新浪微博中提取评论数据集进行实验,结果表明所选取的8个特征是有效的,该方法对于微博垃圾评论的识别拥有较高的识别率。
引用
收藏
页码:3563 / 3566
页数:4
相关论文
共 10 条
[1]
AdaBoost算法研究进展与展望 [J].
曹莹 ;
苗启广 ;
刘家辰 ;
高琳 .
自动化学报, 2013, 39 (06) :745-758
[2]
垃圾评论自动过滤方法 [J].
谭文堂 ;
朱洪 ;
葛斌 ;
李芳芳 ;
肖卫东 .
国防科技大学学报, 2012, 34 (05) :153-157+168
[3]
一种应用于博客的垃圾评论识别方法 [J].
邓冰娜 ;
王煜 ;
刘宇 .
郑州大学学报(理学版), 2011, 43 (01) :65-69+74
[4]
基于LDA模型的博客垃圾评论发现 [J].
刁宇峰 ;
杨亮 ;
林鸿飞 .
中文信息学报, 2011, 25 (01) :41-47
[5]
一种融合多种编辑距离的字符串相似度计算方法 [J].
刁兴春 ;
谭明超 ;
曹建军 .
计算机应用研究, 2010, 27 (12) :4523-4525
[6]
由Logistic回归识别Web社区的垃圾评论 [J].
何海江 ;
凌云 .
计算机工程与应用, 2009, 45 (23) :140-143
[7]
由向量空间相关模型识别博客文章的垃圾评论 [J].
何海江 ;
凌云 .
长沙大学学报, 2008, (02) :63-66
[8]
基于双阈值的增强型AdaBoost快速算法 [J].
严云洋 ;
郭志波 ;
杨静宇 .
计算机工程, 2007, (21) :172-174
[9]
AdaBoost方法在入侵检测技术上的应用 [J].
郭红刚 ;
方敏 .
计算机应用, 2005, (01) :144-146
[10]
一种新的Adaboost快速训练算法 [J].
王海川 ;
张立明 .
复旦学报(自然科学版), 2004, (01) :27-33