学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于AdaBoost的微博垃圾评论识别方法
被引:21
作者
:
论文数:
引用数:
h-index:
机构:
黄铃
论文数:
引用数:
h-index:
机构:
李学明
机构
:
[1]
重庆大学计算机学院
来源
:
计算机应用
|
2013年
/ 33卷
/ 12期
关键词
:
微博;
垃圾评论识别;
特征值向量;
AdaBoost算法;
弱分类器;
D O I
:
暂无
中图分类号
:
TP391.41 [];
学科分类号
:
摘要
:
针对微博上存在的大量垃圾评论,提出一种基于AdaBoost的微博垃圾评论识别方法。该方法首先提取表示微博评论的特征值向量,由8个特征值组成,然后通过AdaBoost算法在这些特征上训练出若干个比随机预测好的弱分类器,最后将得到的弱分类器加权集合成高精度的强分类器。从实际的热门新浪微博中提取评论数据集进行实验,结果表明所选取的8个特征是有效的,该方法对于微博垃圾评论的识别拥有较高的识别率。
引用
收藏
页码:3563 / 3566
页数:4
相关论文
共 10 条
[1]
AdaBoost算法研究进展与展望
[J].
论文数:
引用数:
h-index:
机构:
曹莹
;
论文数:
引用数:
h-index:
机构:
苗启广
;
论文数:
引用数:
h-index:
机构:
刘家辰
;
论文数:
引用数:
h-index:
机构:
高琳
.
自动化学报,
2013,
39
(06)
:745
-758
[2]
垃圾评论自动过滤方法
[J].
谭文堂
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学信息系统工程重点实验室
谭文堂
;
朱洪
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学信息系统工程重点实验室
朱洪
;
论文数:
引用数:
h-index:
机构:
葛斌
;
李芳芳
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学信息系统工程重点实验室
李芳芳
;
论文数:
引用数:
h-index:
机构:
肖卫东
.
国防科技大学学报,
2012,
34
(05)
:153
-157+168
[3]
一种应用于博客的垃圾评论识别方法
[J].
邓冰娜
论文数:
0
引用数:
0
h-index:
0
机构:
河北大学数学与计算机系
邓冰娜
;
论文数:
引用数:
h-index:
机构:
王煜
;
论文数:
引用数:
h-index:
机构:
刘宇
.
郑州大学学报(理学版),
2011,
43
(01)
:65
-69+74
[4]
基于LDA模型的博客垃圾评论发现
[J].
论文数:
引用数:
h-index:
机构:
刁宇峰
;
论文数:
引用数:
h-index:
机构:
杨亮
;
论文数:
引用数:
h-index:
机构:
林鸿飞
.
中文信息学报,
2011,
25
(01)
:41
-47
[5]
一种融合多种编辑距离的字符串相似度计算方法
[J].
刁兴春
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院
解放军总参第研究所
解放军理工大学指挥自动化学院
刁兴春
;
谭明超
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院
解放军理工大学指挥自动化学院
谭明超
;
曹建军
论文数:
0
引用数:
0
h-index:
0
机构:
解放军总参第研究所
解放军理工大学指挥自动化学院
曹建军
.
计算机应用研究,
2010,
27
(12)
:4523
-4525
[6]
由Logistic回归识别Web社区的垃圾评论
[J].
论文数:
引用数:
h-index:
机构:
何海江
;
论文数:
引用数:
h-index:
机构:
凌云
.
计算机工程与应用,
2009,
45
(23)
:140
-143
[7]
由向量空间相关模型识别博客文章的垃圾评论
[J].
论文数:
引用数:
h-index:
机构:
何海江
;
凌云
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学计算机中心
凌云
.
长沙大学学报,
2008,
(02)
:63
-66
[8]
基于双阈值的增强型AdaBoost快速算法
[J].
论文数:
引用数:
h-index:
机构:
严云洋
;
论文数:
引用数:
h-index:
机构:
郭志波
;
论文数:
引用数:
h-index:
机构:
杨静宇
.
计算机工程,
2007,
(21)
:172
-174
[9]
AdaBoost方法在入侵检测技术上的应用
[J].
郭红刚
论文数:
0
引用数:
0
h-index:
0
机构:
综合业务网国家重点实验室,综合业务网国家重点实验室陕西西安西安电子科技大学计算机学院陕西西安,陕西西安西安电子科技大学计算机学院陕西西安
郭红刚
;
论文数:
引用数:
h-index:
机构:
方敏
.
计算机应用,
2005,
(01)
:144
-146
[10]
一种新的Adaboost快速训练算法
[J].
论文数:
引用数:
h-index:
机构:
王海川
;
论文数:
引用数:
h-index:
机构:
张立明
.
复旦学报(自然科学版),
2004,
(01)
:27
-33
←
1
→
共 10 条
[1]
AdaBoost算法研究进展与展望
[J].
论文数:
引用数:
h-index:
机构:
曹莹
;
论文数:
引用数:
h-index:
机构:
苗启广
;
论文数:
引用数:
h-index:
机构:
刘家辰
;
论文数:
引用数:
h-index:
机构:
高琳
.
自动化学报,
2013,
39
(06)
:745
-758
[2]
垃圾评论自动过滤方法
[J].
谭文堂
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学信息系统工程重点实验室
谭文堂
;
朱洪
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学信息系统工程重点实验室
朱洪
;
论文数:
引用数:
h-index:
机构:
葛斌
;
李芳芳
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学信息系统工程重点实验室
李芳芳
;
论文数:
引用数:
h-index:
机构:
肖卫东
.
国防科技大学学报,
2012,
34
(05)
:153
-157+168
[3]
一种应用于博客的垃圾评论识别方法
[J].
邓冰娜
论文数:
0
引用数:
0
h-index:
0
机构:
河北大学数学与计算机系
邓冰娜
;
论文数:
引用数:
h-index:
机构:
王煜
;
论文数:
引用数:
h-index:
机构:
刘宇
.
郑州大学学报(理学版),
2011,
43
(01)
:65
-69+74
[4]
基于LDA模型的博客垃圾评论发现
[J].
论文数:
引用数:
h-index:
机构:
刁宇峰
;
论文数:
引用数:
h-index:
机构:
杨亮
;
论文数:
引用数:
h-index:
机构:
林鸿飞
.
中文信息学报,
2011,
25
(01)
:41
-47
[5]
一种融合多种编辑距离的字符串相似度计算方法
[J].
刁兴春
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院
解放军总参第研究所
解放军理工大学指挥自动化学院
刁兴春
;
谭明超
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院
解放军理工大学指挥自动化学院
谭明超
;
曹建军
论文数:
0
引用数:
0
h-index:
0
机构:
解放军总参第研究所
解放军理工大学指挥自动化学院
曹建军
.
计算机应用研究,
2010,
27
(12)
:4523
-4525
[6]
由Logistic回归识别Web社区的垃圾评论
[J].
论文数:
引用数:
h-index:
机构:
何海江
;
论文数:
引用数:
h-index:
机构:
凌云
.
计算机工程与应用,
2009,
45
(23)
:140
-143
[7]
由向量空间相关模型识别博客文章的垃圾评论
[J].
论文数:
引用数:
h-index:
机构:
何海江
;
凌云
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学计算机中心
凌云
.
长沙大学学报,
2008,
(02)
:63
-66
[8]
基于双阈值的增强型AdaBoost快速算法
[J].
论文数:
引用数:
h-index:
机构:
严云洋
;
论文数:
引用数:
h-index:
机构:
郭志波
;
论文数:
引用数:
h-index:
机构:
杨静宇
.
计算机工程,
2007,
(21)
:172
-174
[9]
AdaBoost方法在入侵检测技术上的应用
[J].
郭红刚
论文数:
0
引用数:
0
h-index:
0
机构:
综合业务网国家重点实验室,综合业务网国家重点实验室陕西西安西安电子科技大学计算机学院陕西西安,陕西西安西安电子科技大学计算机学院陕西西安
郭红刚
;
论文数:
引用数:
h-index:
机构:
方敏
.
计算机应用,
2005,
(01)
:144
-146
[10]
一种新的Adaboost快速训练算法
[J].
论文数:
引用数:
h-index:
机构:
王海川
;
论文数:
引用数:
h-index:
机构:
张立明
.
复旦学报(自然科学版),
2004,
(01)
:27
-33
←
1
→