基于多特征与复合分类法的中文微博情感分析

被引:8
作者
吴维
肖诗斌
机构
[1] 北京信息科技大学网络文化与数字传播北京市重点实验室
关键词
微博; 表情符号; 复合分类法; 位置权重; 情感分类;
D O I
10.16508/j.cnki.11-5866/n.2013.04.008
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了提高微博的情感分析的准确率,选取微博文本中的动词和形容词作为特征,提出了基于层次结构的特征降维方法,采用基于表情符号的方法计算特征极性值。在此基础上,提出了基于特征极性值的位置权重计算方法,借助支持向量机(SVM)作为机器学习模型将微博文本分为正面、负面和中性3类。也就是多特征提取,结合字典法与机器学习法2种算法,来提高情感分析的准确率。实验结果表明,该方法能取得平均为72.16%的准确率。提出的基于多特征与复合分类器的情感分析方法能够比较有效地对中文微博文本进行情感分类。
引用
收藏
页码:39 / 45
页数:7
相关论文
共 7 条
[1]   一种基于极性词典的情感分析方法 [J].
张成功 ;
刘培玉 ;
朱振方 ;
方明 .
山东大学学报(理学版), 2012, 47 (03) :47-50
[2]   基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, (01) :73-83
[3]   基于机器学习的中文微博情感分类实证研究 [J].
刘志明 ;
刘鲁 .
计算机工程与应用 , 2012, (01) :1-4
[4]   对层次聚类算法的改进 [J].
段明秀 ;
杨路明 .
湖南理工学院学报(自然科学版), 2008, (02) :28-29+36
[5]   程度副词的特点范围与分类 [J].
蔺璜 ;
郭姝慧 .
山西大学学报(哲学社会科学版), 2003, (02) :71-74
[6]  
现代汉语否定副词研究.[D].郝雷红.首都师范大学.2003, 03
[7]   Use of negation phrases in automatic sentiment classification of product reviews [J].
Na, JC ;
Khoo, C ;
Wu, PHJ .
LIBRARY COLLECTIONS ACQUISITIONS & TECHNICAL SERVICES, 2005, 29 (02) :180-191