基于层次结构的多策略中文微博情感分析和特征抽取

被引:191
作者
谢丽星 [1 ]
周明 [2 ]
孙茂松 [1 ]
机构
[1] 智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)清华大学计算机系
[2] 微软亚洲研究院
关键词
新浪微博; 情感分析; SVM;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
随着Web2.0时代的兴起,与微博相关的研究得到了学术界和工业界的广泛关注。该文使用新浪API获取数据,针对中文微博消息展开了情感分析方面的研究。我们对于三种情感分析的方法进行了深入研究,包括表情符号的规则方法、情感词典的规则方法、基于SVM的层次结构的多策略方法,实验表明基于SVM的层次结构多策略方法效果最好。其次,针对层次结构的多策略方法的特征选择进行了详细分析,包括主题无关、主题相关的特征。实验表明使用主题无关的特征时获得的准确率为66.467%。引入主题相关的特征后,准确率提升至67.283%。
引用
收藏
页码:73 / 83
页数:11
相关论文
共 3 条
[1]   基于Stacking组合分类方法的中文情感分类研究 [J].
李寿山 ;
黄居仁 .
中文信息学报, 2010, 24 (05) :56-61
[2]  
Thumbs up or thumbs down?semantic orientation applied to unsupervised classification of re-views .2 TURNEY P. Proceedings of ACL’02 . 2002
[3]  
The Utility ofLinguistic Rules in Opinion Mining .2 Xiaowen Ding,Bing Liu. SIGIR-2007 . 2007