基于极性词典的中文微博客情感分类

被引:25
作者
王勇 [1 ]
吕学强 [1 ]
姬连春 [2 ]
肖诗斌 [1 ]
机构
[1] 北京信息科技大学网络文化与数字传播北京市重点实验室
[2] 新华网络股份有限公司
关键词
微博客; 情感分类; 词典; 语言学特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
081203 ; 0835 ; 080402 ;
摘要
微博客是近年来自然语言处理领域研究的热点。主要针对中文微博客中的情感分类展开研究。结合网络新词和基础情感词,同时考虑了情感词的极性情感强弱,构建四个词典,分别是基础情感词典、表情符号词典、否定词词典和双重否定词词典;在情感词典的基础上,融合汉语语言学特征和微博情感表达特征,提出一种新的基于极性词典的情感分类方法。实验准确率达到82.2%。实验结果表明,提出的方法可以对中文微博进行较好的情感分类,有一定的应用价值。
引用
收藏
页码:34 / 37+126 +126
页数:5
相关论文
共 9 条
[1]   中文文本情感分析研究综述 [J].
陆文星 ;
王燕飞 .
计算机应用研究, 2012, 29 (06) :2014-2017
[2]   一种基于极性词典的情感分析方法 [J].
张成功 ;
刘培玉 ;
朱振方 ;
方明 .
山东大学学报(理学版), 2012, 47 (03) :47-50
[3]   基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, (01) :73-83
[4]   基于机器学习的中文微博情感分类实证研究 [J].
刘志明 ;
刘鲁 .
计算机工程与应用 , 2012, (01) :1-4
[5]   基于Stacking组合分类方法的中文情感分类研究 [J].
李寿山 ;
黄居仁 .
中文信息学报, 2010, 24 (05) :56-61
[6]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848
[7]   使用机器学习方法进行新闻的情感自动分类 [J].
徐军 ;
丁宇新 ;
王晓龙 .
中文信息学报, 2007, (06) :95-100
[8]  
Sentiment analysis of twitter data. Agarwal A,Xie B,Vovsha I,et al. Proceedings of the Workshop on Language in Social Media . 2011
[9]  
C-feel-i:a sentiment analyzer for micro-blog. Aditya Joshi,Balamurali A R,Pushpak Bhattachearyya,et al. Proceeding of the ACL-HLT2011 System Demonstration . 2011