轻型评论的情感分析研究

被引:52
作者
张林 [1 ,2 ]
钱冠群 [3 ]
樊卫国 [4 ]
华琨 [5 ]
张莉 [1 ]
机构
[1] 北京航空航天大学计算机学院
[2] 浙江财经大学信息学院
[3] 百度公司
[4] Department of Information Systems,Pamplin College of Business,Virginia Technological University
[5] Electrical and Computer Engineering Department,Lawrence Technological
关键词
情感分析; 用户评论; 短文本; 意见挖掘;
D O I
10.13328/j.cnki.jos.004728
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
以在智能移动设备上发表的用户评论作为研究对象,并将该类评论称为轻型评论.指出了轻型评论与早期互联网评论及短文本研究的异同点,并通过实验总结轻型评论的独有特性:字数少、跨度大,短小评论数量众多,评论长度与数量满足幂率分布.同时,针对轻型评论的情感分类研究展开了一系列的实验研究,发现:(1)情感分类效果随着评论长度的增加而下降;(2)传统的特征筛选方法以及特征加权方法对于轻型评论效果都不够理想;(3)极性词在短评论中比例高于长评论;(4)长、短评论在用词上存在较高的重叠度.在此基础上,提出了一种基于短评论特征共现的特征筛选方法,将短小评论中的优势信息和传统的特征筛选方法相结合,在筛选掉无用噪音的同时增补有利于分类的有效特征.实验结果表明,该方法可以有效地提高轻型评论中较长评论的分类效果.
引用
收藏
页码:2790 / 2807
页数:18
相关论文
共 19 条
[1]  
基于上下文重构的短文本情感极性判别研究[J]. 杨震,赖英旭,段立娟,李玉鑑.自动化学报. 2012(01)
[2]   基于机器学习的中文微博情感分类实证研究 [J].
刘志明 ;
刘鲁 .
计算机工程与应用, 2012, 48 (01) :1-4
[3]   利用上下位关系的中文短文本分类 [J].
王盛 ;
樊兴华 ;
陈现麟 .
计算机应用, 2010, 30 (03) :603-606+611
[4]   使用机器学习方法进行新闻的情感自动分类 [J].
徐军 ;
丁宇新 ;
王晓龙 .
中文信息学报, 2007, (06) :95-100
[5]  
面向互联网评论情感分析的中文主观性自动判别方法研究[J]. 叶强,张紫琼,罗振雄.信息系统学报. 2007(01)
[6]   基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[7]   基于HowNet的词汇语义倾向计算 [J].
朱嫣岚 ;
闵锦 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (01) :14-20
[8]  
统计自然语言处理[M]. 清华大学出版社 , 宗成庆, 2007
[9]   Vehicle defect discovery from social media [J].
Abrahams, Alan S. ;
Jiao, Jian ;
Wang, G. Alan ;
Fan, Weiguo .
DECISION SUPPORT SYSTEMS, 2012, 54 (01) :87-97
[10]  
The WEKA data mining software[J] . Mark Hall,Eibe Frank,Geoffrey Holmes,Bernhard Pfahringer,Peter Reutemann,Ian H. Witten.ACM SIGKDD Explorations Newsletter . 2009 (1)