中文网络评论的情感分类:句子与段落的比较研究

被引:5
作者
郑丽娟 [1 ]
王洪伟 [1 ]
郭恺强 [1 ,2 ]
机构
[1] 同济大学经济与管理学院
[2] 井冈山大学商学院
基金
中央高校基本科研业务费专项资金资助;
关键词
网络评论; 情感分类; 句子; 段落;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对句子和段落两种粒度的语料,采用机器统计学习方法,对可能影响中文网络评论情感分类效果的因素进行实验研究。选取N-gram作为情感文本的潜在特征项,利用文档频率、χ2统计量以及期望交叉熵对特征项实施降维处理,采用布尔权重法构建特征向量,并采用SVM分类器进行网络评论的情感分类。研究发现,语料的粒度对分类准确率的影响较大,句子粒度和段落粒度的分类准确率约相差10%;特征降维方法对句子和段落的分类准确率都有一定影响,且分类效果各有优劣,因此应根据不同需要进行选择;Unigram、Bigram分类效果的优劣受到语料粒度和特征降维方法的影响,因此并非一成不变。
引用
收藏
页码:376 / 384
页数:9
相关论文
共 11 条
[1]  
中文网络评论的情感特征项选择研究[J]. 王洪伟,郑丽娟,刘仲英,霍佳震.信息系统学报. 2012(01)
[2]   基于语义理解的文本情感分类方法研究 [J].
闻彬 ;
何婷婷 ;
罗乐 ;
宋乐 ;
王倩 .
计算机科学, 2010, 37 (06) :261-264
[3]   基于机器学习的网络新闻评论情感分类研究 [J].
周杰 ;
林琛 ;
李弼程 .
计算机应用, 2010, 30 (04) :1011-1014
[4]   基于HowNet的句子褒贬倾向性研究 [J].
熊德兰 ;
程菊明 ;
田胜利 .
计算机工程与应用, 2008, (22) :143-145
[5]   使用机器学习方法进行新闻的情感自动分类 [J].
徐军 ;
丁宇新 ;
王晓龙 .
中文信息学报, 2007, (06) :95-100
[6]   基于监督学习的中文情感分类技术比较研究 [J].
唐慧丰 ;
谭松波 ;
程学旗 .
中文信息学报, 2007, (06) :88-94+108
[7]  
主观性句子情感倾向性分析方法的研究[J]. 施寒潇,厉小军.情报学报. 2011 (05)
[8]  
情感分类中情感词的情感倾向度的计算方法研究[J]. 李纲,王忠义,寇广增.情报学报. 2011 (03)
[9]  
Sentiment classification of Internet restaurant reviews written in Cantonese[J] . Ziqiong Zhang,Qiang Ye,Zili Zhang,Yijun Li.Expert Systems With Applications . 2010 (6)
[10]  
Sentiment classification of online reviews to travel destinations by supervised machine learning approaches[J] . Qiang Ye,Ziqiong Zhang,Rob Law.Expert Systems With Applications . 2008 (3)