基于观点袋模型的汽车评论情感极性分类

被引:8
作者
廖健 [1 ]
王素格 [1 ,2 ]
李德玉 [1 ,2 ]
张鹏 [1 ]
机构
[1] 山西大学计算机与信息技术学院
[2] 山西大学计算智能与中文信息处理教育部重点实验室
关键词
情感分类; 观点袋模型; 词性搭配;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文针对网络评论倾向分级问题,提出了一种基于观点袋模型和语言学规则的多级情感分类方法。通过分析句子中的词性搭配关系,设计了12种抽取特征-观点搭配模式,并对存在问题给出了解决策略。依据汉语用词特点和词汇在汽车领域的特殊用法,提出搭配四元组的情感倾向极性值计算方法。在此基础上,利用获取的搭配四元组及其情感倾向极性,建立文本的向量化表示,并构造了权重计算公式。最后,利用文本余弦相似度计算方法实现对评论文本的五级情感极性分类。通过在COAE2012任务3的汽车数据集上进行的测试,取得了较好的分类结果。
引用
收藏
页码:113 / 120
页数:8
相关论文
共 11 条
[1]  
基于Web的评论文本情感分类问题研究[D]. 王素格.上海大学 2008
[2]  
新颁《标点符号用法》通释[M]. 教育科学出版社 , 宁鸿彬等 编著, 1992
[3]  
Retrieving collocations from text: Xtract. Smadja F. Computational Linguistics . 1993
[4]   基于混合语言信息的词语搭配倾向判别方法 [J].
王素格 ;
杨安娜 .
中文信息学报, 2010, 24 (03) :69-74
[5]   基于非完备信息系统的评价对象情感聚类 [J].
王素格 ;
尹学倩 ;
李茹 ;
张杰 ;
吕云云 .
中文信息学报, 2012, (04) :98-102+108
[6]   评价对象及其倾向性的抽取和判别 [J].
顾正甲 ;
姚天昉 .
中文信息学报, 2012, (04) :91-97
[7]  
The bag-of-opinions method for review rating prediction fromsparse text patterns. Qu L,Ifrim G,Weikum G. Proceedings of the23rd International Conference on Computational Lin-guistics . 2010
[8]  
A corpus studyof evaluative and speculative language. WIEBE J,BRUCE R,BELL Met al. Proceedingsof the 2nd ACL SIGdial Workshop on Discourse and Dia-logue . 2001
[9]  
Aspect-based sentiment analysis of movie reviews on discussion boards. Thet, Tun Thura,Na, Jin-Cheon,Khoo, Christopher S.G. Journal of Information Science . 2010
[10]  
The unified collocation framework for opinion mining. Xia Y Q,Xu R F,Wong K F,et al. Proceedings of Machine Learning and Cybernetics,2007International Conference on . 2007