面向中文网络评论情感分类的集成学习框架

被引:10
作者
黄佳锋 [1 ]
薛云 [1 ,2 ]
卢昕 [1 ]
刘志煌 [1 ]
吴威 [1 ]
黄英仁 [1 ]
李万理 [1 ]
陈鑫 [1 ,3 ]
机构
[1] 华南师范大学物理与电信工程学院
[2] 广东省数据科学工程技术研究中心
[3] 深圳职业技术学院工业中心
基金
广东省科技计划;
关键词
网络评论; 情感分类; 集成学习; 特征提取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
该文针对中文网络评论情感分类任务,提出了一种集成学习框架。首先针对中文网络评论复杂多样的特点,采用词性组合模式、频繁词序列模式和保序子矩阵模式作为输入特征。然后采用基于信息增益的随机子空间算法解决文本特征繁多的问题,同时提高基分类器的分类性能。最后基于产品属性构造基分类器算法综合评论文本中每个属性的情感信息,进而判别评论的句子级情感倾向。实验结果表明了该框架在中文网络评论情感分类任务上的有效性,特别是在Logistic Regression分类算法上准确率达到90.3%。
引用
收藏
页码:113 / 122
页数:10
相关论文
共 11 条
[1]
文本情感分析综述 [J].
杨立公 ;
朱俭 ;
汤世平 .
计算机应用, 2013, 33 (06) :1574-1578+1607
[2]
Sentiment classification: The contribution of ensemble learning[J] Gang Wang;Jianshan Sun;Jian Ma;Kaiquan Xu;Jibao Gu Decision Support Systems 2014,
[3]
Identifying Web Spam with the Wisdom of the Crowds[J] Yiqun Liu;Fei Chen;Weize Kong;Huijia Yu;Min Zhang;Shaoping Ma;Liyun Ru ACM Transactions on the Web (TWEB) 2012,
[4]
Ensemble of feature sets and classification algorithms for sentiment classification[J] Rui Xia;Chengqing Zong;Shoushan Li Information Sciences 2010,
[5]
An empirical study of sentiment analysis for chinese documents[J] Songbo Tan;Jin Zhang Expert Systems With Applications 2007,
[6]
Ensemble based systems in decision making[J] R. Polikar IEEE Circuits and Systems Magazine 2006,
[7]
A Neural Probabilistic Language Model.[J] Yoshua Bengio;Réjean Ducharme;Pascal Vincent;Christian Janvin Journal of Machine Learning Research 2003,
[8]
On the construction of effective vocabularies for information retrieval[J] G. Salton;Clement T. Yu ACM SIGIR Forum 1973,
[9]
Efficient visual search of videos cast as text retrieval. Sivic Josef;Zisserman Andrew IEEE transactions on pattern analysis and machine intelligence 2009,
[10]
计算语言学[M] 刘颖编著; 清华大学出版社 2002,