基于深度学习的文本情感分类研究

被引:0
作者
朱少杰
机构
[1] 哈尔滨工业大学
关键词
情感分类; 深度学习; 特征融合; 半监督RAE方法;
D O I
暂无
年度学位
2014
学位类型
硕士
导师
摘要
文本情感分类在情感分析研究中占有举足轻重的地位,在信息爆炸的21世纪,海量数据的情感分类研究吸引了很多的研究者,如何深入学习文本的语义信息,准确表达语义特征,提高情感分类的准确性是研究的目标。 鉴于传统的机器学习方法无法学习文本语义信息的缺陷,本文在浅层学习特征的基础上提出了融合深度学习特征的方案研究文本情感分类问题,提高特征对文本语义信息的表达,增加模型对语义的学习和理解能力;研究中发现融合中采用的深层特征由于不是基于多隐层的深度学习方法抽取的,导致学习到的深层特征向量不能真正的理解文本中的具体语义,针对这些问题,文章引入了基于深度学习的半监督RAE方法研究文本的情感分类问题,RAE方法是多隐层的神经网络结构,可以逐层分析,优化每一层学习得到的特征向量表示,因此它抽取的文本特征向量可以更准确的表达语义信息,提高分类结果。 本文首先采用传统的SVM方法进行情感分类问题的研究,实验中选择词、词性和词典的特征组合方式,得到最好的分类正确率结果是81.88%;融合深度学习特征的方案中首先通过实验得到最佳深度特征向量长度值为150,在此条件下得到的最优分类正确率是81.98%,比传统的SVM方法提高了0.1%;基于深度学习的半监督RAE方法中经过实验得到深度特征向量的最佳长度值是50,其结果得到了显著的提高,正确率为85.10%,比传统的SVM方法提高了3.2%,将样本容量增加到原来的2倍时,情感分类的正确率可提高2.5%,同时模型的学习时间增长到原来的3倍。
引用
收藏
页数:66
共 7 条
[1]
深度学习研究综述 [J].
孙志军 ;
薛磊 ;
许阳明 ;
王正 .
计算机应用研究, 2012, 29 (08) :2806-2810
[2]
半监督文本分类综述 [J].
牛罡 ;
罗爱宝 ;
商琳 .
计算机科学与探索, 2011, 5 (04) :313-323
[3]
多特征融合的博客文章分类方法 [J].
麦林 ;
俞能海 .
小型微型计算机系统, 2010, 31 (06) :1129-1132
[4]
基于支持向量机和k-近邻分类器的多特征融合方法 [J].
陈丽 ;
陈静 .
计算机应用, 2009, 29 (03) :833-835
[5]
一种基于多特征融合的博客文章排序算法 [J].
卢刚 .
计算机工程, 2009, 35 (02) :47-49+52
[6]
关于统计学习理论与支持向量机 [J].
张学工 .
自动化学报, 2000, (01)
[7]
Sentiment analysis in multiple languages.[J].Ahmed Abbasi;Hsinchun Chen;Arab Salem.ACM Transactions on Information Systems (TOIS).2008, 3