基于并行化递归神经网络的中文短文本情感分类

被引:25
作者
谢铁
郑啸
张雷
王修君
机构
[1] 安徽工业大学计算机科学与技术学院
关键词
深度学习; 情感分析; 文本分类; Spark;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
情感分析的一个重要应用是判断用户对于产品评论的情感倾向,这些用户评论一般都是字数较少的短文本。传统方法多利用词袋模型获取单词的浅层特征来进行情感分析,利用这些简单特征训练的模型在短文本,尤其是在复杂语法问题上效果并不理想。通过利用深度递归神经网络算法来捕获句子语义信息,并引入中文"情感训练树库"作为训练数据来发现词语情感信息,在短文本情感五分类的问题上取得了较高的准确率。针对复杂模型在海量数据训练上的时间效率问题,通过在Spark并行框架下实现了模型的并行化处理,使得模型的可扩展性和时间效率得到提升。
引用
收藏
页码:205 / 211+232 +232
页数:8
相关论文
共 8 条
[1]
A fast learning algorithm for deep belief nets [J].
Hinton, Geoffrey E. ;
Osindero, Simon ;
Teh, Yee-Whye .
NEURAL COMPUTATION, 2006, 18 (07) :1527-1554
[2]
A fast parallel clustering algorithm for large spatial databases [J].
Xu, XW ;
Jäger, J ;
Kriegel, HP .
DATA MINING AND KNOWLEDGE DISCOVERY, 1999, 3 (03) :263-290
[3]
结合卷积神经网络和词语情感序列特征的中文情感分析 [J].
陈钊 ;
徐睿峰 ;
桂林 ;
陆勤 .
中文信息学报, 2015, 29 (06) :172-178
[4]
基于MapReduce的并行PLSA算法及在文本挖掘中的应用 [J].
李宁 ;
罗文娟 ;
庄福振 ;
何清 ;
史忠植 .
中文信息学报, 2015, 29 (02) :79-86
[5]
基于深度学习的微博情感分析 [J].
梁军 ;
柴玉梅 ;
原慧斌 ;
昝红英 ;
刘铭 .
中文信息学报, 2014, (05) :155-161
[6]
深度学习研究综述 [J].
孙志军 ;
薛磊 ;
许阳明 ;
王正 .
计算机应用研究, 2012, 29 (08) :2806-2810
[7]
基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, 26 (01) :73-83
[8]
基于Stacking组合分类方法的中文情感分类研究 [J].
李寿山 ;
黄居仁 .
中文信息学报, 2010, (05) :56-61