基于文档分布式表达的新浪微博情感分类研究

被引:35
作者
杨宇婷 [1 ]
王名扬 [1 ]
田宪允 [2 ]
李鹏宇 [2 ]
机构
[1] 东北林业大学信息与计算机工程学院
[2] 哈尔滨工业大学经济与管理学院
关键词
微博; 情感分类; 文档分布式表达; Doc2vec;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
[目的/意义]拥有庞大用户群体的新浪微博每天都产生海量的文本数据,对其进行情感分类有助于分析社会的舆论走向,为舆情监测提供帮助。其中,如何挖掘微博中的文本特征与情感信息是微博情感分类研究的关键。[方法/过程]将能有效考察上下文语境的基于文档分布式的特征表达方法引入到微博情感分类研究中,通过综合考虑上下文的语义、语序和情感信息,将微博文本转化为高维空间的特征向量,然后利用SVM分类器判断文本的情感极性。[结果/结论]实验表明,对微博文本进行文档分布式特征表达后,其分类准确率可达90.46%,优于其他特征表达方法。
引用
收藏
页码:151 / 156
页数:6
相关论文
共 5 条
[1]
Word2vec的工作原理及应用探究 [J].
周练 .
科技情报开发与经济, 2015, 25 (02) :145-148
[2]
基于BP神经网络和遗传算法的网络舆情危机预警研究 [J].
孙玲芳 ;
周加波 ;
林伟健 ;
候志鲁 ;
许锋 .
情报杂志, 2014, 33 (11) :18-24
[3]
微博中产品意见挖掘研究 [J].
李光敏 ;
许新山 ;
张磊 .
情报杂志, 2014, (04) :135-138
[4]
一种基于极性词典的情感分析方法 [J].
张成功 ;
刘培玉 ;
朱振方 ;
方明 .
山东大学学报(理学版), 2012, 47 (03) :47-50
[5]
文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848