情感词典扩充的微博文本多元情感分类研究

被引:46
作者
曹宇 [1 ,2 ]
王名扬 [1 ]
贺惠新 [2 ]
机构
[1] 东北林业大学信息与计算机工程学院
[2] 同方知网(北京)技术有限公司
关键词
微博; 多元情感分类; 情感词典; 卡方检验;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
[目的/意义]传统的微博文本情感分类大多注重判别情感的二元或三元倾向,这不能很好地贴近人类真实情感的描述。对微博文本的多元情感分类问题进行研究,有助于探明微博用户对某事件的真实看法,帮助相关部门对事件走向做出正确的判断和引导。[方法/过程]结合卡方检验方法,对含有众多口语化词汇和表情符号的微博文本进行处理,从含有特定表情符号的微博句子中识别属于某类情感的情感词,并结合《同义词词林》,实现对已有多元情感本体库的扩充。综合考虑扩充的情感词典、Bi-gram特征、否定词特征、表情符号和特殊符号以及句子长度等特征,利用SVM实现对微博文本句子级情感的多元分类,并以2014年"袁隆平事件"为例,实现对该事件的多元情感分析。[结果/结论]实验结果表明,相对于未进行情感词典扩充的情感分类而言,基于情感词典扩充的多元情感分类方法在分类性能上提升了3.6%,取得了比较好的分类效果。
引用
收藏
页码:185 / 189
页数:5
相关论文
共 9 条
[1]
基于文档分布式表达的新浪微博情感分类研究 [J].
杨宇婷 ;
王名扬 ;
田宪允 ;
李鹏宇 .
情报杂志, 2016, 35 (02) :151-156
[2]
基于模型集成的突发事件舆情分析与趋势预测研究 [J].
李彤 ;
宋之杰 .
系统工程理论与实践, 2015, 35 (10) :2582-2587
[3]
基于词典与机器学习的中文微博情感分析研究 [J].
孙建旺 ;
吕学强 ;
张雷瀚 .
计算机应用与软件, 2014, 31 (07) :177-181
[4]
一种多标记数据的过滤式特征选择框架 [J].
郭雨萌 ;
李国正 .
智能系统学报, 2014, 9 (03) :292-297
[5]
微博舆情:模式、表征与趋势.[J].李明德;张宏邦;.情报杂志.2013, 07
[6]
中文微博情感分析研究综述 [J].
周胜臣 ;
瞿文婷 ;
石英子 ;
施询之 ;
孙韵辰 .
计算机应用与软件, 2013, 30 (03) :161-164+181
[7]
基于情绪知识的中文微博情感分类方法 [J].
庞磊 ;
李寿山 ;
周国栋 .
计算机工程, 2012, 38 (13) :156-158+162
[8]
中文情感分类挖掘预处理关键技术比较研究 [J].
夏火松 ;
刘建 ;
朱慧毅 .
情报杂志, 2011, 30 (09) :160-163
[9]
情感词汇本体的构造.[J].徐琳宏;林鸿飞;潘宇;任惠;陈建美;.情报学报.2008, 02