基于表情图片与情感词的中文微博情感分析

被引:51
作者
张珊
于留宝
胡长军
机构
[1] 北京科技大学计算机与通信工程学院
关键词
情感分析; 表情图片; 情感词; 微博;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
微博是Web 2.0时代新生的社会化媒体平台,网民通过微博抒发自己的情感,表达自己的喜怒哀乐与爱恶,从而产生了海量的情感文本信息。通过对情感信息的分析,可以得到网民的情绪状况、对某个社会现象的观点、某个产品的喜好等信息,其不仅有一定的商业价值,还对社会的稳定有所帮助。利用微博中的表情图片,并结合情感词语的方法来构建中文微博情感语料库,既保证了语料库的规模与准确性,又省去了人工的负担;在情感语料库的基础上,构建贝叶斯分类器;最后利用熵的概念对语料库进行优化,提高了分类的准确性,并比较了使用不同n-gram特征项的性能。最终发现,使用UniGram特征项并用熵进行优化之后,分类的效果最好,召回率和准确率都可以达到85%以上,F值甚至可以达到89%以上。
引用
收藏
页码:146 / 148+176 +176
页数:4
相关论文
共 3 条
  • [1] 基于情绪知识的中文微博情感分类方法
    庞磊
    李寿山
    周国栋
    [J]. 计算机工程, 2012, 38 (13) : 156 - 158+162
  • [2] Sentiment analysis: A combined approach[J] . Rudy Prabowo,Mike Thelwall.Journal of Informetrics . 2009 (2)
  • [3] Mining WordNet for a Fuzzy Sentiment:Sentiment Tag Extraction from WordNet Glosses .2 Andreevskaia A,Bergler S. Proceedings of the European Chapter of the Association for Computational Linguistics(EACL) . 2006