中文微博情感词典构建方法

被引:15
作者
周咏梅 [1 ]
阳爱民 [1 ]
林江豪 [2 ]
机构
[1] 广东外语外贸大学思科信息学院
[2] 广东外语外贸大学管理学院
基金
广东省科技计划;
关键词
微博情感词典; 网络用语; 情感分析; 上下文熵; 朴素贝叶斯;
D O I
暂无
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
摘要
提出了一种中文微博情感词典构建方法。采用上下文熵的网络用语发现策略,通过TF-IDF(term frequencyinverse document frequency)进行二次过滤得到网络用语;利用SO-PMI(semantic orientation-pointwise mutual information)算法在已标注的微博语料库中计算网络用语的情感倾向值,构建网络用语情感词典;将词典应用到微博情感分类实验,并与朴素贝叶斯分类器的分类性能进行了比较分析。实验结果表明,直接利用微博情感词典的分类效果好于朴素贝叶斯分类器,并具有分类过程简单、快速等优势。
引用
收藏
页码:36 / 40
页数:5
相关论文
共 7 条
  • [1] 一种面向情感分析的微博表情情感词典构建及应用
    王文远
    王大玲
    冯时
    李任斐
    王琳
    [J]. 计算机与数字工程, 2012, 40 (11) : 6 - 9
  • [2] 有效的中文微博短文本倾向性分类算法
    韩忠明
    张玉沙
    张慧
    万月亮
    黄今慧
    [J]. 计算机应用与软件, 2012, 29 (10) : 89 - 93
  • [3] 一种基于朴素贝叶斯的微博情感分类
    林江豪
    阳爱民
    周咏梅
    陈锦
    蔡泽键
    [J]. 计算机工程与科学, 2012, 34 (09) : 160 - 165
  • [4] 基于层次结构的多策略中文微博情感分析和特征抽取
    谢丽星
    周明
    孙茂松
    [J]. 中文信息学报, 2012, 26 (01) : 73 - 83
  • [5] 一种基于多重词典的中文文本情感特征抽取方法
    朱艳辉
    栗春亮
    徐叶强
    柳位平
    [J]. 湖南工业大学学报, 2011, 25 (02) : 42 - 46
  • [6] Research on Building a Chinese Sentiment Lexicon Based on SO-PMI[J] . Chen Ning Wang,Shi Jun Chen,Chang Li Zha.Applied Mechanics and Materials . 2013 (263)
  • [7] Unsupervised learning of semantic orientation from a hundred-billion-word corpus .2 Turney P D,Littman M L. ERB-1094 . 2002