中文文本情感词典构建方法

被引:146
作者
阳爱民 [1 ]
林江豪 [2 ]
周咏梅 [1 ]
机构
[1] 广东外语外贸大学思科信息学院
[2] 广东外语外贸大学国际工商管理学院
基金
广东省科技计划;
关键词
情感词典; 情感分类; PMI算法; 朴素贝叶斯;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。
引用
收藏
页码:1033 / 1039
页数:7
相关论文
共 3 条
[1]
中文基础情感词词典构建方法研究 [J].
柳位平 ;
朱艳辉 ;
栗春亮 ;
向华政 ;
文志强 .
计算机应用, 2009, 29 (10) :2875-2877
[2]
A lexicon model for deep sentiment analysis and opinion mining applications [J].
Maks, Isa ;
Vossen, Piek .
DECISION SUPPORT SYSTEMS, 2012, 53 (04) :680-688
[3]
Building Machine Learning Based Senti-word Lexicon for Sentiment Analysis.[J].Alaa Hamouda;Mahmoud Marei;Mohamed Rohaim.Journal of Advances in Information Technology.2011, 4