基于特征选择技术的情感词权重计算

被引:13
作者
吴金源 [1 ]
冀俊忠 [1 ]
赵学武 [1 ,2 ]
吴晨生 [3 ]
杜芳华 [1 ]
机构
[1] 北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
[2] 南阳师范学院软件学院
[3] 北京市科学技术情报研究所
关键词
文本情感分类; 情感词典构建; 特征选择; 权重计算;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在文本情感分析中,情感词典的构建至关重要,然而目前这方面的研究大多集中在简单的词语极性判别上,有关情感词的权重赋值研究较少,且已有的权重赋值方法基本上都需要人工辅助来选取基准词,这给实际应用带来很大的困难.针对此问题,提出了一种自动的基于特征选择技术的情感词权重计算方法.首先提出了词语情感权重与文本情感倾向的相关假设;然后针对情感分类,结合二元分类的特性改进了信息增益(information gain,IG)和卡方统计量(chi-square,CHI),将特征选择技术应用于情感词权重计算.实验结果表明:将计算所得的带情感权重的情感词库用于文本情感分类能够提升分类精度.
引用
收藏
页码:142 / 151
页数:10
相关论文
共 7 条
[1]   面向文本情感分析的中文情感词典构建方法 [J].
周咏梅 ;
杨佳能 ;
阳爱民 .
山东大学学报(工学版), 2013, 43 (06) :27-33
[2]   文本分类中改进型CHI特征选择方法的研究 [J].
裴英博 ;
刘晓霞 .
计算机工程与应用, 2011, 47 (04) :128-130+194
[3]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848
[4]   中文基础情感词词典构建方法研究 [J].
柳位平 ;
朱艳辉 ;
栗春亮 ;
向华政 ;
文志强 .
计算机应用, 2009, 29 (10) :2875-2877
[5]   基于HowNet的词汇语义倾向计算 [J].
朱嫣岚 ;
闵锦 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (01) :14-20
[6]  
情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美.情报学报. 2008 (02)
[7]  
Measuring praise and criticism[J] . Peter D. Turney,Michael L. Littman.ACM Transactions on Information Systems (TOIS) . 2003 (4)