基于扩展的情感词典和卡方模型的中文情感特征选择方法

被引:6
作者
胡思才 [1 ,2 ]
孙界平 [1 ]
琚生根 [1 ]
王霞 [1 ]
龙彬 [1 ,3 ]
廖强 [4 ]
机构
[1] 四川大学计算机学院
[2] 解放军部队
[3] 四川大学外国语学院
关键词
情感词典; 卡方模型; 特征选择; 知网; 否定词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
根据经典的特征选择方法在中文情感评论文本中应用的缺陷和不足,提出了一种改进的中文情感特征选择方法.目前,现有的情感特征选择方法普遍只利用了特征项在褒贬类中的统计信息,忽略了情感极性值对特征选择的影响;同时情感文本中否定词会带来特征项情感极性反转的情况,为特征选择带来较大的负面影响.针对这些问题,首先对情感文本中的否定词进行了检测和判定,对否定词界定范围内的情感特征词进行反义变换处理,有效的解决了情感文本中极性反转的问题.同时还将特征项的情感极性值和其在类中的频率特点两个因素融入到卡方特征选择模型(CHI)中,从而提升了卡方模型在文本情感特征选择的效果.实验结果表明,本文算法较其他算法在多个领域数据集上的情感分类准确率提高了1.5%左右.
引用
收藏
页码:37 / 44
页数:8
相关论文
共 12 条
[1]   基于情感词典方法的情感倾向性分析 [J].
杨奎 ;
段琼瑾 .
计算机时代, 2017, (03) :10-13
[2]   基于特征选择技术的情感词权重计算 [J].
吴金源 ;
冀俊忠 ;
赵学武 ;
吴晨生 ;
杜芳华 .
北京工业大学学报, 2016, 42 (01) :142-151
[3]   基于情感字典与连词结合的中文文本情感分类 [J].
刘玉娇 ;
琚生根 ;
伍少梅 ;
苏翀 .
四川大学学报(自然科学版), 2015, 52 (01) :57-62
[4]   一种基于HowNet的词语语义相似度计算方法 [J].
范弘屹 ;
张仰森 .
北京信息科技大学学报(自然科学版), 2014, 29 (04) :42-45
[5]   基于词频信息的改进信息增益文本特征选择算法 [J].
石慧 ;
贾代平 ;
苗培 .
计算机应用, 2014, 34 (11) :3279-3282
[6]   基于扩展情感词典及特征加权的情感挖掘方法 [J].
徐晓丹 ;
段正杰 ;
陈中育 .
山东大学学报(工学版), 2014, 44 (06) :15-18+69
[7]   基于扩展情感词典及特征加权的情感挖掘方法 [J].
徐晓丹 ;
段正杰 ;
陈中育 .
山东大学学报(工学版), 2014, 44 (06) :15-18+69
[8]  
Sentiment classification and polarity shifting. S.Li,S.Y.M.Lee,Y.Chen,C.Huang,G.Zhou. International Conference on Computational Linguistics . 2010
[9]   基于双层HHMM的产品评论特征和情感分类 [J].
张磊 ;
李梦诗 ;
陈黎 ;
黎红友 ;
李志蜀 ;
彭舰 .
四川大学学报(工程科学版), 2013, 45 (02) :94-102
[10]   基于HowNet和PMI的词语情感极性计算 [J].
王振宇 ;
吴泽衡 ;
胡方涛 .
计算机工程, 2012, 38 (15) :187-189+193