一种基于多重词典的中文文本情感特征抽取方法

被引:9
作者
朱艳辉
栗春亮
徐叶强
柳位平
机构
[1] 湖南工业大学计算机与通信学院
基金
湖南省自然科学基金;
关键词
情感特征; 情感权重; 多重词典; 情感特征抽取算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
情感特征抽取是文本情感分类的重要步骤,正确的选择情感特征并赋予合理的情感权重是保障分类精度的前提。利用基础情感词词典、连词词典及词语距离,提出了一种基于多重词典的中文文本情感特征抽取算法,实验证明该方法优于HM,SO-PMI和词语语义距离等经典的特征抽取算法。
引用
收藏
页码:42 / 46
页数:5
相关论文
共 5 条
[1]   一种可靠信任推荐文本分类特征权重算法 [J].
焦庆争 ;
蔚承建 .
计算机应用研究, 2010, 27 (02) :472-474
[2]   中文文本分类中利用依存关系的实验研究 [J].
王鹏 ;
樊兴华 .
计算机工程与应用 , 2010, (03) :131-133+141
[3]   中文基础情感词词典构建方法研究 [J].
柳位平 ;
朱艳辉 ;
栗春亮 ;
向华政 ;
文志强 .
计算机应用, 2009, 29 (10) :2875-2877
[4]  
文本分类及其相关技术研究[D]. 李荣陆.复旦大学 2005
[5]  
Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classfication of Reviews. P.Turney. . 2002