基于OC-SVM的新情感词识别

被引:3
作者
付丽娜
肖和
姬东鸿
机构
[1] 武汉大学计算机学院
关键词
情感分析; 情感词库; 极性标注; 新词发现;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
当前对新词发现、情感词极性标注与情感词库构建的研究比较多,却少有一个专门针对新情感词识别的方法。提出一种基于OC-SVM的新情感词识别方法,通过种子词扩展方法获得词语集,并用旧词典、词频和停用词等对扩展的词进行过滤,获取新词,对新词获取的实验评估显示在适当的F值下,正确率可以达到45.5%。由于情感词和非情感词训练集的不平衡性,采用词频、相邻词及其词性等作为特征用OC-SVM(one-class support vector machine)对新词进行分类,获得新情感词,构建一个有效的新情感词识别系统。实验结果在召回率为26.6%的情况下,正确率可以达到45.7%,证明了算法的有效性。
引用
收藏
页码:1946 / 1948+1952 +1952
页数:4
相关论文
共 14 条
[1]   PageRank模型在中文情感词极性判别中的应用 [J].
李荣军 ;
王小捷 ;
周延泉 .
北京邮电大学学报, 2010, 33 (05) :141-144
[2]   One-Class分类器研究 [J].
潘志松 ;
陈斌 ;
缪志敏 ;
倪桂强 .
电子学报, 2009, 37 (11) :2496-2503
[3]  
Document re-ranking based on automatically acquired key terms in Chinese information retrieval. Yang Lingpeng,,Ji Donghong,Tang Li. COLING’’04 Proceedings of the 20th international conference on Computational Linguistics . 2004
[4]  
Statistically-enhanced new word identification in a rule-based Chinese system. Wu A,Jiang Z. Proc. of the 2nd Chinese Language Processing Workshop . 2000
[5]  
Unknown Word Extraction for Chinese Documents. Keh-Jiann Chen,Wei-Yun Ma. COLING-2002:The 19th International Conference on Computational Linguistics . 2002
[6]   基于《知网》的汉语未登录词语义相似度计算 [J].
张瑞霞 ;
杨国增 ;
吴慧欣 .
中文信息学报, 2012, 26 (01) :16-21
[7]   中文新词识别技术综述 [J].
张海军 ;
史树敏 ;
朱朝勇 ;
黄河燕 .
计算机科学, 2010, 37 (03) :6-10+16
[8]  
Computation of renameable horn backdoors. Kottler S,Kaufmann M,Sinz C. Theory and Applications of Satisfiability Testing . 2008
[9]  
The effectiveness study of local maximum feature for Chinese unknown word identification. Liu Tao,Liu Bingquan,Wang Xiaolong,et al. Journal of Chinese Languageand Computing . 2007
[10]   基于支持向量的单类分类方法综述 [J].
吴定海 ;
张培林 ;
任国全 ;
陈非 .
计算机工程, 2011, 37 (05) :187-189