基于主动学习的SVM维吾尔语情感分析研究

被引:15
作者
李响 [1 ,2 ]
吐尔根依布拉音 [1 ,2 ]
卡哈尔江阿比的热西提 [1 ,2 ]
买合木提买买提 [1 ,2 ]
机构
[1] 新疆大学信息科学与工程学院
[2] 新疆大学新疆多语种信息技术重点实验室
关键词
维吾尔语; 情感分析; SVM; 主动学习;
D O I
10.13568/j.cnki.651094.2015.04.010
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
在维吾尔语网站和信息平台不断完善的同时,较大规模的带有个人情感的言论也逐渐增多,尤其是微博语料中的情感文本具有很大的现实意义.然而标注语料是一件耗费人力很大的工作.本文在少量已标注语料的基础上针对SVM模型,提出了一种维吾尔语情感分类主动学习方法,加入了聚类代表性、样本差异性、分类不确定性三种策略,实现主动学习的维吾尔语情感分析.实验结果表明,主动学习在维吾尔语情感分类中的有效性,减少了人工标注的工作量,使得情感分类变得更省时省力,也略微提高了SVM的准确率.
引用
收藏
页码:447 / 452
页数:6
相关论文
共 12 条
[1]
基于主动学习的情感分类方法研究 [D]. 
居胜峰 .
苏州大学,
2013
[2]
现代维吾尔语参考语法.[M].力提甫·托乎提.中国社会科学出版社.2012,
[3]
基于众包的维吾尔语事件标注研究 [J].
陈昊 ;
吐尔根依布拉音 ;
卡哈尔江阿比的热西提 ;
艾山吾买尔 .
新疆大学学报(自然科学版), 2015, 32 (02) :209-214+220
[4]
基于用户关系的维吾尔文微博数据获取方法的研究 [J].
亚森伊斯马伊力 ;
吐尔根依布拉音 ;
卡哈尔江阿比的热西提 .
新疆大学学报(自然科学版), 2015, 32 (01) :74-79
[5]
一种基于语义距离的Web评论SVM情感分类方法 [J].
肖正 ;
刘辉 ;
李兵 .
计算机科学, 2014, 41 (09) :248-252+284
[6]
基于情感词典的维吾尔语文本句子情感分类 [J].
于斯音·于苏普 ;
艾斯卡尔·艾木都拉 .
电脑知识与技术, 2014, 10 (10) :2371-2374
[7]
基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, 26 (01) :73-83
[8]
维吾尔语情感分类算法 [J].
田生伟 ;
禹龙 ;
王宇光 .
计算机工程与应用 , 2011, (36) :147-150
[9]
维吾尔语情感词汇自动识别 [J].
禹龙 ;
田生伟 ;
冯冠军 .
计算机工程, 2011, 37 (07) :213-215
[10]
基于Stacking组合分类方法的中文情感分类研究 [J].
李寿山 ;
黄居仁 .
中文信息学报, 2010, (05) :56-61