维吾尔语情感分类算法

被引:12
作者
田生伟 [1 ]
禹龙 [2 ]
王宇光 [1 ]
机构
[1] 新疆大学软件学院
[2] 新疆大学网络中心
关键词
维吾尔语; 情感分类; 语言模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
情感分类是一项具有实用价值的分类技术。目前英语和汉语的情感分类的研究比较多,而针对维吾尔语的研究较少。以n-gram模型作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,选择不同的特征数量,以NaǐveBayes、ME(最大熵)和SVM(支持向量机)作为不同的文本分类方法,分别进行了维吾尔语情感分类实验,并对实验结果进行了比较,结果表明:采用UniGrams特征表示方法、在5000个特征数量和合适的特征选择函数,ME和SVM对维吾尔语情感分类能取得较好的效果。
引用
收藏
页码:147 / 150
页数:4
相关论文
共 4 条
[1]
基于语义理解的文本倾向性识别机制 [J].
徐琳宏 ;
林鸿飞 ;
杨志豪 .
中文信息学报, 2007, (01) :96-100
[2]
汉语句子语义极性分析和观点抽取方法的研究 [J].
娄德成 ;
姚天昉 .
计算机应用, 2006, (11) :2622-2625
[3]
Sentiment extraction from unstruc-tured text using tabu search-enhanced Markov blanket Bai X;Padman R;Airoldi E; Pro-ceedings of the International Workshop on Mining for and from the Semantic Web (MSW 2004) 2004,
[4]
Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classfication of Reviews P.Turney; 2002,