维吾尔语情感分类算法

被引：12

作者：

田生伟 ^{[1
]}

禹龙 ^{[2
]}

王宇光 ^{[1
]}

机构：

[1] 新疆大学软件学院

[2] 新疆大学网络中心

来源：

计算机工程与应用 | 2011年 / 36期

关键词：

维吾尔语; 情感分类; 语言模型;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

情感分类是一项具有实用价值的分类技术。目前英语和汉语的情感分类的研究比较多,而针对维吾尔语的研究较少。以n-gram模型作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,选择不同的特征数量,以NaǐveBayes、ME(最大熵)和SVM(支持向量机)作为不同的文本分类方法,分别进行了维吾尔语情感分类实验,并对实验结果进行了比较,结果表明:采用UniGrams特征表示方法、在5000个特征数量和合适的特征选择函数,ME和SVM对维吾尔语情感分类能取得较好的效果。

引用

页码：147 / 150

页数：4

共 4 条

[1]

基于语义理解的文本倾向性识别机制 [J].

徐琳宏 ;

林鸿飞 ;

杨志豪 .

中文信息学报, 2007, (01) :96-100

[2]

汉语句子语义极性分析和观点抽取方法的研究 [J].

娄德成 ;

姚天昉 .

计算机应用, 2006, (11) :2622-2625

[3]

Sentiment extraction from unstruc-tured text using tabu search-enhanced Markov blanket Bai X;Padman R;Airoldi E; Pro-ceedings of the International Workshop on Mining for and from the Semantic Web (MSW 2004) 2004,

[4]

Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classfication of Reviews P.Turney; 2002,

← 1 →