基于支持向量的最近邻文本分类方法

被引:10
作者
古丽娜孜艾力木江 [1 ,2 ,3 ]
乎西旦居马洪 [1 ]
孙铁利 [2 ]
梁义 [1 ]
机构
[1] 伊犁师范学院电子与信息工程学院
[2] 东北师范大学计算机科学与技术学院
[3] 东北师范大学地理科学学院
关键词
词干提取; 预处理; 支持向量机; 文本分类; 分类精度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
文本分类为一个文档自动分配一组预定义的类别或主题。文本分类中,文档的表示对学习机的学习性能有很大的影响。以实现哈萨克语文本分类为目的,根据哈萨克语语法规则设计实现哈萨克语文本的词干提取,完成哈萨克语文本的预处理。提出基于最近支持向量机的样本距离公式,避免k参数的选定,以SVM与KNN分类算法的特殊组合算法(SV-NN)实现了哈萨克语文本的分类。结合自己构建的哈萨克语文本语料库的语料进行文本分类仿真实验,数值实验展示了提出算法的有效性并证实了理论结果。
引用
收藏
页码:799 / 807
页数:9
相关论文
共 19 条
[1]
文本分类中文本表示模型和特征选择算法研究 [D]. 
杨杰明 .
吉林大学,
2013
[2]
文本情感分类及观点摘要关键问题研究 [D]. 
张冬梅 .
山东大学,
2012
[3]
Comparative Analysis of Text Classification Algorithms for Automated Labelling of Quranic Verses..[J].Abdullahi Oyekunle Adeleke;Noor Azah Samsudin;Aida Mustapha;Nazri M Nawi.International Journal on Advanced Science; Engineering and Information Technology.2017, 4
[4]
Arabic Text Categorization Using Support vector machine; Naïve Bayes and Neural Network.[J].Mohammad Adel Hamdan;Alwada‘n Tariq;Al Momani Omar.GSTF Journal on Computing (JoC).2016, 1
[5]
Active learning for text classification with reusability.[J].Rong Hu;Brian Mac Namee;Sarah Jane Delany.Expert Systems With Applications.2016,
[6]
Content-based analysis to detect Arabic web spam [J].
Al-Kabi, Mohammed ;
Wahsheh, Heider ;
Alsmadi, Izzat ;
Al-Shawakfa, Emad ;
Wahbeh, Abdullah ;
Al-Hmoud, Ahmed .
JOURNAL OF INFORMATION SCIENCE, 2012, 38 (03) :284-296
[7]
Application of genetic optimized artificial immune system and neural networks in spam detection [J].
Mohammad, Adel Hamdan ;
Abu Zitar, Raed .
APPLIED SOFT COMPUTING, 2011, 11 (04) :3827-3845
[8]
Intelligent classification of web pages using contextual and visual features.[J].Ali Ahmadi;Mehran Fotouhi;Mahmoud Khaleghi.Applied Soft Computing Journal.2010, 2
[9]
K nearest neighbor method for forest inventory using remote sensing data [J].
Meng, Qingmin ;
Cieszewski, Chris J. ;
Madden, Marguerite ;
Borders, Bruce E. .
GISCIENCE & REMOTE SENSING, 2007, 44 (02) :149-165
[10]
The elements of statistical learning: data mining, inference and prediction [J].
James Franklin .
The Mathematical Intelligencer, 2005, 27 (2) :83-85