最近邻分类的多代表点学习算法

被引:18
作者
陈黎飞
郭躬德
机构
[1] 福建师范大学数学与计算机科学学院
关键词
近邻分类; 分类模型; 代表点; 结构风险;
D O I
10.16451/j.cnki.issn1003-6059.2011.06.023
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
经典的k-最近邻算法存在参数k难以确定和分类效率低的缺点.基于模型的kNN算法使用代表点集合构造训练样本的分类模型,克服上述缺点,但需要较高的计算时间代价.文中提出一种高效的多代表点学习算法,用于最近邻分类.运用结构风险最小化理论对影响分类模型期望风险的因素进行分析.在此基础上,使用无监督的局部聚类算法学习优化的代表点集合.在实际应用数据集上的实验结果表明,该算法可对复杂类别结构数据进行有效分类,并大幅度提高分类效率.
引用
收藏
页码:882 / 888
页数:7
相关论文
共 6 条
[1]   布尔序列的一种KNN改进算法 [J].
王振华 ;
侯忠生 ;
高颖 .
模式识别与人工智能, 2009, 22 (02) :330-336
[2]   基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[3]   Using kNN model for automatic text categorization [J].
Guo, GD ;
Wang, H ;
Bell, D ;
Bi, YX ;
Greer, K .
SOFT COMPUTING, 2006, 10 (05) :423-430
[4]  
Text Categorization with Support Vector Machines. How to Represent Texts in Input Space?[J] . Machine Learning . 2002 (1)
[5]   A tutorial on Support Vector Machines for pattern recognition [J].
Burges, CJC .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (02) :121-167
[6]  
Recent Advances in Clustering: A Brief Survey .2 Kotsiantis S,Pintelas P. WSEAS Transactions on Information Science and Applications . 2004