一种新的基于距离加权的模板约简K近邻算法

被引:13
作者
杨金福
宋敏
李明爱
机构
[1] 北京工业大学电子信息与控制工程学院
基金
北京市自然科学基金;
关键词
模式识别; 距离加权; 模板约简; K近邻(KNN);
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
作为一种非参数的分类算法,K近邻(KNN)算法简单有效并且易于实现。但传统的KNN算法认为所有的近邻样本贡献相等,这就使得算法容易受到噪声的干扰,同时对于大的数据集,KNN的计算代价非常大。针对上述问题,该文提出了一种新的基于距离加权的模板约简K近邻算法(TWKNN)。利用模板约简技术,将训练集中远离分类边界的样本去掉,同时按照各个近邻与待测样本的距离为K个近邻赋予不同的权值,增强了算法的鲁棒性。实验结果表明,该方法可以有效地减少训练样本数目,同时还能保持传统KNN的分类精度。
引用
收藏
页码:2378 / 2383
页数:6
相关论文
共 5 条
[1]   Optimized algorithms for predictive range and KNN queries on moving objects [J].
Zhang, Rui ;
Jagadish, H. V. ;
Dai, Bing Tian ;
Ramamohanarao, Kotagiri .
INFORMATION SYSTEMS, 2010, 35 (08) :911-932
[2]   Noise reduction for instance-based learning with a local maximal margin approach [J].
Segata, Nicola ;
Blanzieri, Enrico ;
Delany, Sarah Jane ;
Cunningham, Padraig .
JOURNAL OF INTELLIGENT INFORMATION SYSTEMS, 2010, 35 (02) :301-331
[3]   Efficiency analysis of KNN and minimum distance-based classifiers in enzyme family prediction [J].
Nasibov, Efendi ;
Kandemir-Cavas, Cagin .
COMPUTATIONAL BIOLOGY AND CHEMISTRY, 2009, 33 (06) :461-464
[4]   Reduction techniques for instance-based learning algorithms [J].
Wilson, DR ;
Martinez, TR .
MACHINE LEARNING, 2000, 38 (03) :257-286
[5]  
K nearest neighbor queriesand kNN-joins in large relational databases (almost)for free .2 Yao Bin,Li Fei Fei,Kumar P. IEEE 26th International Conference on Data Engineering (ICDE) . 2010