共 1 条
K-最近邻的改进及其在文本分类中的应用
被引:8
作者:
寇莎莎
魏振军
机构:
[1] 信息工程大学信息工程学院
[2] 信息工程大学信息工程学院 郑州
[3] 郑州
来源:
关键词:
延拓半径;
延拓类;
延拓能力;
K最近邻算法;
D O I:
10.16366/j.cnki.1000-2367.2005.03.038
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
采用K近邻算法(Knearest neighbors,简称KNN)进行分类时,如果训练样本数量太大,那么搜索测试样本的K个最近邻时,算法的计算量很大.本文针对KNN的不足提出了一种改进方法.改进的KNN算法通过定义样本的延拓类和延拓能力,保留延拓能力强的样本作为它延拓类中其它训练样本的代表,来缩减训练样本数量,达到减少算法计算量的目的.实验证明,改进的KNN算法具有很好的性能.
引用
收藏
页码:134 / 136
页数:3
相关论文