K-最近邻的改进及其在文本分类中的应用

被引:8
作者
寇莎莎
魏振军
机构
[1] 信息工程大学信息工程学院
[2] 信息工程大学信息工程学院 郑州
[3] 郑州
关键词
延拓半径; 延拓类; 延拓能力; K最近邻算法;
D O I
10.16366/j.cnki.1000-2367.2005.03.038
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
采用K近邻算法(Knearest neighbors,简称KNN)进行分类时,如果训练样本数量太大,那么搜索测试样本的K个最近邻时,算法的计算量很大.本文针对KNN的不足提出了一种改进方法.改进的KNN算法通过定义样本的延拓类和延拓能力,保留延拓能力强的样本作为它延拓类中其它训练样本的代表,来缩减训练样本数量,达到减少算法计算量的目的.实验证明,改进的KNN算法具有很好的性能.
引用
收藏
页码:134 / 136
页数:3
相关论文
共 1 条
[1]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26