基于区域划分的kNN文本快速分类算法研究

被引:21
作者
胡元 [1 ,2 ]
石冰 [1 ]
机构
[1] 山东大学计算机科学与技术学院
[2] 中国人民解放军部队
关键词
文本分类; kNN算法; 聚类; k-均值算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中广泛应用。为提高其分类效率,提出一种基于区域划分的kNN文本快速分类算法。将训练样本集按空间分布情况划分成若干区域,根据测试样本与各区域之间的位置关系快速查找其k个最近邻,从而大大降低kNN算法的计算量。数学推理和实验结果均表明,该算法在确保kNN分类器准确率不变的前提下,显著提高了分类效率。
引用
收藏
页码:182 / 186
页数:5
相关论文
共 19 条