基于kNN的快速WEB文档分类

被引:13
作者
李杨
曾海泉
刘庆华
胡运发
机构
[1] 复旦大学计算机系数据库中心
[2] 江西省南昌高等专科学校计算机系
[3] 复旦大学计算机系数据库中心 上海
[4] 上海
[5] 江西南昌
关键词
文档分类; kNN; 快速分类; 排类算法;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
根据测试文档在各个样本类中的分布情况 ,发现了基于 k NN分类的两个有助于减少大量计算的重要性质 ,在此基础上提出了两个重要算法 :排类算法和归类算法 ,从而构建了一个基于 k NN的快速 Web文档分类方法 .理论与实验表明 ,这种方法可以在不影响原有准确率的条件下 ,可提高文档的分类速度
引用
收藏
页码:725 / 729
页数:5
相关论文
共 2 条
[1]  
Optimal Selection of Reference Set for the NearestNeighbor Classification by Tabu Search[J]. 张鸿宾,孙广煜.Journal of Computer Science and Technology. 2001(02)
[2]   Fitness functions in editing k-NN reference set by genetic algorithms [J].
Kuncheva, LI .
PATTERN RECOGNITION, 1997, 30 (06) :1041-1049