一种改进的KNN文本分类

被引:28
作者
钟将
刘荣辉
机构
[1] 不详
[2] 重庆大学计算机学院
[3] 不详
基金
国家自然科学基金重点项目;
关键词
特征降维; 潜在语义分析; K-最近邻法; 文本分类;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
在文本分类中,文本特征空间维数巨大以及训练样本分布不均衡等问题影响分类性能。针对这个问题,提出一种改进的KNN分类方法。利用隐含语义分析方法对特征样本空间进行降维处理;利用基于样本密度的改进的KNN分类器进行分类。实验结果表明提出的方法能够收到较好的分类效果。
引用
收藏
页码:142 / 144
页数:3
相关论文
共 2 条
[1]   基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[2]  
一种k-NN文本分类器的改进方法[J]. 巩军,刘鲁.情报学报. 2007 (01)