一种基于增量学习型矢量量化的有效文本分类算法

被引:13
作者
王修君
沈鸿
机构
[1] 中国科学技术大学计算机科学与技术系
关键词
学习型矢量量化(LVQ); 生长型神经气(GNG); 学习误差; 类间距离; 学习概率;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
KNN作为一种简单的分类方法在文本分类中有广泛的应用,但存在着计算量大和训练文档分布不均所造成的分类准确率下降等问题.针对这些问题,基于最小化学习误差的增量思想,该文将学习型矢量量化(LVQ)和生长型神经气(GNG)结合起来提出一种新的增量学习型矢量量化方法,并将其应用到文本分类中.文中提出的算法对所有的训练样本有选择性地进行一次训练就可以生成有效的代表样本集,具有较强的学习能力.实验结果表明:这种方法不仅可以降低KNN方法的测试时间,而且可以保持甚至提高分类的准确性.
引用
收藏
页码:1277 / 1285
页数:9
相关论文
共 3 条
[1]   一种改进的快速k-近邻分类算法 [J].
乔玉龙 ;
潘正祥 ;
孙圣和 .
电子学报, 2005, (06) :1146-1149
[2]   基于密度的kNN文本分类器训练样本裁剪方法 [J].
李荣陆 ;
胡运发 .
计算机研究与发展, 2004, (04) :539-545
[3]  
矩阵计算.[M].[美]G·H·戈卢布;C·F·范洛恩 著;袁亚湘等 译.科学出版社.2001,