蚁群算法在KNN文本分类中的应用

被引:6
作者
殷宏威 [1 ]
赵伟 [1 ,2 ]
杨志伟 [1 ]
机构
[1] 长春工业大学计算机学院
[2] 吉林农业大学信息技术学院
关键词
KNN; 文本分类; 待测样本; 蚁群算法; 易判区域; 难判区域; 组相似度;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
摘要
作为一种经典的文本分类算法,KNN简单、实用,在许多实际系统中有广泛的应用,但若待分样本位于易判区域时,KNN却做了许多无用计算。基于此,本文提出一种改进算法,借鉴于蚁群算法,引入了组相似度这个新颖概念,使得当待测样本位于易判区域时,能很快得出判定结果;当待测样本位于难判区域时,该算法退化为KNN的原始算法。
引用
收藏
页码:159 / 163
页数:5
相关论文
共 8 条
[1]
基于向量空间模型的文本聚类算法 [J].
姚清耘 ;
刘功申 ;
李翔 .
计算机工程, 2008, (18) :39-41+44
[2]
聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[3]
中文文本分类研究附视频 [J].
郝晓燕 ;
常晓明 .
太原理工大学学报, 2006, (06) :710-713
[4]
基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[5]
医保决策支持系统中的聚类算法 [J].
张彩虹 ;
王春才 ;
颜雁 .
长春理工大学学报, 2004, (04) :41-43
[6]
中文文本分类中的特征选择研究 [J].
周茜 ;
赵明生 ;
扈旻 .
中文信息学报, 2004, (03) :17-23
[7]
中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32
[8]
应用特征聚合进行中文文本分类的改进KNN算法 [J].
张晓辉 ;
李莹 ;
王华勇 ;
赵宏 ;
不详 .
东北大学学报 , 2003, (03) :229-232