基于改进KNFL算法的海量文本分类研究

被引:3
作者
张先飞
李弼程
刘安斐
机构
[1] 河南省郑州解放军信息工程学院信息科学系
基金
河南省教育厅基金;
关键词
K最近特征线; 离群点; 类中心距;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
KNFL算法是近年来在人脸识别领域提出并广泛应用的分类算法,它认为类空间中两点的连线可以比类内的点更能代表类空间的特征。如果仅依据特征线距离来分类,会造成误分。这里为消除类内离群点对分类的影响提出引入加权系数,并结合类中心距的概念提出改进算法,并将其应用到海量文本分类中去。试验结果证明此改进算法能够提高文本分类精度,很好的降低了分类器对训练规模的要求。
引用
收藏
页码:164 / 165+168
页数:3
相关论文
共 1 条
[1]   利用改进NFL算法对镜头进行基于内容的检索 [J].
赵黎 ;
杨士强 ;
祁卫 ;
李子青 ;
张宏江 .
软件学报, 2002, (04) :586-590