数据流分类中的增量特征选择算法

被引:4
作者
李敏 [1 ]
王勇 [2 ]
蔡立军 [1 ]
机构
[1] 西北工业大学理学院
[2] 西北工业大学计算机学院
关键词
数据流分类; 信息增益; 增量特征选择; 概念漂移;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
概念流动的出现及数据的高维性增加了数据流特征选择的复杂性。信息增益是最有效的特征选择算法之一,但计算量大。对信息增益做了等价替换,提出一种基于改进信息增益的混合增量特征选择(IFS)算法。该算法首先利用与分类器无关的评价函数选出候选特征集合,然后将分类器作用于候选特征集合,利用分类精度作为评价标准去选择特征子集,在遇到概念漂移时重新选择特征子集。通过在超平面数据集和UCI数据集上的实验,表明基于IFS算法的分类器能够很快地适应概念漂移,并且比基于全部特征的分类算法有更高的精度。
引用
收藏
页码:2321 / 2323+2328 +2328
页数:4
相关论文
共 2 条
[1]   基于特征选择的轻量级入侵检测系统 [J].
陈友 ;
程学旗 ;
李洋 ;
戴磊 .
软件学报, 2007, (07) :1639-1651
[2]   Learning in the presence of concept drift and hidden contexts [J].
Widmer, G ;
Kubat, M .
MACHINE LEARNING, 1996, 23 (01) :69-101