一种基于双层窗口的概念漂移数据流分类算法

被引:20
作者
朱群
张玉红
胡学钢
李培培
机构
[1] 合肥工业大学计算机与信息学院
基金
安徽省自然科学基金;
关键词
数据流; 概念漂移; 分类; 随机决策树; 滑动窗口;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据流中概念漂移问题的研究已成为近年来流数据挖掘领域的研究热点之一.已有的研究工作多依据单窗口中错误率的变化来检测概念漂移,难以适应不同类型的漂移.为此,本文提出一种新的基于双层窗口机制的数据流分类算法(Double-windows-based classification algorithm for concept drifting data streams,DWCDS),该算法采用随机决策树模型构建集成分类器,利用双层窗口机制周期性地检测滑动窗口中流数据分布的变化,并动态地更新模型以适应概念漂移.分析与实验结果表明:该算法可以快速有效地跟踪检测含噪数据流中的概念漂移,且抗噪性能与分类精度显著提高.
引用
收藏
页码:1077 / 1084
页数:8
相关论文
共 6 条
[1]   基于多分类器的数据流中的概念漂移挖掘 [J].
孙岳 ;
毛国君 ;
刘旭 ;
刘椿年 .
自动化学报, 2008, (01) :93-97
[2]   A Semi-Random Multiple Decision-Tree Algorithm for Mining Data Streams [J].
胡学钢 ;
李培培 ;
吴信东 ;
吴共庆 .
JournalofComputerScience&Technology, 2007, (05) :711-724
[3]   A RANDOM DECISION TREE ENSEMBLE FOR MINING CONCEPT DRIFTS FROM NOISY DATA STREAMS [J].
Li, Peipei ;
Wu, Xindong ;
Hu, Xuegang ;
Liang, Qianhui ;
Gao, Yunjun .
APPLIED ARTIFICIAL INTELLIGENCE, 2010, 24 (07) :680-710
[4]   Issues in data stream management [J].
Golab, L ;
Özsu, MT .
SIGMOD RECORD, 2003, 32 (02) :5-14
[5]   Learning in the presence of concept drift and hidden contexts [J].
Widmer, G ;
Kubat, M .
MACHINE LEARNING, 1996, 23 (01) :69-101
[6]  
Using Additive Expert Ensembles to Cope with Concept Drift .2 Jeremy Z. Kolter,Marcus A. Maloof. Proceedings of the 22nd International Conference on Machine Learning . 2005