一种基于混合集成方法的数据流概念漂移检测方法

被引:9
作者
桂林
张玉红
胡学钢
机构
[1] 合肥工业大学计算机与信息学院
基金
安徽省自然科学基金;
关键词
数据流; 概念漂移; 分类; 噪音;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
近年来,数据流分类问题研究受到了普遍关注,而漂移检测是其中一个重要的研究问题。已有的分类模型有单一集成模型和混合模型,其漂移检测机制多基于理想的分布假设。单一模型集成可能导致分类误差扩大,噪音环境下分类效果受到了一定影响,而混合集成模型多存在分类精度和时间性能难以两者兼顾的问题。为此,基于简单的WE集成框架,构建了基于决策树和bayes混合模型的集成分类方法 WE-DTB,并利用典型的概念漂移检测机制Hoeffding Bounds和μ检验来进行数据流环境下概念漂移的检测和分类。大量实验表明,WE-DTB能够有效检测概念漂移且具有较好的分类精度及时空性能。
引用
收藏
页码:152 / 155+181 +181
页数:5
相关论文
共 4 条
[1]  
数据挖掘导论[M]. 人民邮电出版社 , (美)Pang-NingTan, 2006
[2]   Learning in the presence of concept drift and hidden contexts [J].
Widmer, G ;
Kubat, M .
MACHINE LEARNING, 1996, 23 (01) :69-101
[3]  
Incremental learning from noisy data[J] . Jeffrey C. Schlimmer,Richard H. Granger.Machine Learning . 1986 (3)
[4]  
KDDCUP99data set .2 ACM Special Interest Group on Knowledge Discovery and DataMining. http://kdd.ics.uci.edu/databases/kddcup99 . 1999