基于密度与近邻传播的数据流聚类算法

被引:28
作者
张建朋
陈福才
李邵梅
刘力雄
机构
[1] 国家数字交换系统工程技术研究中心
基金
国家高技术研究发展计划(863计划);
关键词
数据流挖掘; 近邻传播; 基于密度聚类; 变化检测;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对现有算法聚类精度不高、处理离群点能力较差以及不能实时检测数据流变化的缺陷,提出一种基于密度与近邻传播融合的数据流聚类算法.该算法采用在线/离线两阶段处理框架,通过引入微簇衰减密度来精确反映数据流的演化信息,并采用在线动态维护和删减微簇机制,使算法模型更符合原始数据流的内在特性.同时,当模型中检测到新的类模式出现时,采用一种改进的加权近邻传播聚类(Weighted and hierarchical affinity propagation,WAP)算法对模型进行重建,因而能够实时检测到数据流的变化,并能给出任意时间的聚类结果.在真实数据集和人工数据集上的实验表明,该算法具有良好的适用性、有效性和可扩展性,能够取得较好的聚类效果.
引用
收藏
页码:277 / 288
页数:12
相关论文
共 7 条
[1]  
一种基于密度的空间数据流在线聚类算法[J]. 于彦伟,王沁,邝俊,何杰.自动化学报. 2012(06)
[2]   一种基于双层窗口的概念漂移数据流分类算法 [J].
朱群 ;
张玉红 ;
胡学钢 ;
李培培 .
自动化学报, 2011, 37 (09) :1077-1084
[3]   一种基于时态密度的倾斜分布数据流聚类算法 [J].
杨宁 ;
唐常杰 ;
王悦 ;
陈瑜 ;
郑皎凌 .
软件学报, 2010, 21 (05) :1031-1041
[4]   基于密度的混合属性数据流聚类算法 [J].
黄德才 ;
吴天虹 .
控制与决策, 2010, 25 (03) :416-421
[5]   自适应仿射传播聚类 [J].
王开军 ;
张军英 ;
李丹 ;
张新娜 ;
郭涛 .
自动化学报, 2007, (12) :1242-1246
[6]   Stream Data Clustering Based on Grid Density and Attraction [J].
Tu, Li ;
Chen, Yixin .
ACM TRANSACTIONS ON KNOWLEDGE DISCOVERY FROM DATA, 2009, 3 (03)
[7]  
Data streaming with affinity propagation .2 Zhang X,Furtlehner C,Sebag M. Proceedings of the 2008 Machine Learning and Knowledge Discovery in Databases . 2008