基于时间衰减的分布式数据流聚类算法

被引:2
作者
陈春燕 [1 ]
吕俊龙 [2 ]
郭有强 [2 ]
机构
[1] 蚌埠医学院
[2] 蚌埠学院计算机科学技术系
基金
安徽省自然科学基金;
关键词
分布式数据流; 聚类; 时间衰减; 滑动窗口;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
为了发现分布式数据流环境下的微簇,针对数据流的遗忘特性,提出一种基于时间衰减的数据流聚类算法.根据衰减模型增量式的处理局部站点,将局部模型发送给中心站点.中心站点对局部站点的微簇进行合并,生成全局聚类模型.通过真实数据和仿真数据的实验表明,该算法能够得到较好的聚类质量,并且有较好的伸缩性.
引用
收藏
页码:87 / 90
页数:4
相关论文
共 3 条
[1]
基于遗忘特性的数据流概要结构及其应用研究 [D]. 
陈华辉 .
复旦大学,
2008
[2]
Distributed Data Stream Clustering:A Fast EM-based Approach..Zhou Ao-ying;Cao Feng;.Proc of 23rd Internationalconference on Data Engineering.2007,
[3]
Feature Weighting in <Emphasis Type="Italic">k</Emphasis>-Means Clustering.[J].Dharmendra S. Modha;W. Scott Spangler.Machine Learning.2003, 3