共 1 条
一种混合属性数据流聚类算法
被引:22
作者:
杨春宇
周杰
机构:
[1] 清华大学自动化系
[2] 清华大学自动化系 北京
来源:
关键词:
数据挖掘;
数据流;
聚类分析;
混合属性;
泊松过程;
D O I:
暂无
中图分类号:
TP301.6 [算法理论];
学科分类号:
081202 ;
摘要:
数据流聚类是数据流挖掘中的重要问题.现实世界中的数据流往往同时具有连续属性和标称属性,但现有算法局限于仅处理其中一种属性,而对另一种采取简单舍弃的办法.目前还没有能在算法层次上进行混合属性数据流聚类的算法.文中提出了一种针对混合属性数据流的聚类算法;建立了数据流到达的泊松过程模型;用频度直方图对离散属性进行了描述;给出了混合属性条件下微聚类生成、更新、合并和删除算法.在公共数据集上的实验表明,文中提出的算法具有鲁棒的性能.
引用
收藏
页码:1364 / 1371
页数:8
相关论文