一种不确定数据流聚类算法

被引:35
作者
张晨 [1 ]
金澈清 [2 ]
周傲英 [2 ]
机构
[1] 复旦大学计算机科学技术学院上海市智能信息处理重点实验室
[2] 华东师范大学软件学院上海市高可信计算重点实验室
关键词
不确定数据流; 聚类; 离群点;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出了EMicro算法,以解决不确定数据流上的聚类问题.与现有技术大多仅考虑元组间的距离不同,EMicro算法综合考虑了元组之间的距离与元组自身不确定性这两个因素,同时定义新标准来描述聚类结果质量.还提出了离群点处理机制,系统同时维护两个缓冲区,分别存放正常的微簇与潜在的离群点微簇,以期得到理想的性能.实验结果表明,与现有工作相比,EMicro的效率更高,且效果良好.
引用
收藏
页码:2173 / 2182
页数:10
相关论文
共 1 条
[1]   基于数据流的任意形状聚类算法 [J].
朱蔚恒 ;
印鉴 ;
谢益煌 .
软件学报, 2006, (03) :379-387