一种基于聚类集成技术的混合型数据聚类算法

被引:19
作者
罗会兰 [1 ,2 ]
危辉 [2 ]
机构
[1] 江西理工大学信息工程学院
[2] 复旦大学计算机科学技术学院上海市智能信息处理重点实验室
关键词
聚类集成; 混合型数据; 相似性度量;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
提出了一种基于集成技术和谱聚类技术的混合数据聚类算法CBEST。它利用聚类集成技术产生混合数据间的相似性,这种相似性度量没有对数据特征值分布模型做任何的假设。基于此相似性度量得到的待聚类数据的相似性矩阵,应用谱聚类算法得到混合数据聚类结果。大量真实和人工数据上的实验结果验证了CBEST的有效性和它对噪声的鲁棒性。与其它混合数据聚类算法的比较研究也证明了CBEST的优越性能。CBEST还能有效融合先验知识,通过参数的调节来设置不同属性在聚类中的权重。
引用
收藏
页码:234 / 238+274 +274
页数:6
相关论文
共 2 条
[1]
Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304
[2]
Knowledge acquisition via incremental conceptual clustering.[J].Douglas H. Fisher.Machine Learning.1987, 2