高阶异构数据模糊联合聚类算法

被引:12
作者
黄少滨
杨欣欣
申林山
李艳梅
机构
[1] 哈尔滨工程大学计算机科学与技术学院
关键词
高阶异构数据; 联合聚类; 模糊聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
为了更有效地分析聚簇重叠部分高阶异构数据的聚簇结果,提出了一种高阶异构数据模糊联合聚类(HFCC)算法,该算法最小化每个特征空间中对象与聚簇中心的加权距离。推导出对象隶属度和特征权重的迭代更新公式,设计出聚类过程的迭代算法,并且从理论上证明了该迭代算法的收敛性。另外,通过泛化XB指标,提出适用于评估高阶异构数据聚类质量的指标GXB,用于判断聚簇数目。实验表明,HFCC算法能够有效探测数据内部隐藏的重叠聚簇结构,并且HFCC算法聚类效果明显优于5种有代表性的硬划分算法,此外GXB指标能够有效判定高阶异构数据的聚簇数目。
引用
收藏
页码:15 / 24
页数:10
相关论文
共 2 条
[1]
Parameter-less co-clustering for star-structured heterogeneous data[J] Dino Ienco;Céline Robardet;Ruggero G. Pensa;Rosa Meo Data Mining and Knowledge Discovery 2013,
[2]
机器学习及其应用[M] 周志华; 王珏; 主编 清华大学出版社 2007,