采用属性聚类的高维子空间聚类算法

被引:13
作者
牛琨 [1 ]
张舒博 [2 ]
陈俊亮 [1 ]
机构
[1] 北京邮电大学网络与交换技术国家重点实验室
[2] 中国电信北京研究院决策研究部
关键词
子空间聚类; 高维数据; 属性聚类;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意2个非冗余属性的相关度,进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.
引用
收藏
页码:1 / 5
页数:5
相关论文
共 1 条
[1]  
Rakesh Agrawal,Johannes Gehrke,Dimitrios Gunopulos,Prabhakar Raghavan.Automatic Subspace Clustering of High Dimensional Data[J].Data Min. Knowl. Discov.,2005