邻域平衡密度聚类算法

被引:21
作者
武佳薇
李雄飞
孙涛
李巍
机构
[1] 符号计算与知识工程教育部重点实验室(吉林大学)
关键词
投影点; 邻域平衡; 平衡核心对象; 边界稀疏对象; 基于密度的聚类算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
聚类是数据挖掘领域的一项重要分析手段.在分析核心对象与其邻域对象的分布特征后,引入对象的投影点,对象的邻域平衡、平衡核心对象、边界稀疏对象等概念.提出一种新的基于密度的聚类算法bDBSCAN(balance-DBSCAN).算法将核心对象邻域中的对象投影,进行向量单位化,考察核心对象的邻域平衡性,将与平衡核心对象平衡密度可达的对象聚成一个簇.理论分析和实验结果表明,算法可以处理任意形状的簇,有效地排除边界稀疏对象这类噪声,并且可以解决高维数据聚类边界区分不明显、噪声对象多等问题,提高了聚类精度.算法的时间复杂度与DBSCAN近似.
引用
收藏
页码:1044 / 1052
页数:9
相关论文
共 4 条
  • [1] k-LDCHD——高维空间k邻域局部密度聚类算法
    倪巍伟
    孙志挥
    陆介平
    [J]. 计算机研究与发展, 2005, (05) : 784 - 791
  • [2] 一种基于参考点和密度的快速聚类算法
    马帅
    王腾蛟
    唐世渭
    杨冬青
    高军
    [J]. 软件学报, 2003, (06) : 1089 - 1095
  • [3] 基于数据分区的DBSCAN算法
    周水庚
    周傲英
    曹晶
    [J]. 计算机研究与发展, 2000, (10) : 1153 - 1159
  • [4] Density-based clustering in spatial databases: The algorithm GDBSCAN and its applications
    Sander, J
    Ester, M
    Kriegel, HP
    Xu, XW
    [J]. DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (02) : 169 - 194