共 4 条
邻域平衡密度聚类算法
被引:21
作者:
武佳薇
李雄飞
孙涛
李巍
机构:
[1] 符号计算与知识工程教育部重点实验室(吉林大学)
来源:
关键词:
投影点;
邻域平衡;
平衡核心对象;
边界稀疏对象;
基于密度的聚类算法;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
聚类是数据挖掘领域的一项重要分析手段.在分析核心对象与其邻域对象的分布特征后,引入对象的投影点,对象的邻域平衡、平衡核心对象、边界稀疏对象等概念.提出一种新的基于密度的聚类算法bDBSCAN(balance-DBSCAN).算法将核心对象邻域中的对象投影,进行向量单位化,考察核心对象的邻域平衡性,将与平衡核心对象平衡密度可达的对象聚成一个簇.理论分析和实验结果表明,算法可以处理任意形状的簇,有效地排除边界稀疏对象这类噪声,并且可以解决高维数据聚类边界区分不明显、噪声对象多等问题,提高了聚类精度.算法的时间复杂度与DBSCAN近似.
引用
收藏
页码:1044 / 1052
页数:9
相关论文