基于多项式核的结构化有向树数据聚类算法

被引:4
作者
丁军娣 [1 ,2 ]
马儒宁 [3 ]
陈松灿 [2 ]
机构
[1] 南京理工大学计算机科学与技术学院
[2] 南京航空航天大学信息科学与技术学院
[3] 南京航空航天大学理学院
关键词
数据聚类; 多项式核; 邻域密度因子; 有向树; 图论; 重叠数据; 结构性作用; 结构化聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
各个点在数据内部的组织结构中自然地扮演着3种不同的结构性角色,分别是毂、质心和野值.在基于邻域的聚类算法中,邻域密度因子能够识别分离数据集中的毂、质心和野值.但是,邻域密度因子对有噪声和重叠的数据往往失效.为了解决该问题,引入了基于多项式核的邻域密度因子,并在有向树框架下,提出了一种结构化的数据聚类算法,其计算复杂度线性于输入数据的大小.对带有噪声和重叠的数据集,该算法能够找到所有显著的、任意形状的不均衡聚类.在人工和真实数据集上的实验结果都证实了该算法的有效性和快速性.
引用
收藏
页码:3147 / 3160
页数:14
相关论文
共 2 条
[1]  
A theory of proximity based clustering: structure detection by optimization[J] . Jan Puzicha,Thomas Hofmann,Joachim M. Buhmann.Pattern Recognition . 2000 (4)
[2]  
Clustering through ranking on manifolds. Breitenbach M,Grudic GZ. Proc.of the22nd Int’l Conf.on Machine Learning(ICML2005) . 2005