基于k最近邻网络的数据聚类算法

被引:20
作者
金弟 [1 ,2 ]
刘杰 [1 ,2 ,3 ]
贾正雪 [4 ]
刘大有 [1 ,2 ]
机构
[1] 吉林大学计算机科学与技术学院
[2] 吉林大学符号计算与知识工程教育部重点实验室
[3] 复旦大学智能信息处理上海市重点实验室
[4] 一汽大众汽车有限公司
关键词
数据挖掘; 数据聚类; k最近邻网络; 复杂网络聚类;
D O I
10.16451/j.cnki.issn1003-6059.2010.04.012
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
聚类研究在数据挖掘研究领域中占有十分重要的地位.虽然目前已有很多数据聚类算法,但精度仍不够理想.文中提出一个基于结构化相似度的网络聚类算法(SSNCA),试图从网络聚类角度进一步提高数据聚类精度.具体解决方案是,将待聚类的向量数据集转化为k最近邻网络,并用SSNCA对该网络进行聚类.将SSNCA与c-Means、仿射传播进行比较,实验表明文中算法得到的目标函数稍差,但聚类精度要明显高于这两个算法.
引用
收藏
页码:546 / 551
页数:6
相关论文
共 5 条
[1]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[2]   A tutorial on spectral clustering [J].
von Luxburg, Ulrike .
STATISTICS AND COMPUTING, 2007, 17 (04) :395-416
[3]   k-nearest-neighbor clustering and percolation theory [J].
Teng, Shang-Hua ;
Yao, Frances F. .
ALGORITHMICA, 2007, 49 (03) :192-211
[4]  
BIRCH: A New Data Clustering Algorithm and Its Applications[J] . Tian Zhang,Raghu Ramakrishnan,Miron Livny.Data Min. Knowl. Discov. . 1997 (2)
[5]  
SCAN: a structural clustering algorithmfor networks .2 Xu X W,Yuruk N,Feng Z D,Schweiger T A J. Proceedings of the 13th ACM SIGKDD International Conferenceon Knowledge Discovery and Data Mining . 2007