用于数据挖掘的聚类算法

被引:72
作者
姜园
张朝阳
仇佩亮
周东方
机构
[1] 浙江大学信息与通信工程研究所
[2] 解放军信息工程大学 杭州 解放军信息工程大学 郑州
[3] 杭州
[4] 郑州
关键词
数据挖掘; 聚类; 分层聚类; 分割聚类; K-Means;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据挖掘用于从超大规模数据库中提取感兴趣的信息。聚类是数据挖掘的重要工具,根据数据间的相似性 将数据库分成多个类,每类中数据应尽可能相似。从机器学习的观点来看,类相当于隐藏模式,寻找类是无监督学 习过程。目前已有应用于统计、模式识别、机器学习等不同领域的几十种聚类算法。该文对数据挖掘中的聚类算法 进行了归纳和分类,总结了7类算法并分析了其性能特点。
引用
收藏
页码:655 / 662
页数:8
相关论文
共 21 条
[1]   TGSOM:一种用于数据聚类的动态自组织映射神经网络 [J].
王莉 ;
王正欧 .
电子与信息学报, 2003, (03) :313-319
[2]   一种基于Markov链模型的动态聚类方法 [J].
邢永康 ;
马少平 ;
不详 .
计算机研究与发展 , 2003, (02) :129-135
[3]   用SOM聚类实现多级高维点数据索引 [J].
杨志荣 ;
李磊 .
计算机研究与发展, 2003, (01) :100-106
[4]   基于模糊聚类和Naive Bayes方法的文本分类器 [J].
杨岳湘 ;
田艳芳 ;
王韶红 .
计算机工程与科学, 2002, (05) :18-21
[5]   一种有效的大规模数据的分类方法 [J].
张艳宁 ;
赵荣椿 ;
梁怡 .
电子学报, 2002, (10) :1533-1535
[6]   一种改进的基于遗传算法的聚类分析方法 [J].
李碧 ;
雍正正 .
电路与系统学报, 2002, (03) :96-99
[7]   免疫进化聚类算法 [J].
刘静 ;
钟伟才 ;
刘芳 ;
焦李成 .
电子学报, 2001, (S1) :1868-1872
[8]   极大熵聚类算法及其全局收敛性分析 [J].
张志华 ;
郑南宁 ;
史罡 .
中国科学E辑:技术科学, 2001, (01) :59-70
[9]   模糊c-均值聚类算法中加权指数m的研究 [J].
高新波 ;
裴继红 ;
谢维信 .
电子学报, 2000, (04) :80-83
[10]   模糊聚类和模糊模式识别技术在通信设备抗干扰性能评估系统中的应用 [J].
沈越泓 ;
益晓新 ;
徐发强 ;
李兴国 .
电子科学学刊, 2000, (02) :210-217