数据挖掘中聚类分析算法的研究与应用

被引:0
作者
李仁义
机构
[1] 电子科技大学
关键词
数据挖掘; 聚类分析; 模糊聚类分析;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
随着数据的收集与存储技术的快速发展,使得目前世界上的各个组织机构可以存储海量的数据。正是因为数据量的巨大,也使得传统的靠人工分析技术遇到了发展瓶颈,怎样从海量数据中高效的发现有价值有意义的信息已经成为数据挖掘的主要研究方向以及驱动其快速发展的一个重要因素。作为一个新兴的交叉学科,聚类分析技术以其在数据挖掘过程中的独特地位以其在现实生活中的广阔应用,使其成为目前一个十分活跃的研究方向。从目前的情况来看,所有的聚类算法几乎都是针对特定数据对象所设计的,没有一种算法能够做到“放之四海而皆准”,每一种聚类算法都起自身的优点和局限性。 本文在简单介绍了数据挖掘的相关知识之后,重点介绍了数据挖掘的聚类分析方法,并且以聚类分析算法的分类为基础,详细介绍了每种聚类分析算法中的典型聚类算法,并且给出了各种典型算法的优缺点的介绍。 在对聚类分析技术有深入了解之后对聚类分析的DBSCAN算法、层次聚类算法模糊聚类分析的传递闭包算法与实际应用相结合做了若干数值试验,得出了一些有价值的实验结果,对传统的K-means算法本文结合了基于密度的思想,给出了一种改进算法,进而提高了K-means算法的聚类稳定性,同时给出了一种改进的子空间聚类算法的思想,以及在选择聚类算法时应考虑的因素给了一点建议。
引用
收藏
页数:65
共 22 条
[1]
Automatic subspace clustering of high dimensional data [J].
Agrawal, R ;
Gehrke, J ;
Gunopulos, D ;
Raghavan, P .
DATA MINING AND KNOWLEDGE DISCOVERY, 2005, 11 (01) :5-33
[2]
Note on the relationship between probabilistic and fuzzy clustering [J].
Wang, ST ;
Chung, KF ;
Shen, HB ;
Zhu, RQ .
SOFT COMPUTING, 2004, 8 (07) :523-526
[3]
WaveCluster:: a wavelet-based clustering approach for spatial data in very large databases [J].
Sheikholeslami, G ;
Chatterjee, S ;
Zhang, AD .
VLDB JOURNAL, 2000, 8 (3-4) :289-304
[4]
Data clustering.[J].A. K. Jain;M. N. Murty;P. J. Flynn.ACM Computing Surveys (CSUR).1999, 3
[5]
数据挖掘理论与应用.[M].胡可云; 田凤占; 黄厚宽; 编著.北京交通大学出版社.2008,
[6]
模糊数学及其应用.[M].梁保松; 曹殿立; 主编.科学出版社.2007,
[7]
数据挖掘导论.[M].(美)Pang-NingTan;(美)MichaelSteinbach;(美)VipinKumar著;范明;范宏建等译;.人民邮电出版社.2006,
[8]
模糊数学及其应用.[M].李安贵[等]编著;.冶金工业出版社.2005,
[9]
知识发现.[M].史忠植著;.清华大学出版社.2002,
[10]
数据挖掘.[M].朱明编著;.中国科学技术大学出版社.2002,