基于聚类的增量数据挖掘研究

被引:0
作者
陈峰
机构
[1] 大连海事大学
关键词
聚类; 增量式数据挖掘; 密度; DBSCAN算法;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
聚类分析向来是数据挖掘研究的重要方面,基于聚类的各种数据挖掘算法的研究历来也是研究重点。但是,目前大多数的聚类分析算法只是针对于静态数据集的操作,对于动态数据集却只能采取对整个数据集重新进行聚类的方式,因此随着数据量的不断增大以及对数据集实时数据挖掘的需求不断加大,增量式数据挖掘技术正越来越引人关注。 基于聚类的增量式数据挖掘继承了已有聚类的执行成果,通过对新增数据的逐个或者批量考查,可在很大程度上避免大量的重复计算,减少了计算量,节省了系统开支,提高了效率,尤其数据量越大时,增量式的数据挖掘技术就越能体现出其优越性,也更能为有数据挖掘需求的用户提供及时、快捷、有价值的信息内容。 本文首先主要总结、探讨了关于数据挖掘以及聚类算法等方面取得的已有主要研究成果,并详细阐释了基于密度的聚类算法DBSCAN的主要思想、算法流程,并给出了实例以演示算法。在此基础上,提出了基于DBSCAN的增量式聚类算法Incremental DBSCAN,由于Incremental DBSCAN采用了逐个考察新增数据的处理方式,为了达到更好的运行效率,进一步提出了Incremental DBSCAN的批量处理算法。 最后,通过实验验证了DBSCAN与Incremental DBSCAN在聚类效果上的一致性,以及Incremental DBSCAN在大数据量环境下更加卓越的性能。
引用
收藏
页数:76
共 15 条
[1]
一种基于关联规则的增量数据挖掘算法 [J].
宋中山 ;
成林辉 ;
吴立峰 .
湖北大学学报(自然科学版), 2006, (03) :240-243
[2]
基于相对密度的聚类算法 [J].
刘青宝 ;
邓苏 ;
张维明 .
科学技术与工程, 2006, (15) :2272-2276
[3]
增量聚类综述及增量DBSCAN聚类算法研究 [J].
徐新华 ;
谢永红 .
华北航天工业学院学报, 2006, (02) :15-17
[4]
增量式K-Medoids聚类算法 [J].
高小梅 ;
冯云 ;
冯兴杰 .
计算机工程, 2005, (S1) :181-183
[5]
数据挖掘算法研究与综述 [J].
邹志文 ;
朱金伟 .
计算机工程与设计, 2005, (09) :2304-2307
[6]
用于数据挖掘的聚类算法 [J].
姜园 ;
张朝阳 ;
仇佩亮 ;
周东方 .
电子与信息学报, 2005, (04) :655-662
[7]
基于反洗钱应用的一种有效的增量聚类算法 [J].
孙小林 ;
卢正鼎 .
华中科技大学学报(自然科学版), 2004, (11) :85-87
[8]
增量式CURE聚类算法研究 [J].
冯兴杰 ;
黄亚楼 .
小型微型计算机系统, 2004, (10) :1847-1849
[9]
数据仓库中基于密度的批量增量聚类算法 [J].
黄永平 ;
邹力鹍 .
计算机工程与应用, 2004, (29) :206-208+225
[10]
基于DBSCAN聚类算法的研究与实现 [J].
荣秋生 ;
颜君彪 ;
郭国强 .
计算机应用, 2004, (04) :45-46+61