学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于聚类的增量数据挖掘研究
被引:0
作者
:
陈峰
论文数:
0
引用数:
0
h-index:
0
机构:
大连海事大学
大连海事大学
陈峰
机构
:
[1]
大连海事大学
关键词
:
聚类;
增量式数据挖掘;
密度;
DBSCAN算法;
D O I
:
暂无
年度学位
:
2007
学位类型
:
硕士
导师
:
陈如亮;
摘要
:
聚类分析向来是数据挖掘研究的重要方面,基于聚类的各种数据挖掘算法的研究历来也是研究重点。但是,目前大多数的聚类分析算法只是针对于静态数据集的操作,对于动态数据集却只能采取对整个数据集重新进行聚类的方式,因此随着数据量的不断增大以及对数据集实时数据挖掘的需求不断加大,增量式数据挖掘技术正越来越引人关注。 基于聚类的增量式数据挖掘继承了已有聚类的执行成果,通过对新增数据的逐个或者批量考查,可在很大程度上避免大量的重复计算,减少了计算量,节省了系统开支,提高了效率,尤其数据量越大时,增量式的数据挖掘技术就越能体现出其优越性,也更能为有数据挖掘需求的用户提供及时、快捷、有价值的信息内容。 本文首先主要总结、探讨了关于数据挖掘以及聚类算法等方面取得的已有主要研究成果,并详细阐释了基于密度的聚类算法DBSCAN的主要思想、算法流程,并给出了实例以演示算法。在此基础上,提出了基于DBSCAN的增量式聚类算法Incremental DBSCAN,由于Incremental DBSCAN采用了逐个考察新增数据的处理方式,为了达到更好的运行效率,进一步提出了Incremental DBSCAN的批量处理算法。 最后,通过实验验证了DBSCAN与Incremental DBSCAN在聚类效果上的一致性,以及Incremental DBSCAN在大数据量环境下更加卓越的性能。
引用
收藏
页数:76
共 15 条
[1]
一种基于关联规则的增量数据挖掘算法
[J].
论文数:
引用数:
h-index:
机构:
宋中山
;
成林辉
论文数:
0
引用数:
0
h-index:
0
机构:
中南民族大学计算机科学学院
成林辉
;
吴立峰
论文数:
0
引用数:
0
h-index:
0
机构:
中南民族大学计算机科学学院
吴立峰
.
湖北大学学报(自然科学版),
2006,
(03)
:240
-243
[2]
基于相对密度的聚类算法
[J].
刘青宝
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学信息系统与管理学院
刘青宝
;
邓苏
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学信息系统与管理学院
邓苏
;
论文数:
引用数:
h-index:
机构:
张维明
.
科学技术与工程,
2006,
(15)
:2272
-2276
[3]
增量聚类综述及增量DBSCAN聚类算法研究
[J].
论文数:
引用数:
h-index:
机构:
徐新华
;
论文数:
引用数:
h-index:
机构:
谢永红
.
华北航天工业学院学报,
2006,
(02)
:15
-17
[4]
增量式K-Medoids聚类算法
[J].
高小梅
论文数:
0
引用数:
0
h-index:
0
机构:
中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院天津,天津,天津
高小梅
;
冯云
论文数:
0
引用数:
0
h-index:
0
机构:
中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院天津,天津,天津
冯云
;
冯兴杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院天津,天津,天津
冯兴杰
.
计算机工程,
2005,
(S1)
:181
-183
[5]
数据挖掘算法研究与综述
[J].
论文数:
引用数:
h-index:
机构:
邹志文
;
论文数:
引用数:
h-index:
机构:
朱金伟
.
计算机工程与设计,
2005,
(09)
:2304
-2307
[6]
用于数据挖掘的聚类算法
[J].
姜园
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学信息与通信工程研究所,浙江大学信息与通信工程研究所,浙江大学信息与通信工程研究所,解放军信息工程大学杭州解放军信息工程大学郑州,杭州,杭州,郑州
姜园
;
论文数:
引用数:
h-index:
机构:
张朝阳
;
论文数:
引用数:
h-index:
机构:
仇佩亮
;
周东方
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学信息与通信工程研究所,浙江大学信息与通信工程研究所,浙江大学信息与通信工程研究所,解放军信息工程大学杭州解放军信息工程大学郑州,杭州,杭州,郑州
周东方
.
电子与信息学报,
2005,
(04)
:655
-662
[7]
基于反洗钱应用的一种有效的增量聚类算法
[J].
孙小林
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机科学与技术学院
孙小林
;
卢正鼎
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机科学与技术学院
卢正鼎
.
华中科技大学学报(自然科学版),
2004,
(11)
:85
-87
[8]
增量式CURE聚类算法研究
[J].
冯兴杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国民用航空学院计算机科学与技术学院,南开大学软件科学学院天津,南开大学软件科学学院,天津,天津
冯兴杰
;
黄亚楼
论文数:
0
引用数:
0
h-index:
0
机构:
中国民用航空学院计算机科学与技术学院,南开大学软件科学学院天津,南开大学软件科学学院,天津,天津
黄亚楼
.
小型微型计算机系统,
2004,
(10)
:1847
-1849
[9]
数据仓库中基于密度的批量增量聚类算法
[J].
黄永平
论文数:
0
引用数:
0
h-index:
0
机构:
云南大学计算机科学系,云南大学计算机科学系昆明,昆明
黄永平
;
论文数:
引用数:
h-index:
机构:
邹力鹍
.
计算机工程与应用,
2004,
(29)
:206
-208+225
[10]
基于DBSCAN聚类算法的研究与实现
[J].
论文数:
引用数:
h-index:
机构:
荣秋生
;
论文数:
引用数:
h-index:
机构:
颜君彪
;
论文数:
引用数:
h-index:
机构:
郭国强
.
计算机应用,
2004,
(04)
:45
-46+61
←
1
2
→
共 15 条
[1]
一种基于关联规则的增量数据挖掘算法
[J].
论文数:
引用数:
h-index:
机构:
宋中山
;
成林辉
论文数:
0
引用数:
0
h-index:
0
机构:
中南民族大学计算机科学学院
成林辉
;
吴立峰
论文数:
0
引用数:
0
h-index:
0
机构:
中南民族大学计算机科学学院
吴立峰
.
湖北大学学报(自然科学版),
2006,
(03)
:240
-243
[2]
基于相对密度的聚类算法
[J].
刘青宝
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学信息系统与管理学院
刘青宝
;
邓苏
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学信息系统与管理学院
邓苏
;
论文数:
引用数:
h-index:
机构:
张维明
.
科学技术与工程,
2006,
(15)
:2272
-2276
[3]
增量聚类综述及增量DBSCAN聚类算法研究
[J].
论文数:
引用数:
h-index:
机构:
徐新华
;
论文数:
引用数:
h-index:
机构:
谢永红
.
华北航天工业学院学报,
2006,
(02)
:15
-17
[4]
增量式K-Medoids聚类算法
[J].
高小梅
论文数:
0
引用数:
0
h-index:
0
机构:
中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院天津,天津,天津
高小梅
;
冯云
论文数:
0
引用数:
0
h-index:
0
机构:
中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院天津,天津,天津
冯云
;
冯兴杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院,中国民航学院计算机科学与技术学院天津,天津,天津
冯兴杰
.
计算机工程,
2005,
(S1)
:181
-183
[5]
数据挖掘算法研究与综述
[J].
论文数:
引用数:
h-index:
机构:
邹志文
;
论文数:
引用数:
h-index:
机构:
朱金伟
.
计算机工程与设计,
2005,
(09)
:2304
-2307
[6]
用于数据挖掘的聚类算法
[J].
姜园
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学信息与通信工程研究所,浙江大学信息与通信工程研究所,浙江大学信息与通信工程研究所,解放军信息工程大学杭州解放军信息工程大学郑州,杭州,杭州,郑州
姜园
;
论文数:
引用数:
h-index:
机构:
张朝阳
;
论文数:
引用数:
h-index:
机构:
仇佩亮
;
周东方
论文数:
0
引用数:
0
h-index:
0
机构:
浙江大学信息与通信工程研究所,浙江大学信息与通信工程研究所,浙江大学信息与通信工程研究所,解放军信息工程大学杭州解放军信息工程大学郑州,杭州,杭州,郑州
周东方
.
电子与信息学报,
2005,
(04)
:655
-662
[7]
基于反洗钱应用的一种有效的增量聚类算法
[J].
孙小林
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机科学与技术学院
孙小林
;
卢正鼎
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机科学与技术学院
卢正鼎
.
华中科技大学学报(自然科学版),
2004,
(11)
:85
-87
[8]
增量式CURE聚类算法研究
[J].
冯兴杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国民用航空学院计算机科学与技术学院,南开大学软件科学学院天津,南开大学软件科学学院,天津,天津
冯兴杰
;
黄亚楼
论文数:
0
引用数:
0
h-index:
0
机构:
中国民用航空学院计算机科学与技术学院,南开大学软件科学学院天津,南开大学软件科学学院,天津,天津
黄亚楼
.
小型微型计算机系统,
2004,
(10)
:1847
-1849
[9]
数据仓库中基于密度的批量增量聚类算法
[J].
黄永平
论文数:
0
引用数:
0
h-index:
0
机构:
云南大学计算机科学系,云南大学计算机科学系昆明,昆明
黄永平
;
论文数:
引用数:
h-index:
机构:
邹力鹍
.
计算机工程与应用,
2004,
(29)
:206
-208+225
[10]
基于DBSCAN聚类算法的研究与实现
[J].
论文数:
引用数:
h-index:
机构:
荣秋生
;
论文数:
引用数:
h-index:
机构:
颜君彪
;
论文数:
引用数:
h-index:
机构:
郭国强
.
计算机应用,
2004,
(04)
:45
-46+61
←
1
2
→