共 1 条
基于数据分区的并行DBSCAN算法
被引:16
作者:
何中胜
[1
]
刘宗田
[2
]
庄燕滨
[1
]
机构:
[1] 常州工学院计算机信息工程学院
[2] 上海大学计算机科学与工程学院
来源:
关键词:
大规模数据库;
聚类;
数据分区;
DBSCAN算法;
并行计算消息传送;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
DBSCAN是基于密度的聚类算法的一个典型代表算法,它对空间数据库聚类有很好的性能.然而,在对大规模数据库聚类时,DBSCAN需要大量内存支持并伴随着I/O开销.随着高性能计算机的发展,特别是集群式计算机出现,给我们提供了一种解决DBSCAN算法缺陷的方法,本文提出一种建立在集群式高性能计算机上基于数据分区并行DBSCAN算法.测试结果表明,它极大地降低了DBSCAN对时间和空间的需要.
引用
收藏
页码:114 / 116
页数:3
相关论文