大规模交易数据库的一种有效聚类算法(英文)

被引:50
作者
陈宁
陈安
周龙骧
机构
[1] 中国科学院数学与系统科学研究院!北京
[2] 北京航空航天大学管理学院!北京
关键词
数据挖掘; 聚类分析; 层次聚类; 单连距离;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
研究大规模交易数据库的聚类问题 ,提出了一种二次聚类算法—— CATD.该算法首先将数据库划分成若干分区 ,在每个分区内利用层次聚类算法进行局部聚类 ,把交易初步划分成若干亚聚类 ,亚聚类的个数由聚类间的距离参数控制 .然后对所有的亚聚类进行全局聚类 ,同时识别出噪声 .由于采用了分区方法和聚类的支持向量表示法 ,该算法只需扫描一次数据库 ,聚类过程在内存中进行 ,因此能处理大规模的数据库 .
引用
收藏
页码:475 / 484
页数:10
相关论文
empty
未找到相关数据