学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
大规模交易数据库的一种有效聚类算法(英文)
被引:50
作者
:
论文数:
引用数:
h-index:
机构:
陈宁
陈安
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院数学与系统科学研究院!北京
陈安
论文数:
引用数:
h-index:
机构:
周龙骧
机构
:
[1]
中国科学院数学与系统科学研究院!北京
[2]
北京航空航天大学管理学院!北京
来源
:
软件学报
|
2001年
/ 04期
关键词
:
数据挖掘;
聚类分析;
层次聚类;
单连距离;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
摘要
:
研究大规模交易数据库的聚类问题 ,提出了一种二次聚类算法—— CATD.该算法首先将数据库划分成若干分区 ,在每个分区内利用层次聚类算法进行局部聚类 ,把交易初步划分成若干亚聚类 ,亚聚类的个数由聚类间的距离参数控制 .然后对所有的亚聚类进行全局聚类 ,同时识别出噪声 .由于采用了分区方法和聚类的支持向量表示法 ,该算法只需扫描一次数据库 ,聚类过程在内存中进行 ,因此能处理大规模的数据库 .
引用
收藏
页码:475 / 484
页数:10
相关论文
未找到相关数据
未找到相关数据