一种高效的基于采样的关联规则挖掘算法

被引：7

作者：

张永 ^{[1
]}

迟忠先 ^{[2
]}

机构：

[1] 辽宁师范大学计算机系

[2] 大连理工大学计算机科学与工程系

来源：

计算机工程与应用 | 2007年 / 02期

关键词：

采样; 关联规则; 数据挖掘;

D O I：

暂无

中图分类号：

TP311.13 [];

学科分类号：

摘要：

在事务数据集中发现项目间的关联规则是数据挖掘的一个经典问题,但传统的关联规则挖掘方法对于大事务数据集而言,执行效率相对较低。已经有研究表明,采样技术能有效地改善挖掘效率。在分析现有采样方法的基础上,提出了一种新的基于采样的高效关联规则挖掘算法ESMA。该算法采用了更加有效的双向采样策略。通过实验分析表明,该算法明显地加快了大事务数据库中采样的速度,从而降低了CPU时间,而且具有很好的可扩展性。

引用

页码：184 / 186+234 +234

页数：4

共 3 条

[1]

A Study of Two Sampling Methods for Analyzing Large Datasets with ILP[J] Ashwin Srinivasan Data Mining and Knowledge Discovery 1999,

[2]

Is Sampling Useful in Data Mining? A Case in the Maintenance of Discovered Association Rules[J] S.D. Lee;David W. Cheung;Ben Kao Data Mining and Knowledge Discovery 1998,

[3]

A new two-phase sampling based algorithm for discovering association rules Chen B;Haas P;Scheuermann P; Proceedings of ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 2002,

← 1 →