一种高效的基于采样的关联规则挖掘算法

被引:7
作者
张永 [1 ]
迟忠先 [2 ]
机构
[1] 辽宁师范大学计算机系
[2] 大连理工大学计算机科学与工程系
关键词
采样; 关联规则; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
在事务数据集中发现项目间的关联规则是数据挖掘的一个经典问题,但传统的关联规则挖掘方法对于大事务数据集而言,执行效率相对较低。已经有研究表明,采样技术能有效地改善挖掘效率。在分析现有采样方法的基础上,提出了一种新的基于采样的高效关联规则挖掘算法ESMA。该算法采用了更加有效的双向采样策略。通过实验分析表明,该算法明显地加快了大事务数据库中采样的速度,从而降低了CPU时间,而且具有很好的可扩展性。
引用
收藏
页码:184 / 186+234 +234
页数:4
相关论文
共 3 条
[1]
A Study of Two Sampling Methods for Analyzing Large Datasets with ILP[J] Ashwin Srinivasan Data Mining and Knowledge Discovery 1999,
[2]
Is Sampling Useful in Data Mining? A Case in the Maintenance of Discovered Association Rules[J] S.D. Lee;David W. Cheung;Ben Kao Data Mining and Knowledge Discovery 1998,
[3]
A new two-phase sampling based algorithm for discovering association rules Chen B;Haas P;Scheuermann P; Proceedings of ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 2002,