提高Eclat算法效率的策略

被引:15
作者
冯培恩
刘屿
邱清盈
李立新
机构
[1] 浙江大学CAD&CG国家重点实验室
基金
浙江省自然科学基金;
关键词
Eclat算法; 剪枝; 双层哈希表; 划分链表; 交叉计数;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为了提高Eclat算法的效率,从剪枝、项集连接和交叉计数3方面对Eclat算法进行优化.将后缀相同的项集归为一个等价类,使剪枝更充分,剪枝时引入双层哈希表加快搜索候选项集子集的速度;提出项集集合划分链表,以减少项集连接过程中比较判断的环节;提出事务标识(Tid)失去阈值,以加快交叉计数的速度.在此基础上提出一种优化的Eclat_opt算法(ZAKI),把它与Eclat原算法以及其他2种Eclat改进算法Diffset(ZAKI),hEclat(熊忠阳)进行对比实验的结果表明,Eclat_opt算法的效率在稀疏数据集上最高,总体时间性能最好.
引用
收藏
页码:223 / 230
页数:8
相关论文
共 4 条
[1]   基于散列布尔矩阵的关联规则Eclat改进算法 [J].
熊忠阳 ;
陈培恩 ;
张玉芳 .
计算机应用研究, 2010, 27 (04) :1323-1325
[2]   Eclat与Eclat+算法的比较分析 [J].
刘井莲 .
绥化学院学报, 2010, 30 (02) :189-190
[3]   改进的Eclat数据挖掘算法的研究 [J].
宋长新 ;
马克 .
微计算机信息, 2008, (24) :92-94
[4]   频繁模式挖掘算法分析和比较 [J].
李敏 ;
李春平 .
计算机应用, 2005, (S1) :166-171