关联规则挖掘中若干关键技术的研究

被引:63
作者
陈耿
朱玉全
杨鹤标
陆介平
宋余庆
孙志挥
机构
[1] 东南大学计算机科学与工程系
[2] 江苏大学计算机科学与通信工程学院
[3] 东南大学计算机科学与工程系 南京
[4] 镇江
[5] 南京
关键词
数据挖掘; 关联规则; 频繁项目集;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果·然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的·为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的·
引用
收藏
页码:142 / 146
页数:5
相关论文
共 2 条
[1]   一种自顶向下挖掘长频繁项的有效方法 [J].
王晓峰 ;
王天然 ;
赵越 .
计算机研究与发展, 2004, (01) :148-155
[2]   快速更新频繁项集 [J].
朱玉全 ;
孙志挥 ;
赵传申 .
计算机研究与发展, 2003, (01) :94-99