快速关联规则挖掘算法

被引:19
作者
杜孝平
马秀莉
唐世渭
牧之内 显文
机构
[1] 北京大学视觉与听觉信息处理国家重点实验室北京大学信息科学中心
[2] 北京大学计算机科学技术系
[3] 日本九州大学大学院系统情报科学研究院
关键词
频繁项集; 关联规则; 算法; 数据挖掘; 数据库;
D O I
暂无
中图分类号
TP311.12 [];
学科分类号
摘要
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集。Apriori及其改良算法是频繁项集挖掘的有效算法。在类Apriori的算法中,它们都采用哈希树来存储频繁项集的候补项集以便快速计算其支持度。该文在仔细分析这些算法所存在的效率瓶颈的基础上,提出了另一个有效的改进算法。所提算法通过利用一个一维数组替代已有算法中的复杂的哈希树来达到改善它们效率瓶颈的目的。通过多个实验评估,该文所提算法的挖掘效率很高,比Apriori及其改良算法要快2到5倍。
引用
收藏
页码:1 / 4+47 +47
页数:5
相关论文
共 1 条
[1]  
ScalableParallelDataMiningforAssociationRules犤J犦 .2 Eui-HongHan,GeorgeKarypis,VipinKumar. IEEETransactionsonKnowledgeandDataEngineering . 2000