基于clustering算法的事务抽样关联规则挖掘算法

被引:3
作者
马玉玲
机构
[1] 山东英才学院信息工程学院
关键词
聚类算法; 事务子集; 关联规则挖掘; Apriori算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
关联规则挖掘典型算法Apriori由于在频繁项集的生成时,需要多次扫描数据库,空间和时间耗费较大。之后虽然有很多Apriori算法的改进版本,但大多是从数据存储结构的角度,少有研究考虑到数据集本身的性质。对此提出了基于clustering算法的事务抽样关联规则挖掘算法,通过聚类技术对事务进行聚类,得出能够反映原始交易数据特征的事务子集,然后,在该子集上开展挖掘分析工作。该方法在8个不同规模人造数据集和1个真实数据集上进行了实验。其中,在较小规模人造数据集上,时间比原方法节省0.03 s;规模越大,节省时间越多,在大小为15 000、维度为30的数据集上运行时,比原方法节省了70 s;在真实数据集上,不同参数设置下该方法耗时仅为原方法的50%。实验证明,该方法与传统Apriori算法相比,效率较高,尤其在数据量大时,效果提升更明显。该算法的思想也可以扩展应用到其他改进的Apriori算法中。
引用
收藏
页码:77 / 79+84 +84
页数:4
相关论文
共 15 条
  • [1] 数据挖掘:概念与技术[M]. 机械工业出版社 , (美) 韩家炜等, 2006
  • [2] 基于数据场的量化关联规则挖掘研究与实现
    孟海东
    李丹丹
    吴鹏飞
    [J]. 计算机应用与软件, 2014, 31 (07) : 40 - 42+58
  • [3] 挖掘完全频繁项集的蚁群算法
    黄红星
    [J]. 微电子学与计算机, 2014, 31 (12) : 144 - 147+151
  • [4] 关联规则算法研究及其在教学系统中的应用
    曲守宁
    董彩云
    徐德军
    吴桐
    [J]. 计算机系统应用, 2005, (04) : 20 - 23
  • [5] 一种精简的关联规则表示模型
    田卫东
    陈浩
    [J]. 计算机应用研究, 2015, 32 (03) : 658 - 661+665
  • [6] Multi-level association rule mining based on clustering partition. HUANG Q,DUAN L. Proceedings of the 3rd International Conference on Intelligent System Design and Engineering Applications . 2013
  • [7] Rare association rule mining via transaction clustering. YUN S,PEARS K R. Proceedings of the 7th Australasian Data Mining Conference,Conferences in Research and Practive in Information Technology . 2008
  • [8] Transaction clustering using a seeds based approach. KOH Y S,PEARS R. Proceedings of the 12th Pacific-Asia Conference Advances in Knowledge Discovery and Data Mining . 2008
  • [9] A model for association rules based on clustering. ORDONEZ C. SAC’’05:Proceedings of the 2005 ACM Symposium on Applied Computing . 2005
  • [10] A primer to frequent itemset mining for bioinformatics. NAULAERTS S,MEYSMAN P,BITTREMIEUX W,et al. Briefings in Bioinformatics . 2015