Apriori挖掘算法的优化研究

被引:1
作者
张青
机构
[1] 河南化工职业学院
关键词
Apriori; 挖掘算法; 优化; 研究;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
本文分析了数据挖掘的经典Apriori算法存在的缺陷:处理规模巨大的候选项目集时需要消耗大量的时间;对候选项目集进行模式匹配时需要多次重复扫描事物数据库,降低算法的速度和效率。针对这些缺陷本文对经典的算法和优化策略进行了剖析,提出一种新的发现频繁项目序列集的算法DISS-DM。本算法是在算法ISS-DM的基础上加以改进,采用了数据分割法将数据库分成多个分片,对每个分片进行一次扫描找出局部频繁项集,对整个数据库扫描发现全局频繁项集。本算法只需要扫描数据库两次,就能发现全局频繁项集,能减少内存需求,有利于大型数据库的数据分割优化。
引用
收藏
页码:14 / 15
页数:2
相关论文
共 5 条
[1]
数据挖掘教程.[M].(美)RichardJ.Roiger;(美)MichaelW.Geatz著;翁敬农译;.清华大学出版社.2003,
[2]
[3]
基于决策树的数据挖掘方法在CRM中的应用研究 [J].
柳林 ;
涂光平 ;
杨峰 .
计算技术与自动化, 2006, (01) :67-69
[4]
决策树算法的研究及优化 [J].
王静红 ;
王熙照 ;
邵艳华 ;
王伍伶 .
微机发展, 2004, (09) :30-32
[5]
模糊关联规则及挖掘算法 [J].
程继华 ;
施鹏飞 ;
郭建生 .
小型微型计算机系统, 1999, (04)