基于改进的FP-tree的频繁模式挖掘算法

被引:20
作者
李也白 [1 ]
唐辉 [1 ]
张淳 [2 ]
贺玉明 [1 ]
机构
[1] 北方工业大学信息工程学院
[2] 北京地坛医院器械科
关键词
数据挖掘; 关联规则; 频繁模式; FP-growth算法; FP-tree;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。
引用
收藏
页码:101 / 103
页数:3
相关论文
共 2 条
[1]  
数据挖掘.[M].朱明编著;.中国科学技术大学出版社.2002,
[2]   基于FP-tree的最大频繁项目集挖掘算法 [J].
马丽生 ;
邓辉文 ;
齐逸 .
计算机工程与设计, 2008, (02) :385-388