SFPMax——基于排序FP树的最大频繁模式挖掘算法

被引:60
作者
秦亮曦
史忠植
机构
[1] 中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室北京中国科学院研究生院北京广西大学计算机与信息工程学院南宁,北京
基金
北京市自然科学基金;
关键词
数据挖掘; 关联规则; 排序FP-树; 最大频繁模式;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
FP-growth算法是目前较高效的频繁模式挖掘算法之一 ,但将它用于最大频繁模式挖掘时却不能获得较高的效率 深入分析了造成低效的原因 ,提出了利用排序FP 树挖掘最大频繁模式的算法SFP- Max 算法的主要思想如下 :①基于排序FP 树 ;②利用最大频繁模式的性质 ,减小产生的候选最大模式的规模 ;③设置中间结果集 ,缩小检验的范围 ,从而减少检验候选最大模式的时间 实验表明 ,SFP -Max是一个高效的最大频繁模式的挖掘算法 ,对于测试的数据集 ,SFP -Max的性能多数情况下都优于MAFIA算法
引用
收藏
页码:217 / 223
页数:7
相关论文
empty
未找到相关数据