挖掘数据流中的频繁模式

被引:113
作者
刘学军
徐宏炳
董逸生
王永利
钱江波
机构
[1] 东南大学计算机科学与技术系
关键词
数据流; 频繁模式; FP-DS算法; 流数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘·通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε·分析和实验表明算法有较好的性能·
引用
收藏
页码:2192 / 2198
页数:7
相关论文
empty
未找到相关数据