学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
挖掘数据流中的频繁模式
被引:113
作者
:
论文数:
引用数:
h-index:
机构:
刘学军
论文数:
引用数:
h-index:
机构:
徐宏炳
论文数:
引用数:
h-index:
机构:
董逸生
论文数:
引用数:
h-index:
机构:
王永利
论文数:
引用数:
h-index:
机构:
钱江波
机构
:
[1]
东南大学计算机科学与技术系
来源
:
计算机研究与发展
|
2005年
/ 12期
关键词
:
数据流;
频繁模式;
FP-DS算法;
流数据挖掘;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
摘要
:
发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘·通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε·分析和实验表明算法有较好的性能·
引用
收藏
页码:2192 / 2198
页数:7
相关论文
未找到相关数据
未找到相关数据