时间敏感数据流上的频繁项集挖掘算法

被引:28
作者
李海峰
章宁
朱建明
曹怀虎
机构
[1] 中央财经大学信息学院
基金
北京市自然科学基金;
关键词
频繁项集; 数据流; 时间敏感; 滑动窗口; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了频繁项集的挖掘算法FIMoTS.该算法引入了类型变化界限的概念,将项集进行动态分类,根据滑动窗口大小的变化对项集进行延迟处理,仅当项集的类型变化界限超出一定阈值的时候才进行支持度的重新计算,能够达到剪枝的目的.在4种不同密度的数据集上完成的实验结果显示,该算法能够在保证内存开销基本不变的情况下显著提高计算效率.
引用
收藏
页码:2283 / 2293
页数:11
相关论文
共 1 条
[1]   Hyperclique pattern discovery [J].
Xiong, Hui ;
Tan, Pang-Ning ;
Kumar, Vipin .
DATA MINING AND KNOWLEDGE DISCOVERY, 2006, 13 (02) :219-242