基于投影数据库的序列模式挖掘增量式更新算法

被引:5
作者
陆介平 [1 ]
刘月波 [2 ]
倪巍伟 [1 ]
陈耿 [3 ]
孙志挥 [1 ]
机构
[1] 东南大学计算机科学与工程学院
[2] 上海工程技术大学科研处
[3] 南京审计学院审计信息工程重点实验室
基金
高等学校博士学科点专项科研基金;
关键词
序列模式; 数据挖掘; 投影数据库; 增量式更新;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法.
引用
收藏
页码:457 / 462
页数:6
相关论文
empty
未找到相关数据