有效的不确定数据概率频繁项集挖掘算法

被引:8
作者
刘浩然
刘方爱
李旭
王记伟
机构
[1] 山东师范大学信息科学与工程学院
关键词
数据挖掘; 不确定数据; 可能世界模型; 概率频繁项集; 频繁模式;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFP-Growth)算法。该算法通过逐条读取不确定事务数据库中数据,构造类似频繁模式树(FP-Tree)的紧凑树结构,同时更新项头表中保存所有尾节点相同项集的期望值的动态数组。当所有事务数据插入到改进的不确定数据频繁模式树(PUFP-Tree)中以后,通过遍历数组得到所有的概率频繁项集。最后通过实验结果和理论分析表明:PUFP-Growth算法可以有效地发现概率频繁项集;与不确定数据频繁模式增长(UF-Growth)算法和压缩的不确定频繁模式挖掘(CUFP-Mine)算法相比,提出的PUFP-Growth算法能够提高不确定数据概率频繁项集挖掘的效率,并且减少了内存空间的使用。
引用
收藏
页码:1757 / 1761+1784 +1784
页数:6
相关论文
共 4 条
[1]
面向不确定感知数据的频繁项查询算法 [J].
王爽 ;
王国仁 .
计算机学报, 2013, 36 (03) :571-581
[2]
不确定性数据管理技术研究综述 [J].
周傲英 ;
金澈清 ;
王国仁 ;
李建中 .
计算机学报, 2009, 32 (01) :1-16
[3]
Model-based probabilistic frequent itemset mining [J].
Bernecker, Thomas ;
Cheng, Reynold ;
Cheung, David W. ;
Kriegel, Hans-Peter ;
Lee, Sau Dan ;
Renz, Matthias ;
Verhein, Florian ;
Wang, Liang ;
Zuefle, Andreas .
KNOWLEDGE AND INFORMATION SYSTEMS, 2013, 37 (01) :181-217
[4]
A new mining approach for uncertain databases using CUFP trees.[J].Chun-Wei Lin;Tzung-Pei Hong.Expert Systems With Applications.2011, 4