基于概率衰减窗口模型的不确定数据流频繁模式挖掘

被引:34
作者
廖国琼 [1 ,2 ]
吴凌琴 [3 ]
万常选 [1 ,2 ]
机构
[1] 江西财经大学信息管理学院
[2] 江西省高校数据与知识工程重点实验室
[3] 江西省赣抚平原水利工程管理局
关键词
不确定数据; 数据流; 概率频繁模式; 频繁模式挖掘; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
考虑到不确定数据流的不确定性,设计了一种新的概率频繁模式树PFP-tree和基于该树的概率频繁模式挖掘方法PFP-growth.PFP-growth使用事务性不确定数据流及概率衰减窗口模型,通过计算各概率数据项的期望支持度以发现概率频繁模式,其主要特点有:考虑到窗口内不同时间到达数据项的贡献度不同,采用概率衰减窗口模型计算期望支持度,以提高模式挖掘准确度;设置数据项索引表和事务索引表,以加快频繁模式树检索速度;通过剪枝删除不可能成为频繁模式的结点,以降低模式树的存储及检索开销;对每个结点都设立一个事务概率信息链表,以支持数据项在不同事务中具有不同概率的情形.实验结果表明,PFP-growth在保证挖掘模式准确度的前提下,在处理时间和内存空间等方面都具有较好的性能.
引用
收藏
页码:1105 / 1115
页数:11
相关论文
共 2 条
[1]
一种不确定数据流聚类算法 [J].
张晨 ;
金澈清 ;
周傲英 .
软件学报, 2010, 21 (09) :2173-2182
[2]
不确定性数据管理技术研究综述 [J].
周傲英 ;
金澈清 ;
王国仁 ;
李建中 .
计算机学报, 2009, 32 (01) :1-16