不确定性数据上频繁项集挖掘的预处理方法

被引:15
作者
李海峰
章宁
柴艳妹
机构
[1] 中央财经大学信息学院
关键词
不确定性数据; 频繁项集; 主成分分析; 模糊关联;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
传统频繁项集挖掘技术无法高效获取不确定性数据中有价值的信息。通过研究频繁模式增长树的算法原理,根据不确定性数据的特点提出了一种有效的不确定性数据预处理方法PCAFP-Growth。利用主成分分析的方法进行数据的降维,并使用模糊关联分析法将数据概率进行分类,实现数据剪枝。在理论研究基础上,通过实验对数据集进行了验证。结果表明,基于主成分分析法的剪枝策略在稠密数据集上能够有效提高运算速度,减少内存的使用。
引用
收藏
页码:161 / 164+199 +199
页数:5
相关论文
共 1 条
[1]
不确定性数据管理技术研究综述 [J].
周傲英 ;
金澈清 ;
王国仁 ;
李建中 .
计算机学报, 2009, 32 (01) :1-16