基于贝叶斯粗糙集的大数据频繁项挖掘技术

被引:3
作者
张本文
机构
[1] 四川民族学院计算机科学系
关键词
贝叶斯粗糙集; 频繁项挖掘; 大数据;
D O I
10.13774/j.cnki.kjtb.2015.06.071
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。
引用
收藏
页码:211 / 213
页数:3
相关论文
共 5 条
  • [1] Map Reduce-based Closed Frequent Itemset Mining with Efficient Redundancy Filtering. Wang SQ,Yang YB,Gao Y,et al. Data Mining Workshops ICDMW 2012IEEE 12th International Conference . 2012
  • [2] Mahout in action. Owen S,Anil,Dunning T,et al. . 2011
  • [3] Pfp:parallel fp-growth for query recommendation. Li H,Wang Y,Zhang D, et al. Proceedings of the 2008 ACM conference on Recommender systems . 2008
  • [4] MapReduce[J] . Jeffrey Dean,Sanjay Ghemawat. &nbspCommunications of the ACM . 2008 (1)
  • [5] 基于数据挖掘技术的网络安全事件预测研究
    陆科达
    万励
    吴洁明
    [J]. 科技通报, 2012, 28 (06) : 37 - 39