标签集约束近似频繁模式的并行挖掘

被引:7
作者
郑海雁 [1 ,2 ]
王远方 [2 ]
熊政 [1 ]
李昆明 [1 ]
崇志宏 [2 ]
尹飞 [1 ]
机构
[1] 江苏方天电力技术有限公司智能电网产品中心
[2] 东南大学计算机科学与工程学院
关键词
近似频繁模式; 标签集约束; 并行化;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
近似频繁模式衍生于频繁模式,综合了频繁项集与频繁子图的特点。针对该模式的研究集中在无标签图上,其应用场景主要为社交网络、语义网络、智能电网等。近似频繁模式挖掘过程同时涉及频繁项集挖掘和频繁子图挖掘,因此已有的处理频繁模式挖掘算法无法较好地解决近似频繁模式挖掘问题。基于近似频繁模式结构,将其拓展到带标签图中,引入标签集约束,并设计标签集约束近似频繁模式挖掘算法LCPP(Label-Constraint Proximity Pattern),该算法并行部署在Map Reduce计算模型中,弥补了开源p FP算法处理大规模数据时效率不高的缺点。实验结果验证了该算法的有效性和可扩展性,表明了LCPP算法是p FP算法的极佳补充。
引用
收藏
页码:135 / 141
页数:7
相关论文
共 7 条
[1]  
基于MapReduce模型的并行计算平台的设计与实现.[D].万至臻.浙江大学.2008, 07
[2]   大规模图上标签集约束路径的集合查询 [J].
包佳佳 ;
田伟 .
计算机科学, 2013, 40 (04) :172-176+192
[3]   集群系统中的FP-Growth并行算法 [J].
陈敏 ;
李徽翡 .
计算机工程, 2009, 35 (20) :71-72+75
[4]  
Information flow in social groups.[J].Fang Wu;Bernardo A. Huberman;Lada A. Adamic;Joshua R. Tyler.Physica A: Statistical Mechanics and its Applications.2004, 1
[5]   Mining frequent patterns without candidate generation [J].
Han, JW ;
Pei, J ;
Yin, YW .
SIGMOD RECORD, 2000, 29 (02) :1-12
[6]  
Mining association rules between sets of items in large databases.[J].Rakesh Agrawal;Tomasz Imieliński;Arun Swami.ACM SIGMOD Record.1993, 2
[7]  
实战Hadoop.[M].刘鹏; 主编.电子工业出版社.2011,