从不确定图中挖掘频繁子图模式

被引:31
作者
邹兆年
李建中
高宏
张硕
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
不确定图; 图挖掘; 频繁子图模式;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
研究不确定图数据的挖掘,主要解决不确定图数据的频繁子图模式挖掘问题.介绍了一种数据模型来表示图的不确定性,以及一种期望支持度来评价子图模式的重要性.利用期望支持度的Apriori性质,给出了一种基于深度优先搜索策略的挖掘算法.该算法使用高效的期望支持度计算方法和搜索空间裁剪技术,使得计算子图模式的期望支持度所需的子图同构测试的数量从指数级降低到线性级.实验结果表明,该算法比简单的深度优先搜索算法快35个数量级,有很高的效率和可扩展性.
引用
收藏
页码:2965 / 2976
页数:12
相关论文
共 4 条
[1]  
Databases with uncertainty and lineage[J] . Omar Benjelloun,Anish Das Sarma,Alon Halevy,Martin Theobald,Jennifer Widom.The VLDB Journal . 2008 (2)
[2]  
Efficient query evaluation on probabilistic databases[J] . Nilesh Dalvi,Dan Suciu.The VLDB Journal . 2007 (4)
[3]  
Graph-based Substructure Pattern Mining .2 X Yan,J HanGspan. Int.Conf.On Data Mining,Maebashi City,Japan,2002 . 2002
[4]  
Finding frequent items in probabilistic data .2 Zhang Qin,Li Fei-Fei,Yi ke. Proceedings of the27th ACM SIGMOD International Conference on Managementof Data . 2008