ESPM——频繁子树挖掘算法

被引:17
作者
朱永泰
王晨
洪铭胜
汪卫
施伯乐
机构
[1] 复旦大学计算机与信息技术系,复旦大学计算机与信息技术系,复旦大学计算机与信息技术系,复旦大学计算机与信息技术系,复旦大学计算机与信息技术系上海,上海,上海,上海,上海
基金
国家自然科学基金重点项目;
关键词
数据挖掘; 频繁模式; 频繁子树; ESPM;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着互联网的发展 ,频繁模式的挖掘由频繁项集扩展到结构化数据 :树和图 在这些结构上的挖掘工作被应用于更为复杂的领域 ,比如生物信息学、网络日志和XML文档 提出了一个新颖的算法 :ESPM ,以挖掘有序标号树中的频繁子树 不同于以往的工作 ,把树同构的判断工作放到了算法的晚期 ,从而减少了整个挖掘过程的时间开销 人工数据集和真实数据集上的实验都证明ESPM相较于其他算法的优越性 还提出了一些可能的改进
引用
收藏
页码:1720 / 1727
页数:8
相关论文
共 19 条
[1]  
Frequentsubgraphdiscovery. MKuramochi,etal. TheIEEEInt’’lConfonDataMining . 2001
[2]  
Tree pattern matching and subset matching in deterministic O(nlog3n) time. R. Cole,et al. The 10th Annual ACM SIAM Sympon Discrete Algorithms . 1999
[3]  
Atreeprojectionalgorithmforgenerationoffrequentitemsets. RAgarwal,etal. JournalofParallelandDistributedComputing . 2001
[4]  
Efficientlyminingfrequenttreesinaforest. MJZaki. The8thACMSIGKDDInt’’lConfonKnowledgeDiscoveryandDataMin ing . 2002
[5]  
Hyperrealmusicarchive. Hyperreal. http://music.hyperreal.org . 2004
[6]  
AdaptiveWebSites. MikePerkowitz,etal. http://www.cs.washington.edu/research/adaptive . 2004
[7]  
H Mine:Hyper structureminingoffrequentpatternsinlargedatabases. JPei,etal. TheIEEEInt’’lConfonDataMining . 2001
[8]  
Schemadiscoveryforsemistructureddata. KWang,etal. The3rdInt’’lConfonKnowledgeDiscoveryandDataMining . 1997
[9]  
DiscoveryoffrequenttreestructuredpatternsinsemistructuredWebdocuments. TMiyahara,etal. KnowledgeDiscoveryandDataMining—5thPacificAsiaConference . 2001
[10]  
Indexingandminingfreetrees. YChi,etal. The3rdIEEEInt’’lConfonDataMining(ICDM 2003) . 2003