从基因表达数据中挖掘最大的行常量双聚类

被引:5
作者
缪苗
尚学群
刘加财
王淼
机构
[1] 西北工业大学计算机学院计算机软件与理论系
关键词
双聚类; 原始数据; 行常量双聚类; 范围支持度; 基因芯片;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
双聚类方法是当前分析基因表达数据的一个重要研究方向,其挖掘目标是发现哪些基因在哪些实验条件下具有相似的表达水平或者关系密切。目前已提出了许多双聚类算法来挖掘不同类型的双聚类,然而其大部分挖掘效率不高。鉴于此,提出了一个新颖的挖掘算法———MRCluster,其主要是用来从原始的基因表达数据中挖掘最大的行常量双聚类模式。就其挖掘效率来说,它采用的是基于Apriori原则的基因扩展深度优先的挖掘策略,并且在挖掘过程中引入了一些新颖的剪枝技术来提高效率。将MRCluster和一个行常量双聚类模式挖掘方法 RAP(range support pattern)算法进行比较,从实验结果上可以看出,相比RAP算法,MRCluster算法对在原始的基因表达数据中挖掘最大的行常量双聚类模式具有更好的效率。因此,MRCluster算法能够有效地从原始的基因表达数据中挖掘最大的行常量双聚类。
引用
收藏
页码:4447 / 4450
页数:4
相关论文
共 6 条
[1]  
Extracting conserved gene expression motifsfrom gene expression data. MURALI T M,KASIF S. Proc of Pacific Symposium Biocom-puting . 2003
[2]  
An association anal-ysis approach to biclustering. PANDEY G,ATLURI G,STEINBACH M,et al. Proc of the 15th ACM SIGKDD In-ternational Conference on Knowledge Discovery and Data Mining . 2009
[3]  
Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Subramanian A, Tamayo P, Mootha VK, et al. Proceedings of the National Academy of Sciences of the United States of America . 2005
[4]  
AGEMAP: a gene expression database for aging in mice. JM Zahn,S Poosala,AB Owen,DK Ingram,A Lustig,A Carter,AT Weeraratna,DD Taub,M Gorospe,K Mazan-Mamczarz,EG Lakatta,KR Boheler,X Xu,MP Mattson,G Falco,MS Ko,D Schlessinger,J Firman,SK Kummerfeld,WH Wood,AB Zonderman,SK Kim,KG Becker. PLoS Genet . 2007
[5]  
Biclustering algorithms for biologicaldata analysis:a survey. MADEIRA S C,OLIVEIRA A L. IEEE Trans on Computational Biologyand Bioinformatics . 2004
[6]  
A case for end system multicast. Chu Y H,Rao S G,Zhang H. Proceedings of the 2000 ACM SIGMETRICS International Conference on Measurement and Modeling of Computer Systems . 2000