基于流形学习的聚类方法在基因芯片表达谱分析中的应用

被引:12
作者
黄伟
刘战民
薛丹
尹京苑
机构
[1] 上海大学生命科学学院生物信息学中心
关键词
非线性降维; 流形学习; 聚类分析; 基因芯片;
D O I
暂无
中图分类号
R318.0 [一般性问题];
学科分类号
100103 [病原生物学];
摘要
对基因芯片表达谱的聚类分析有助于发现共表达的基因,而共表达的特性往往是共调控基因所拥有的性质。因此,对基因表达谱的准确聚类将有利于更加准确地发现基因之间的调控关系。本研究使用机器学习中的等度规映射、局部线性嵌入、拉普拉斯特征根映射等流形学习方法处理基因表达谱数据,得到非线性降维后的数据。在此基础上应用K均值聚类、模糊聚类、自组织映射神经网络等聚类方法,根据给定的阈值,从酵母基因表达数据的382个聚类结果中得到了117个共表达基因对,而从人类血清组织细胞的基因表达数据的132个聚类结果中得到了89个共表达基因对。使用的判别准则表明,基于流形学习的聚类方法与以往的方法相当,且能够被用以发现高维基因芯片表达数据中的低维的流形结构。
引用
收藏
页码:77 / 85
页数:9
相关论文
共 8 条
[1]
Laplacian eigenmaps for dimensionality reduction and data representation [J].
Belkin, M ;
Niyogi, P .
NEURAL COMPUTATION, 2003, 15 (06) :1373-1396
[2]
A hierarchical unsupervised growing neural network for clustering gene expression patterns.[J].Javier Herrero;Alfonso Valencia.Bioinformatics.2001,
[3]
流形学习中非线性维数约简方法概述 [J].
黄启宏 ;
刘钊 .
计算机应用研究, 2007, (11) :19-25
[4]
流形学习概述 [J].
徐蓉 ;
姜峰 ;
姚鸿勋 .
智能系统学报, 2006, (01) :44-51
[5]
基因表达谱芯片的数据分析.[J].吴斌;沈自尹;.世界华人消化杂志.2006, 01
[6]
非线性降维在高维医学数据处理中的应用 [J].
翁时锋 ;
张长水 ;
张学工 .
清华大学学报(自然科学版), 2004, (04) :485-488
[7]
基于伪F统计量的模糊聚类方法在基因表达数据分析中的应用 [J].
易东 ;
张彦琦 ;
王文昌 ;
张蔚 ;
杨梦苏 ;
黄明辉 ;
方志俊 .
中国卫生统计, 2002, (03)
[8]
基础拓扑学讲义.[M].尤承业编著;.北京大学出版社.1997,