微阵列数据癌症分类问题中的基因选择

被引:20
作者
张丽娟 [1 ]
李舟军 [2 ]
机构
[1] 国防科学技术大学计算机学院
[2] 北京航空航天大学计算机科学与工程学院
关键词
基因选择; 微阵列数据; 癌症分类; 属性相关性; 相关性度量;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因、相对少量(往往不足一百)的样本.在这成千上万的基因中,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来说,最重要的一个问题就是识别出对癌症分类最有贡献的基因.这一识别过程称为基因选择.基因选择在统计模式识别、机器学习和数据挖掘领域已得到广泛研究.介绍基因选择问题所涉及到的相关背景知识和基本概念;全面地回顾统计学、机器学习和数据挖掘领域对基因选择问题的解决方法;通过实验展示了几种典型算法在微阵列数据上的性能;指出当前存在的问题和未来的研究方向.
引用
收藏
页码:794 / 802
页数:9
相关论文
共 16 条
[1]   考虑样本不平衡的模型无关的基因选择方法 [J].
李建中 ;
杨昆 ;
高宏 ;
骆吉洲 ;
郭政 .
软件学报, 2006, (07) :1485-1493
[2]  
基因表达谱芯片的数据分析[J]. 吴斌,沈自尹.世界华人消化杂志. 2006(01)
[3]   基于相关性分析的基因选择算法 [J].
王明怡 ;
吴平 ;
王德林 .
浙江大学学报(工学版), 2004, (10) :52-55
[4]   一种基于递归分类树的集成特征基因选择方法 [J].
李霞 ;
张田文 ;
郭政 .
计算机学报, 2004, (05) :675-682
[5]   基于类别空间的基因选择 [J].
张军英 ;
Y.J.Wang ;
J.Khan ;
R.Clarke .
中国科学E辑:技术科学, 2003, (12) :1125-1137
[6]   Significance of gene ranking for classification of microarray samples [J].
Zhang, Chaolin ;
Lu, Xuesong ;
Zhang, Xuegong .
IEEE-ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS, 2006, 3 (03) :312-320
[7]   Identification of critical genes in microarray experiments by a Neuro-Fuzzy approach [J].
Chen, Chin-Fu ;
Feng, Xin ;
Szeto, Jack .
COMPUTATIONAL BIOLOGY AND CHEMISTRY, 2006, 30 (05) :372-381
[8]  
Robust Selection of Predictive Genes via a Simple Classifier[J] . Veronica Vinciotti,Allan Tucker,Paul Kellam,Xiaohui Liu.Applied Bioinformatics . 2006 (1)
[9]  
Attribute Clustering for Grouping, Selection, and Classification of Gene Expression Data[J] . Wai-Ho Au,Keith C. C. Chan,Andrew K. C. Wong,Yang Wang.IEEE/ACM Transactions on Computational Biology an . 2005 (2)
[10]   Gene Selection for Cancer Classification using Support Vector Machines [J].
Isabelle Guyon ;
Jason Weston ;
Stephen Barnhill ;
Vladimir Vapnik .
Machine Learning, 2002, 46 :389-422