基于SVM和平均影响值的人肿瘤信息基因提取

被引:3
作者
李凌波
张静
陈丹
机构
[1] 云南大学数学与统计学院
关键词
基因表达谱; 秩和检验; 支持向量机; 平均影响值; 全折交叉验证;
D O I
暂无
中图分类号
R730.2 [肿瘤病理学、病因学];
学科分类号
摘要
基于基因表达谱的肿瘤分类信息基因选取是发现肿瘤特异表达基因、探索肿瘤基因表达模式的重要手段。借助由基因表达谱获得的分类信息进行肿瘤诊断是当今生物信息学领域中的一个重要研究方向,有望成为临床医学上一种快速而有效的肿瘤分子诊断方法。鉴于肿瘤基因表达谱样本数据维数高、样本量小以及噪音大等特点,提出一种结合支持向量机应用平均影响值来寻找肿瘤信息基因的算法,其优点是能够搜索到基因数量尽可能少而分类能力尽可能强的多个信息基因子集。采用二分类肿瘤数据集验证算法的可行性和有效性,对于结肠癌样本集,只需3个基因就能获得100%的留一法交叉验证识别准确率。为避免样本集的不同划分对分类性能的影响,进一步采用全折交叉验证方法来评估各信息基因子集的分类性能,优选出更可靠的信息基因子集。与基它肿瘤分类方法相比,实验结果在信息基因数量以及分类性能方面具有明显的优势。
引用
收藏
页码:72 / 78
页数:7
相关论文
共 9 条
[1]  
生物信息学中的智能计算理论与方法研究.[M].黄德双等; 主编.中国科学技术大学出版社.2006,
[2]  
非参数统计.[M].王星编著;.中国人民大学出版社.2005,
[3]   α微管蛋白在非小细胞肺癌中的表达及临床意义附视频 [J].
刘青松 ;
张科伟 ;
薛梦华 ;
李智 ;
刘伟 .
中国实验诊断学, 2012, (03) :447-450
[4]   肿瘤信息基因启发式宽度优先搜索算法研究 [J].
王树林 ;
王戟 ;
陈火旺 ;
李树涛 ;
张波云 .
计算机学报, 2008, (04) :636-649
[5]   秩和基因选取方法及其在肿瘤诊断中的应用 [J].
邓林 ;
马尽文 ;
裴健 .
科学通报, 2004, (13) :1311-1316
[6]   Molecular classification of cancer types from microarray data using the combination of genetic algorithms and support vector machines [J].
Peng, SH ;
Xu, QH ;
Ling, XB ;
Peng, XN ;
Du, W ;
Chen, LB .
FEBS LETTERS, 2003, 555 (02) :358-362
[7]  
Reliable classification of two-class cancer data using evolutionary algorithms.[J].Kalyanmoy Deb;A Raji Reddy.BioSystems.2003, 1
[8]   Gene selection for cancer classification using support vector machines [J].
Guyon, I ;
Weston, J ;
Barnhill, S ;
Vapnik, V .
MACHINE LEARNING, 2002, 46 (1-3) :389-422
[9]  
Support vector machine classification and validation of cancer tissue samples using microarray expression data.[J].Terrence S. Furey;Nello Cristianini;Nigel Duffy;David W. Bednarski;Michèl Schummer.Bioinformatics.2000,