肿瘤信息基因启发式宽度优先搜索算法研究

被引:18
作者
王树林 [1 ]
王戟 [1 ]
陈火旺 [1 ]
李树涛 [2 ]
张波云 [1 ]
机构
[1] 国防科技大学计算机学院 
[2] 湖南大学电气与工程学院 
关键词
基因表达谱; 肿瘤分类; 信息基因选择; 支持向量机; 全折交叉验证方法;
D O I
暂无
中图分类号
R73-3 [肿瘤学实验研究];
学科分类号
摘要
基于基因表达谱的肿瘤检测方法有望成为临床医学上一种快速而有效的肿瘤分子诊断方法,但由于基因表达谱数据存在维数过高、样本量很小以及噪音很大等特点,使得肿瘤信息基因选择成为一件有挑战性的工作.根据肿瘤基因表达谱样本集的特点,提出了一种以支持向量机分类性能为评估准则的寻找信息基因的启发式宽度优先搜索算法,其优点是能够同时搜索到基因数量尽可能少而分类能力尽可能强的多个信息基因子集.实验采用了3种肿瘤样本集以验证新算法的可行性和有效性,对于急性白血病、难以分类的结肠癌和多肿瘤亚型的小圆蓝细胞瘤样本集,分别只需2,4和4个信息基因就能获得100%的4-折交叉验证识别准确率.与其它优秀的肿瘤分类方法相比,实验结果在信息基因数量及其分类性能方面具有明显的优越性.为避免样本集的不同划分对分类性能的影响,提出了一种能够更加客观地反映信息基因子集分类性能的全折交叉验证评估方法.
引用
收藏
页码:636 / 649
页数:14
相关论文
共 20 条
[1]   肿瘤识别过程中特征基因的选取 [J].
阮晓钢 ;
晁浩 .
控制工程, 2007, (04) :373-375+379
[2]   考虑样本不平衡的模型无关的基因选择方法 [J].
李建中 ;
杨昆 ;
高宏 ;
骆吉洲 ;
郭政 .
软件学报, 2006, (07) :1485-1493
[3]   肿瘤基因表达谱分类特征基因选取问题及分析方法研究 [J].
李颖新 ;
李建更 ;
阮晓钢 .
计算机学报, 2006, (02) :324-330
[4]   基于基因表达谱的肿瘤特异基因表达模式研究 [J].
阮晓钢 ;
李颖新 ;
李建更 ;
龚道雄 ;
王金莲 .
中国科学C辑:生命科学, 2006, (01) :86-96
[5]   基于支持向量机的肿瘤分类特征基因选取 [J].
李颖新 ;
阮晓钢 .
计算机研究与发展, 2005, (10) :153-158
[6]   四种模式分类方法应用于基因表达谱分析的比较研究 [J].
王海芸 ;
李霞 ;
郭政 ;
张瑞杰 .
生物医学工程学杂志, 2005, (03) :505-509
[7]   基于基因表达谱的SRBCT分类研究 [J].
朱云华 ;
李颖新 ;
阮晓钢 .
计算机工程与应用, 2005, (01) :221-223
[8]   秩和基因选取方法及其在肿瘤诊断中的应用 [J].
邓林 ;
马尽文 ;
裴健 .
科学通报, 2004, (13) :1311-1316
[9]   一种基于递归分类树的集成特征基因选择方法 [J].
李霞 ;
张田文 ;
郭政 .
计算机学报, 2004, (05) :675-682
[10]   基于非参数方法的肿瘤基因表达数据挖掘 [J].
陆巍 ;
忻健 ;
王翼飞 .
上海大学学报(自然科学版), 2003, (06) :543-548