一种基于递归分类树的集成特征基因选择方法

被引:25
作者
李霞
张田文
郭政
机构
[1] 哈尔滨工业大学计算机科学与技术系
基金
黑龙江省自然科学基金;
关键词
基因表达谱; 递归分类树; 特征选择; 集成决策;
D O I
暂无
中图分类号
TN492 [专用集成电路];
学科分类号
摘要
利用DNA芯片基因表达谱信息识别疾病相关基因 ,对癌症等疾病分型、诊断及病理学研究有非常重要的实际意义 .该文提出了一种基于递归分类树的特征基因选择的集成方法EFST (EnsembleFeatureSelectionbasedonRecursivePartition Tree) .EFST可选择多组基于不同样本分布结构的特征基因 ,结合有监督机器学习中的多分类器集成 (ensemble)决策技术 ,利用提出的衡量特征基因稳定性与显著性测度 ,集成各特征基因组选择最终的特征基因 .应用结肠癌 2 0 0 0个基因的表达谱实验数据分析结果显示 :EFST方法不仅具有寻找疾病相关基因的能力和较强的数据维数压缩能力 ,而且由支持向量机 (SVM)等 4种模式分类方法证实EFST方法可以明显地提高疾病鉴别分类的准确率 .
引用
收藏
页码:675 / 682
页数:8
相关论文
共 1 条
[1]  
医学信息分析方法[M]. 哈尔滨出版社 , 郭政等主编, 2001