利用DNA芯片基因表达谱信息识别疾病相关基因 ,对癌症等疾病分型、诊断及病理学研究有非常重要的实际意义 .该文提出了一种基于递归分类树的特征基因选择的集成方法EFST (EnsembleFeatureSelectionbasedonRecursivePartition Tree) .EFST可选择多组基于不同样本分布结构的特征基因 ,结合有监督机器学习中的多分类器集成 (ensemble)决策技术 ,利用提出的衡量特征基因稳定性与显著性测度 ,集成各特征基因组选择最终的特征基因 .应用结肠癌 2 0 0 0个基因的表达谱实验数据分析结果显示 :EFST方法不仅具有寻找疾病相关基因的能力和较强的数据维数压缩能力 ,而且由支持向量机 (SVM)等 4种模式分类方法证实EFST方法可以明显地提高疾病鉴别分类的准确率 .