基于类别空间的基因选择

被引:9
作者
张军英
Y.J.Wang
J.Khan
R.Clarke
机构
[1] 西安电子科技大学雷达信号处理国防重点实验室
[2] Electrical Engineering Institute
[3] The Catholic University of America
[4] Washington DC
[5] USA
[6] Cancer Genetics Branch
[7] National Human Genome Research Institute
[8] National Institutes of Health
[9] Bethesda
[10] Maryland
[11] Lombardi Cancer Center
[12] Georgetown University
[13] USA 西安 Electrical Engineering Institute
[14] Washington
基金
中国国家自然科学基金;
关键词
特征空间(基因空间); 类别空间; 特征选择(基因选择); 主分量分析;
D O I
暂无
中图分类号
Q75 [分子遗传学];
学科分类号
071007 ;
摘要
基因选择通常是在基因空间中进行的.由于基因空间的维数(基因数目)比该空间中的样本数要多得多,这种做法存在严重的维数发难(curse of dimensionality)问题,其结果是在基因空间中所建立数据模型难于获得满意的精度,基于所建立模型的基因选择结果可信度低.如何对具有极少样本的极高维空间进行特征选择(基因选择)是一个极具挑战性的课题.将基因空间变换为它的对偶空间,称为类别空间,从而空间的维数仅为基因空间中样本的类别数,空间中的样本数则为基因空间的维数.显然,在类别空间中不存在任何维数发难现象;提出了在类别空间中基于将不同的类尽可能分开的原则、并借助主分量分析的基于类别空间基因选择方法.对真实基因数据的基因选择实验,并通过Fisher指标、加权Fisher指标以及leave-one-out cross validation等可分性指标,与其他两种基因选择方法进行了深入的比较,结果表明该方法是十分有效的.
引用
收藏
页码:1125 / 1137
页数:13
相关论文
共 3 条
[1]   基于关联规则的特征选择方法 [J].
何小晨 ;
徐守时 .
红外与激光工程, 2002, (06) :504-507
[2]   一种最优特征集的选择算法 [J].
朱明 ;
王俊普 ;
蔡庆生 .
计算机研究与发展, 1998, (09) :36-38
[3]   Gene Selection for Cancer Classification using Support Vector Machines [J].
Isabelle Guyon ;
Jason Weston ;
Stephen Barnhill ;
Vladimir Vapnik .
Machine Learning, 2002, 46 :389-422