考虑样本不平衡的模型无关的基因选择方法

被引:25
作者
李建中
杨昆
高宏
骆吉洲
郭政
机构
[1] 哈尔滨工业大学计算机科学与工程系
[2] 哈尔滨工业大学计算机科学与工程系 黑龙江哈尔滨
[3] 黑龙江哈尔滨
关键词
基因选择; 基因表达; 分类; 微阵列;
D O I
暂无
中图分类号
TP399 [在其他方面的应用];
学科分类号
摘要
在基因表达数据分析中,鉴别基因是后续研究中非常重要的信息基因.有很多研究致力于从基因表达数据中选出信息基因这一挑战性工作,并提出了一些基因选择方法.然而,这些方法(特别是非参数选择方法)都没有考虑不同样本类别中样本大小的不平衡性问题.考虑样本不平衡性和基因选择方法的稳定性,给出一个全新的与数据分布模型无关的基因选择方法.在类内变化小和类间差别大的策略下,选择敏感的度量函数提高方法的鉴别能力,同时,利用类内变化和类间差别的一致性来增加方法的稳定性和适用性.这一方法不但可以应用于两个类别的情况,也可以应用于多个类别的情况.最后,使用两组真实的基因表达数据对所提出的方法进行了验证.实验结果表明,这一方法比其他方法具有更高的有效性和稳健性.
引用
收藏
页码:1485 / 1493
页数:9
相关论文
共 1 条
[1]   Gene Selection for Cancer Classification using Support Vector Machines [J].
Isabelle Guyon ;
Jason Weston ;
Stephen Barnhill ;
Vladimir Vapnik .
Machine Learning, 2002, 46 :389-422