运用近邻传播聚类分析进行SELDI-TOF蛋白质谱特征选择

被引:5
作者
杨合龙 [1 ]
祝磊 [1 ]
韩斌 [1 ]
厉力华 [1 ]
郑智国 [2 ]
孟旭莉 [2 ]
机构
[1] 杭州电子科技大学生命信息与仪器工程学院
[2] 浙江省肿瘤研究所
关键词
蛋白质质谱; 近邻传播聚类分析; 特征选择; 生物标志物;
D O I
暂无
中图分类号
R730.2 [肿瘤病理学、病因学];
学科分类号
摘要
针对如何有效分析高通量SELDI-TOF质谱数据以及筛选与肿瘤相关的蛋白质位点,提出一种基于近邻传播聚类分析的特征选择方法。首先利用t-test对SELDI数据进行初筛,然后利用近邻传播聚类分析以及零空间LDA对数据进行降维和去相关处理,最后采用SVM-RFE进行特征选择,筛选出与肿瘤判别相关的蛋白质位点。利用SVM、KNN、NB及J4.8等4个分类器,估算算法的分类性能。结果表明,在卵巢癌公共数据集OC-WCX2a和OC-WCX2b以及浙江省肿瘤医院乳腺癌数据集BC-WCX2a上显示该算法,在上述3个数据集中分类率分别达到96.43%、99.66%、90.88%,敏感性分别达到97.00%、100%、96.17%,特异性分别达到95.85%、99.08%、81.92%,并分别挑选出与肿瘤判别相关的10个蛋白位点。所提出的算法能够获得较好的分类率,有效提取出具有较好判别效果的蛋白质谱位点,有助于癌症的辅助诊断。
引用
收藏
页码:14 / 20
页数:7
相关论文
共 5 条
  • [1] 基于递归零空间线性判别分析算法的蛋白质质谱数据特征选择[J]. 王尧佳,祝磊,韩斌,厉力华,郑智国,牟瀚舟. 航天医学与医学工程. 2010(05)
  • [2] 蛋白质组学质谱数据预处理技术综述
    孟辉
    洪文学
    [J]. 中国生物医学工程学报, 2009, 28 (03) : 469 - 475
  • [3] 基于SVM RFE的人脸特征选择方法
    李伟红
    龚卫国
    陈伟民
    梁毅雄
    尹克重
    [J]. 光电工程, 2006, (05) : 113 - 117
  • [4] A clustering based hybrid system for biomarker selection and sample classification of mass spectrometry data[J] . Pengyi Yang,Zili Zhang,Bing B. Zhou,Albert Y. Zomaya. Neurocomputing . 2010 (13)
  • [5] Data mining in proteomic mass spectrometry[J] . Asha Thomas,Georgia D. Tourassi,Adel S. Elmaghraby,Roland Valdes,Saeed A. Jortani. Clinical Proteomics . 2006 (1)