基于模拟退火算法的高分辨率蛋白质质谱数据特征选择

被引:13
作者
李义峰
刘毅慧
机构
[1] 山东轻工业学院信息科学与技术学院智能信息处理研究所
关键词
模拟退火; 特征选择; 线性判别式分析; 癌症早期诊断; 蛋白质质谱;
D O I
暂无
中图分类号
Q51 [蛋白质];
学科分类号
070307 [化学生物学];
摘要
蛋白质质谱技术是蛋白质组学的重要研究工具,它被出色地应用于癌症早期诊断等领域,但是蛋白质质谱数据带来的维灾难问题使得降维成为质谱分析的必需的步骤。本文首先将美国国家癌症研究所提供的高分辨率SELDI-TOF卵巢质谱数据进行预处理;然后将质谱数据的特征选择问题转化成基于模拟退火算法的组合优化模型,用基于线性判别式分析的分类错误率和样本后验概率构造待优化目标函数,用基于均匀分布和控制参数的方法构造新解产生器,在退火过程中添加记忆功能;然后用10-fold交叉验证法选择训练和测试样本,用线性判别式分析分类器评价降维后的质谱数据。实验证明,用模拟退火算法选择6个以上特征时,能够将高分辨率SELDI-TOF卵巢质谱数据全部正确分类,说明模拟退火算法可以很好地应用于蛋白质质谱数据的特征选择。
引用
收藏
页码:85 / 90
页数:6
相关论文
共 2 条
[1]
What is Simulated Annealing? [J].
Trosset, Michael W. .
OPTIMIZATION AND ENGINEERING, 2001, 2 (02) :201-213
[2]
特征选择方法综述 [J].
王娟 ;
慈林林 ;
姚康泽 .
计算机工程与科学, 2005, (12)