一种新颖的蛋白质序列与其串联质谱的匹配打分算法

被引:5
作者
于长永
王国仁
毛克明
翟文丹
机构
[1] 东北大学信息科学与工程学院
关键词
蛋白质鉴定; 串联质谱; 数据库搜索; 匹配打分;
D O I
10.20009/j.cnki.21-1106/tp.2010.03.004
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
为了有效的利用蛋白质串联质谱数据,提高蛋白质鉴定的准确性,提出一种基于KNN的蛋白质序列与蛋白质串联质谱的匹配打分算法.蛋白质序列与蛋白质串联质谱的匹配打分是蛋白质数据库搜索鉴定过程中的关键技术.然而,现有的算法没有很好的利用蛋白质串联质谱中离子的强度信息.针对此问题,本文根据质谱中离子的类型给出了全体离子的一个合理的划分,进而抽象出一个高维的强度特征向量,在已知的高精度的数据集上建立了强度匹配知识集合,最后基于KNN技术构造了序列和质谱的匹配打分算法.实验结果表明,本文算法更加有效的利用了蛋白质串联质谱的结构信息,提高了蛋白质鉴定的准确性.
引用
收藏
页码:404 / 407
页数:4
相关论文
共 3 条
[1]
Validated MALDI-TOF/TOF mass spectra for protein standards [J].
Falkner, Jayson A. ;
Kachman, Maureen ;
Veine, Donna M. ;
Walker, Angela ;
Strahler, John R. ;
Andrews, Philip C. .
JOURNAL OF THE AMERICAN SOCIETY FOR MASS SPECTROMETRY, 2007, 18 (05) :850-855
[2]
ProbID: A probabilistic algorithm to identify peptides through sequence database searching using tandem mass spectral data [J].
Zhang, N ;
Aebersold, R ;
Schwilkowski, B .
PROTEOMICS, 2002, 2 (10) :1406-1412
[3]
Probability-based protein identification by searching sequence databases using mass spectrometry data [J].
Perkins, DN ;
Pappin, DJC ;
Creasy, DM ;
Cottrell, JS .
ELECTROPHORESIS, 1999, 20 (18) :3551-3567