基于梯度提升决策树的肽碎片离子强度建模

被引:12
作者
怀浩
刘学
张龙波
王晓丹
机构
[1] 山东理工大学计算机科学与技术学院
关键词
串联质谱; 肽碎片离子强度; 梯度提升决策树; 建模;
D O I
10.13367/j.cnki.sdgc.2017.02.014
中图分类号
Q51 [蛋白质]; TP181 [自动推理、机器学习];
学科分类号
070307 [化学生物学]; 140502 [人工智能];
摘要
为找到对蛋白质鉴定算法影响较大的肽碎片离子特征,以提高鉴定结果的正确率,在碎片离子特征与强度信息的基础上进行建模,构建预测模型.实验首先使用pFind对串联质谱数据鉴定,将鉴定结果过滤出需要的肽序列;然后计算出离子质荷比与离子特征值,通过匹配离子的质荷比获取离子强度信息;使用强度信息与离子特征值构建libsvm格式文件,使用XGBoost构建预测模型,其中使用了梯度提升决策树算法;最后使用构建完成的预测模型对蛋白质产生的肽序列做离子强度理论预测.实验结果表明模型所预测的肽序列离子强度与实验离子强度有着较高的相似度,同时分析预测模型可以从预测树中发现肽序列碎裂的规律,提取肽碎片离子中对强度值影响较大的离子特征.
引用
收藏
页码:64 / 68
页数:5
相关论文
共 3 条
[1]
基于支持向量机分类的b/y离子峰选取算法及肽序列标签生成算法的研究 [D]. 
王中胜 .
中国人民解放军军事医学科学院,
2007
[2]
基于泊松分布模型的蛋白质串联质谱鉴定算法研究 [J].
朱思敏 ;
李华梅 .
云南民族大学学报(自然科学版), 2016, 25 (02) :179-184
[3]
一种新颖的蛋白质序列与其串联质谱的匹配打分算法 [J].
于长永 ;
王国仁 ;
毛克明 ;
翟文丹 .
小型微型计算机系统, 2010, 31 (03) :404-407