蛋白质结构预测问题就是如何从蛋白质的氨基酸序列出发预测它的构象折叠。怎样由一定的氨基酸顺序排列的多肽链生成一定空间结构的蛋白质,这是一个人类破译生命奥秘的重大问题。蛋白质的折叠问题就是通过蛋白质的一级结构来预测蛋白质的三维结构。蛋白质折叠热力学假说中明确指出蛋白质一级结构可以完全决定其空间构型,天然结构下的蛋白质的自由能是全局最小值。因而如何从一级结构预测其三维构型以及如何找到蛋白质折叠能量函数的最小值就成为目前国内外的研究热点。蛋白质折叠过程是热力学过程和动力学过程的综合,其折叠的随机性、过程的复杂性可想而知。因而要对折叠过程进行研究,寻找能量函数的极小值必须借助简化模型和特殊方法进行。
本文的工作是在二维HP非格模型的基础上展开的。蛋白质结构预测模型存在着大量的局部极小值,本文结合遗传算法和模拟退火算法的特点,形成混合遗传退火算法,并用于二维HP非格模型进行蛋白质折叠结构预测,二维HP非格模型把20种氨基酸分为疏水性H和亲水性P两种残基考虑。通过对遗传退火算法中的交叉和变异操作的改进,并且重新设计出假设生成后的排序策略,优化算法能在保持较高精度的情况下搜索到蛋白质序列的最低能量构形。
利用本文的方法对一系列的蛋白质链的空间结构进行了预测,通过对遗传退火混合法的分析与其他方法的预测结果的对比,我们发现本文中的方法生成的新的构象具有更佳的合法性,也减少了无效构象产生的几率,所以能更快地找到合法的能量最低的构象。实验结果表明该混合遗传退火算法优于单纯的遗传法和模拟退火算法。