随着后基因组时代和系统生物学时代的到来,蛋白质及蛋白质相互作用得到了人们越来越多的关注和研究。这不仅仅由于蛋白质是人类重要的组成和功能单位,更因为蛋白质相互作用在人类的生物学过程中起着重要的作用。尽管目前储存在人类公共蛋白质相互作用(PPI)数据库中的数据能够为我们提供大量有价值的信息,然而其中很多数据却是以较高的假阳性和假阴性比例而闻名的高通量实验数据。为了让研究人员们能够有效地和正确地使用这些信息,我们有必要对PPI数据库的可靠性进行研究。
由于信号转导数据库中的数据是研究得较为透彻的和经过实验多次证实的数据,因此它可以被用来衡量PPI数据库的可靠性。本文将人类PPI和信号转导数据库中的数据进行了比较,计算了相同的蛋白质数目、相同的蛋白质相互作用数目、保留比率和X/S2c值。结果表明PPI数据库不够可靠,并且很多存在于信号转导数据库中的数据没有被包含在PPI数据库中,因此PPI数据库中的蛋白质相互作用不能够反应真实的蛋白质相互作用网络。同时,Gene Ontology数据库中的亚细胞定位信息被用来考查PPI和信号转导数据库中蛋白质及蛋白质相互作用的亚细胞分布情况,结果表明人类蛋白质及蛋白质相互作用在不同的亚细胞结构中的分布很不均匀。