GoPipe:批量序列的Gene Ontology注释和统计分析(英文)

被引:36
作者
陈作舟
薛成海
朱晟
周丰丰
XUEFENG BRUCE LING
刘国平
陈良标
机构
[1] 浙江大学生命科学院,中国科学院自动化研究所,浙江大学生命科学院,中国科学技术大学计算机系,国家高性能计算中心,Tularik Inc, Veterans Blvd, South San Francisco, CA , USA,School of Electronics, University of Glamorgan, Pontypridd CF DL, UK,中国科学院遗传与发育生物学研究所 杭州
[2] 中国科学院遗传与发育生物学研究所,北京,北京,杭州
[3] 中国科学院遗传与发育生物学研究所,北京,合肥,北京
关键词
GeneOntology; 功能基因组学; EST; BLAST; InterProScan; GOA;
D O I
暂无
中图分类号
Q7-3 [];
学科分类号
摘要
随着后基因组时代的到来,批量的测序,特别是EST的测序,逐渐成为普通实验室的日常工作. 这些新的序列往往需要进行批量的Gene Ontology (GO)的注释及随后的统计分析. 但是目前除了Goblet以外,并没有软件适合对未知序列进行批量的GO注释,而GoBlet因为具有上载量的限制,以及仅仅利用BLAST作为预测工具,所以仍有许多不足之处. 开发了一个软件包GoPipe,通过整合BLAST和InterProScan的结果来进行序列注释,并提供了进一步作统计比较的工具. 主程序接收任意个BLAST和InterProScan的结果文件,并依次进行文本分析、数据整合、去除冗余、统计分析和显示等工作. 还提供了统计的工具来比较不同输入对GO的分布来挖掘生物学意义. 另外,在交集工作模式下,程序取InterProScan和BLAST结果的交集,在测试数据集中,其精确度达到99.1%,这大大超过了InterProScan本身对GO预测的精确度,而敏感度只是稍微下降. 较高的精确度、较快的速度和较大的灵活性使它成为对未知序列进行批量Gene Ontology注释的理想的工具. 上述软件包可以在网站(http://gopipe.fishgenome.org/ ) 免费获得或者与作者联系获取.
引用
收藏
页码:187 / 191
页数:5
相关论文
empty
未找到相关数据