大肠杆菌基因组中重叠基因注释的机器学习优化方法

被引:6
作者
杜明伦
黄君君
马香
唐燕琼
刘柱
机构
[1] 海南大学热带农林学院生物技术系
基金
海南省自然科学基金;
关键词
重叠基因; 机器学习; 卷积神经网络; 功能注释; 支持向量机;
D O I
10.13865/j.cnki.cjbmb.2018.08.09
中图分类号
Q811.4 [生物信息论]; Q933 [微生物遗传学];
学科分类号
071007 [遗传学]; 090609 [兽医生物信息学];
摘要
细菌基因组上存在着大量的重叠基因,这不但缩减基因组尺寸,增加对遗传信息的有效利用,而且参与转录及转录后水平的调控。目前重叠基因的形成原因尚不清楚,缺少预测重叠基因是否存在的特征信息,不利于对重叠基因的注释。本研究通过机器学习中的卷积神经网络算法对基因相关区域进行扫描,发现基因编码区前54 bp的区域可以作为判定重叠基因的标记信息,并采用支持向量机算法确证以上预测结果的准确性。通过对卷积神经网络模型的训练与优化,成功构建卷积神经网络模型,并用于大肠杆菌基因组中重叠基因的注释,对重叠基因的研究有重要意义。已训练好的模型和使用方法已经发布于Git Hub,具体内容参看以下网址:https://github.com/breadpot/ConvolutionalNeuralNetworkBacteria_overlappinggenesprediction。
引用
收藏
页码:861 / 867
页数:7
相关论文
共 14 条
[1]
机器学习方法在基因功能注释中的应用 [J].
李金城 ;
廖奇 ;
沈其君 .
中国生物化学与分子生物学报, 2016, 32 (05) :496-503
[2]
OverGeneDB: a database of 5′ end protein coding overlapping genes in human and mouse genomes [J].
Rosikiewicz, Wojciech ;
Suzuki, Yutaka ;
Makalowska, Izabela .
NUCLEIC ACIDS RESEARCH, 2018, 46 (D1) :D186-D193
[3]
Support vector machine with hypergraph-based pairwise constraints [J].
Hou, Qiuling ;
Lv, Meng ;
Zhen, Ling ;
Jing, Ling .
SPRINGERPLUS, 2016, 5
[4]
Overlapping genes: A significant genomic correlate of prokaryotic growth rates [J].
Saha, Deeya ;
Podder, Soumita ;
Panda, Arup ;
Ghosh, Tapash Chandra .
GENE, 2016, 582 (02) :143-147
[5]
Predicting the sequence specificities of DNA- and RNA-binding proteins by deep learning [J].
Alipanahi, Babak ;
Delong, Andrew ;
Weirauch, Matthew T. ;
Frey, Brendan J. .
NATURE BIOTECHNOLOGY, 2015, 33 (08) :831-+
[6]
Overlapping genes: a new strategy of thermophilic stress tolerance in prokaryotes [J].
Saha, Deeya ;
Panda, Arup ;
Podder, Soumita ;
Ghosh, Tapash Chandra .
EXTREMOPHILES, 2015, 19 (02) :345-353
[7]
Overlapping genes: a window on gene evolvability [J].
Huvet, Maxime ;
Stumpf, Michael P. H. .
BMC GENOMICS, 2014, 15
[8]
Dropout: a simple way to prevent neural networks from overfitting..[J].Nitish Srivastava;Geoffrey E. Hinton;Alex Krizhevsky;Ilya Sutskever;Ruslan Salakhutdinov.Journal of Machine Learning Research.2014, 1
[9]
Missing genes in the annotation of prokaryotic genomes.[J].Warren Andrew ;Archuleta Jeremy;Feng Wu-chun;Setubal João.BMC Bioinformatics.2010, 1
[10]
Evolution of gene overlaps: Relative reading frame bias in prokaryotic two-component system genes [J].
Cock, Peter J. A. ;
Whitworth, David E. .
JOURNAL OF MOLECULAR EVOLUTION, 2007, 64 (04) :457-462