DETECTION OF CONSERVED SEGMENTS IN PROTEINS - ITERATIVE SCANNING OF SEQUENCE DATABASES WITH ALIGNMENT BLOCKS

被引：257

作者：

TATUSOV, RL ^{[1
]}

ALTSCHUL, SF ^{[1
]}

KOONIN, EV ^{[1
]}

机构：

[1] NATL LIB MED,NATL CTR BIOTECHNOL INFORMAT,BETHESDA,MD 20894

来源：

PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA | 1994年 / 91卷 / 25期

关键词：

D O I：

10.1073/pnas.91.25.12091

中图分类号：

O [数理科学和化学]; P [天文学、地球科学]; Q [生物科学]; N [自然科学总论];

学科分类号：

07 ; 0710 ; 09 ;

摘要：

We describe an approach to analyzing protein sequence databases that, starting from a single uncharacterized sequence or group of related sequences, generates blocks of conserved segments. The procedure involves iterative database scans with an evolving position-dependent weight matrix constructed from a coevolving set of aligned conserved segments. For each iteration, the expected distribution of matrix scores under a random model is used to set a cutoff score for the inclusion of a segment in the next iteration. This cutoff may be calculated to allow the chance inclusion of either a fixed number or a fixed proportion of false positive segments. With sufficiently high cutoff scores, the procedure converged for all alignment blocks studied, with varying numbers of iterations required. Different methods for calculating weight matrices from alignment blocks were compared. The most effective of those tested was a logarithm-of-odds, Bayesian-based approach that used prior residue probabilities calculated from a mixture of Dirichlet distributions. The procedure described was used to detect novel conserved moths of potential biological importance.

引用

页码：12091 / 12095

页数：5

共 47 条

[1] ALONSO JC, 1993, J BIOL CHEM, V268, P1424
[2] ISSUES IN SEARCHING MOLECULAR SEQUENCE DATABASES
ALTSCHUL, SF
BOGUSKI, MS
GISH, W
WOOTTON, JC
[J]. NATURE GENETICS, 1994, 6 (02) : 119 - 129
[3] PROTEIN DATABASE SEARCHES FOR MULTIPLE ALIGNMENTS
ALTSCHUL, SF
LIPMAN, DJ
[J]. PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, 1990, 87 (14) : 5509 - 5513
[4] BASIC LOCAL ALIGNMENT SEARCH TOOL
ALTSCHUL, SF
GISH, W
MILLER, W
MYERS, EW
LIPMAN, DJ
[J]. JOURNAL OF MOLECULAR BIOLOGY, 1990, 215 (03) : 403 - 410
[5] DESIGN OF A DISCRIMINATING FINGERPRINT FOR G-PROTEIN-COUPLED RECEPTORS
ATTWOOD, TK
FINDLAY, JBC
[J]. PROTEIN ENGINEERING, 1993, 6 (02): : 167 - 176
[6] THE PROSITE DICTIONARY OF SITES AND PATTERNS IN PROTEINS, ITS CURRENT STATUS
BAIROCH, A
[J]. NUCLEIC ACIDS RESEARCH, 1993, 21 (13) : 3097 - 3103
[7] THE SWISS-PROT PROTEIN-SEQUENCE DATA-BANK, RECENT DEVELOPMENTS
BAIROCH, A
BOECKMANN, B
[J]. NUCLEIC ACIDS RESEARCH, 1993, 21 (13) : 3093 - 3096
[8] SELECTION OF DNA-BINDING SITES BY REGULATORY PROTEINS - STATISTICAL-MECHANICAL THEORY AND APPLICATION TO OPERATORS AND PROMOTERS
BERG, OG
VONHIPPEL, PH
[J]. JOURNAL OF MOLECULAR BIOLOGY, 1987, 193 (04) : 723 - 743
[9] FROM GENOME SEQUENCES TO PROTEIN FUNCTION
BORK, P
OUZOUNIS, C
SANDER, C
[J]. CURRENT OPINION IN STRUCTURAL BIOLOGY, 1994, 4 (03) : 393 - 403
[10] COMPILATION, ALIGNMENT, AND PHYLOGENETIC-RELATIONSHIPS OF DNA-POLYMERASES
BRAITHWAITE, DK
ITO, J
[J]. NUCLEIC ACIDS RESEARCH, 1993, 21 (04) : 787 - 802

← 1 2 3 4 5 →