Electronic Notebook for Protein Sequence Analysis

The electronic notebook is a tutorial and analysis web-form consisting of a set of links to DNA and protein analysis tools combined with areas into which results and personal notes can be recorded. All the analysis tools open into a second "tools" window from which the results can be transferred into the notebook. These results and notes can be saved to a local file using the "Save the Notebook" buttons found throughout the notebook. The "Cheat now!" links open a third window in which a complete set of results have already been recorded. The electronic notebook can also be used to analyze a new DNA sequence by substituting the new sequence for the original sequence found in the DNA sequence text area.

Start here with your DNA sequence

Initial DNA Sequence

234301 gattggccag cgggaagggc atctcgatgc ccaggacctt gccgtggacg actgtcttca
   234361 ccgccgttgc ctcctcggcc agggcgaagt cgatggagaa gctgaccgtg gtgttcctct 
   234421 tgaggatgca ctccgccttg gtggtgtcgc agccctcgat ggccacccgg gtgaacttgc 
   234481 ccgtcttcga tccgcaatcg ctgaactcga gggctccggc gaagaccacc agtgcagcac 
   234541 aggcaattac cgcgtacctc agcattttct tccacttaat tgaattacaa ggtaaacgta 
   234601 tcgggtggct tttccgctgg ctctcgcctc tttctgcctc ttcacagcgc tacgaatcta 
   234661 ctaaatctgg agagagtccg aagacaacgc aaagctttcg tatgaacgga aaacagctgc 
   234721 gcgcggcgac tcagaagaaa gctttcttcg acgattgacg ggagtgctgc gaactatcgc 
   234781 ttgaagggaa taaatattat atatattata gcttatataa caattataaa atatagttat 
   234841 tttagaaaag taagtataat gtttcctggc aaccatatat taattaatgg ggatcgcgga 
   234901 gaataaatat ttcattgcct acttatgggc atgtgctcga atactgaagc atattttcaa 
   234961 aattcaagta attaaactta caaaatgtaa atttttccaa atattcagta tatgaaagcc 
   235021 ataaattaaa ctgattttaa atagttttta ttcactcagt catattttgc acagaagcca 
   235081 agagttcggt tagaaaaagt ccaaaagggg agcactggcg agctttcgcc cccgcgataa 
   235141 atatcgaatg cagaccggca aaagcttcag ctcacgacct tttgcgcttg ccgcttttgt 
   235201 ctttagtatt ctcttgaggc cggcggcgat tggcaacgtt tattacagtt tctaattgtt 
   235261 attaacttaa agcttagtac aaccaccgag tgcatttagc aatgtcgcag atctgtaagc 
   235321 gcggtttgtt gatcagcaac cgattggcgc ccgccgccct ccgctgcaag tgagtaagcg 
   235381 ggacggagag agggctccca gcggccagcg tgcgtgctgg aaagagacag caggccgacg 
   235441 aacacgttgc agatgcagca gtgtcatttg ccaaggtcat tgcagttgcc ggtcgagctg 
   235501 cagtgacaca tttgtgtttg ttttccccag cactgcataa tttgtttgtc cttgcgggct 
   235561 cgttctccag ttttagcact atactaaatc tgttatacgg atttattgtt atatcagcac 
   235621 aggggccttt tatttaatca tctttcgctc tgggcaaatg taaaacaatt atttccgctg 
   235681 tttccagctg tttttatctc gtcggctaat atttgcatat gtttcgggcc ctctactata 
   235741 ctatatagac tgattggcct attggcggac gtatgtgtat ttatttttaa agccaattct 
   235801 gtgacgctcc atgctctttt ctgctaattt cattccactt gagggaacat tttgaaacca 
   235861 catgacgacg gatgggttgg tagaaaacag gtgccaaaat gagcttaaat cactccaaca 
   235921 ttcttgaatt attatatttt tagtggttag gaataaagaa ataattcaag tttcaaaata 
   235981 tttgaatttg tacgaaatca actgtgaaaa agacatcaaa aagtattttt tctacatcaa 
   236041 aattgcaagt ttaagttaat attaagttat gagtagaacc attattatga cgcttaagga 
   236101 cattgtgcat gtgtggtcca acgacccggg agaacggatg tgccgagcga acagagtgta 
   236161 gggtattcgt ggtcatatca cgcttctgtc gcgtgctttg atttccattt tatgaagctc 
   236221 cttggcttgt gggcggtttg ttttatcgaa gtcagaaggt tctttccgga aatcaaacaa 
   236281 tcagatcgaa agacaggtgg cgcctaattg aaagagttta attaagttta ataacttcca 
   236341 cgatttattg ctgaatattg agaaggagat ttggaaagcc ggctacgtca gcaaacaatc 
   236401 atcgaggtta tcgctgacgt aggcttaaat ggatctatat tgtatacttt gtaatcgccg 
   236461 accgagttcc cataataaca tgtttacagc tgatatgggg gggctattta agacccccgt 
   236521 gtcgttgggg gtacgaagtg ttaacagtgg gggcgaaatc caagaaaacc tttagatgac 
   236581 tttcaaactt tagtcatgaa agcgaaatga taaatgatag ccacaagtgg tcagacgtgg 
   236641 atgagataac ctactactaa gcagtttcat aatctaccaa ttaaatttaa aacagataag 
   236701 gacttcgtgg ggcgttctcg ggcattctag ggttaaaggt tgacgggcaa tagaaatcac 
   236761 ttggcaagtg tggcagatat aaggatgttt ttaatacata cgtgatggat attgtgatgc 
   236821 aatgattaat atatcattat tattctagat caacatggtt ctccgaggtg cagatgggcc 
   236881 cacccgatgc catcttgggt gtcacggaag ccttcaagaa ggacaccaac cccaagaaga 
   236941 tcaacttggg cgctggcgcc tatcgcgatg acaacaccca gcccttcgtg ctccccagtg 
   237001 ttcgggaggt gagttcagat caagtttaaa ctaaacccaa ttttgaaaca tagttatcgt 
   237061 ttatgaccag gccgagaaga gagtggtgag ccgtagtctg gacaaggagt acgccacaat 
   237121 catcggcatt cccgagttct acaacaaggc catcgagctg gcattgggca aggtaattat 
   237181 atcccttatg actgaggaat gtcctaaaaa ttaataagta ttcctttatt acagggatcc 
   237241 aagcgtttgg cggccaagca caacgtgacc gcccagtcca tcagtggaac tggagctctg 
   237301 cgcatcggag ccgccttcct ggccaagttc tggcagggca accgcgagat ctacatcccg 
   237361 tcgccatcgt ggggcaacca tgtggccatt ttcgagcacg ccggtctgcc ggtgaaccga 
   237421 taccgctact acgacaagga cacctgtgcc ctggactttg gcggcctgat cgaggatctg 
   237481 aaggtgagga tttacattgc cactgattga tgttctttga tatgcttacc cattgtttat 
   237541 taccttttcc agaaaatccc cgagaagagc attgttcttc tgcacgcctg cgcccacaac 
   237601 cccactggag tggatcccac tctggagcag tggcgtgaga tctcggctct ggtcaagaaa 
   237661 cgcaatctgt atcccttcat cgacatggcc taccaaggct tcgccaccgg agacattgac 
   237721 cgcgacgccc aggcggtccg caccttcgag gccgatggcc acgacttctg cctggcccag 
   237781 agtttcgcca agaacatggg attgtatggt gagcgcgctg gcgccttcac cgtgctgtgc 
   237841 tccgacgagg aggaggctgc tcgcgtgatg tcccaagtta agatcctgat ccgtggtctg 
   237901 tactccaatc ccccggtgca cggagctcgt attgccgccg agatcctcaa caacgaggac 
   237961 ttgcgcgccc agtggctgaa ggatgtgaag ctgatggccg accgcatcat cgatgtgcgc 
   238021 accaagctca aggacaatct aattaagctg ggatccagcc agaactggga ccacattgtc 
   238081 aaccaaatcg gcatgttctg cttcacgggc ctgaagccgg agcaggtgca gaagctgatc 
   238141 aaggatcaca gcgtctatct caccaacgat ggacgtgttt cgatggcggg agtcaccagc 
   238201 aagaatgtcg agtacctggc tgagagcata cacaaggtta ccaagtaagg aggaccagtg 
   238261 gagatcgaag tggagatgga gtttctgtag taccttctaa tcggcacttg tacgaatttt 
   238321 ctagcaccaa cgaaattgcg aagtctagat aagccaatgc attttgcaca ctctctatcc 
   238381 atatctctgt atataagcta aatgatctgc cttttaaaaa ataaagcatt taaaatgtta 
   238441 gtaaatacga ttcgtatttt ttatgaaaaa tgaacagatg taacagaaag cagaagaact 
   238501 ttgtgttcgc atttagataa tcatatatta ctagcatcca atttttatat acaactagga 
   238561 tcacggtttg ttataacgat atcttaactt atcgctcggc tcgcagtact ccttgataat 
   238621 gagcttgcac aggaatatgt ggaatactat gattattgcg cacacggaaa cccagaagag 
   238681 cgtgggcaat ccacccagtt ggtggccatg ccgatgcagt gcgatcaaat gctgctcatg 
   238741 ggcgggagct gaatggaata attacataat ttacataact tgaatatgat tgcccagtga 
   238801 aacttcttac cctcgaccac ttccttcacg tggatggcat ggtgcagctc ttccatgtgt 
   238861 tgcttgtcct cggttatgta taatattgct gttagcggtt cagtcagttt gactgggaat 
   238921 tgtcgtcggt tttgcctgca aagtgatata atttcaatat gttcccaaag gattatatgt 
   238981 gagttaaaat tacgtgagca gcacgggctc atccaggcag ccgccatcgc aagcgtagta 
   239041 gctcctgtct gaacgatcca gcgcgatgtt gatcaccgcc ttgttgtcat catccacaat 
   239101 gatggtgacg ttgacatggg ttttgttgcc gtaattgagg cgcctgaagt ggaagtccct 
   239161 atgcagaaac ttcggatgga tgttgcactc cagatgctga ttgctaaaac gaaagctgcc 
   239221 aaagctcagg accatggctt ggatgactcc cgaagctccc gctcgaataa gattgtggca 
   239281 gccctgtttc tccaacgtta gcatccacga cgtaaccagg gagttaagct gctgaagatt 
   239341 agacatctcg cgccaaagat tctccgcctg cagagtgtga tacgaatcgt agcagccttc

DNA Sequence Notes

GENSCANW output for sequence 14:10:32

GENSCAN 1.0     Date run: 21-Aug-100    Time: 14:10:34

Sequence 14:10:32 : 5100 bp : 46.29% C+G : Isochore 2 (43 - 51 C+G%)

Parameter matrix: HumanIso.smat

Predicted genes/exons:

Gn.Ex Type S .Begin ...End .Len Fr Ph I/Ac Do/T CodRg P.... Tscr..
----- ---- - ------ ------ ---- -- -- ---- ---- ----- ----- ------

1.01 Sngl +     27    458  432  2  0   48   49   383 0.447  24.68
 1.02 PlyA +    489    494    6                               1.05

2.00 Prom +    830    869   40                              -6.86
 2.01 Init +   1002   1069   68  2  2   53   89    83 0.970   3.88
 2.02 Intr +   2549   2708  160  2  1   72  105   284 0.980  28.49
 2.03 Intr +   2771   2872  102  1  0   10   86   251 0.999  17.47
 2.04 Intr +   2935   3183  249  0  0   73  100   586 0.999  55.93
 2.05 Term +   3253   3948  696  0  0   90   49  1324 0.999 122.25
 2.06 PlyA +   4120   4125    6                               1.05

3.04 PlyA -   4162   4157    6                              -0.45
 3.03 Term -   4448   4261  188  0  2   37   42    95 0.922  -2.55
 3.02 Intr -   4635   4511  125  2  2   44   90    91 0.949   5.13
 3.01 Init -   5046   4694  353  0  2   66   43   485 0.897  38.43

Click here to view a gif image of the predicted gene(s)

Click here for a PostScript image of the predicted gene(s)

Predicted peptide sequence(s):

Predicted coding sequence(s):

>14:10:32|GENSCAN_predicted_peptide_1|143_aa
MPRTLPWTTVFTAVASSARAKSMEKLTVVFLLRMHSALVVSQPSMATRVNLPVFDPQSLN
SRAPAKTTSAAQAITAYLSIFFHLIELQGKRIGWLFRWLSPLSASSQRYESTKSGESPKT
TQSFRMNGKQLRAATQKKAFFDD

>14:10:32|GENSCAN_predicted_CDS_1|432_bp
atgcccaggaccttgccgtggacgactgtcttcaccgccgttgcctcctcggccagggcg
aagtcgatggagaagctgaccgtggtgttcctcttgaggatgcactccgccttggtggtg
tcgcagccctcgatggccacccgggtgaacttgcccgtcttcgatccgcaatcgctgaac
tcgagggctccggcgaagaccaccagtgcagcacaggcaattaccgcgtacctcagcatt
ttcttccacttaattgaattacaaggtaaacgtatcgggtggcttttccgctggctctcg
cctctttctgcctcttcacagcgctacgaatctactaaatctggagagagtccgaagaca
acgcaaagctttcgtatgaacggaaaacagctgcgcgcggcgactcagaagaaagctttc
ttcgacgattga

>14:10:32|GENSCAN_predicted_peptide_2|424_aa
MSQICKRGLLISNRLAPAALRCKSTWFSEVQMGPPDAILGVTEAFKKDTNPKKINLGAGA
YRDDNTQPFVLPSVREAEKRVVSRSLDKEYATIIGIPEFYNKAIELALGKGSKRLAAKHN
VTAQSISGTGALRIGAAFLAKFWQGNREIYIPSPSWGNHVAIFEHAGLPVNRYRYYDKDT
CALDFGGLIEDLKKIPEKSIVLLHACAHNPTGVDPTLEQWREISALVKKRNLYPFIDMAY
QGFATGDIDRDAQAVRTFEADGHDFCLAQSFAKNMGLYGERAGAFTVLCSDEEEAARVMS
QVKILIRGLYSNPPVHGARIAAEILNNEDLRAQWLKDVKLMADRIIDVRTKLKDNLIKLG
SSQNWDHIVNQIGMFCFTGLKPEQVQKLIKDHSVYLTNDGRVSMAGVTSKNVEYLAESIH
KVTK

>14:10:32|GENSCAN_predicted_CDS_2|1275_bp
atgtcgcagatctgtaagcgcggtttgttgatcagcaaccgattggcgcccgccgccctc
cgctgcaaatcaacatggttctccgaggtgcagatgggcccacccgatgccatcttgggt
gtcacggaagccttcaagaaggacaccaaccccaagaagatcaacttgggcgctggcgcc
tatcgcgatgacaacacccagcccttcgtgctccccagtgttcgggaggccgagaagaga
gtggtgagccgtagtctggacaaggagtacgccacaatcatcggcattcccgagttctac
aacaaggccatcgagctggcattgggcaagggatccaagcgtttggcggccaagcacaac
gtgaccgcccagtccatcagtggaactggagctctgcgcatcggagccgccttcctggcc
aagttctggcagggcaaccgcgagatctacatcccgtcgccatcgtggggcaaccatgtg
gccattttcgagcacgccggtctgccggtgaaccgataccgctactacgacaaggacacc
tgtgccctggactttggcggcctgatcgaggatctgaagaaaatccccgagaagagcatt
gttcttctgcacgcctgcgcccacaaccccactggagtggatcccactctggagcagtgg
cgtgagatctcggctctggtcaagaaacgcaatctgtatcccttcatcgacatggcctac
caaggcttcgccaccggagacattgaccgcgacgcccaggcggtccgcaccttcgaggcc
gatggccacgacttctgcctggcccagagtttcgccaagaacatgggattgtatggtgag
cgcgctggcgccttcaccgtgctgtgctccgacgaggaggaggctgctcgcgtgatgtcc
caagttaagatcctgatccgtggtctgtactccaatcccccggtgcacggagctcgtatt
gccgccgagatcctcaacaacgaggacttgcgcgcccagtggctgaaggatgtgaagctg
atggccgaccgcatcatcgatgtgcgcaccaagctcaaggacaatctaattaagctggga
tccagccagaactgggaccacattgtcaaccaaatcggcatgttctgcttcacgggcctg
aagccggagcaggtgcagaagctgatcaaggatcacagcgtctatctcaccaacgatgga
cgtgtttcgatggcgggagtcaccagcaagaatgtcgagtacctggctgagagcatacac
aaggttaccaagtaa

>14:10:32|GENSCAN_predicted_peptide_3|221_aa
MSNLQQLNSLVTSWMLTLEKQGCHNLIRAGASGVIQAMVLSFGSFRFSNQHLECNIHPKF
LHRDFHFRRLNYGNKTHVNVTIIVDDDNKAVINIALDRSDRSYYACDGGCLDEPVLLTQN
RRQFPVKLTEPLTAILYITEDKQHMEELHHAIHVKEVVEAPAHEQHLIALHRHGHQLGGL
PTLFWVSVCAIIIVFHIFLCKLIIKEYCEPSDKLRYRYNKP

>14:10:32|GENSCAN_predicted_CDS_3|666_bp
atgtctaatcttcagcagcttaactccctggttacgtcgtggatgctaacgttggagaaa
cagggctgccacaatcttattcgagcgggagcttcgggagtcatccaagccatggtcctg
agctttggcagctttcgttttagcaatcagcatctggagtgcaacatccatccgaagttt
ctgcatagggacttccacttcaggcgcctcaattacggcaacaaaacccatgtcaacgtc
accatcattgtggatgatgacaacaaggcggtgatcaacatcgcgctggatcgttcagac
aggagctactacgcttgcgatggcggctgcctggatgagcccgtgctgctcacgcaaaac
cgacgacaattcccagtcaaactgactgaaccgctaacagcaatattatacataaccgag
gacaagcaacacatggaagagctgcaccatgccatccacgtgaaggaagtggtcgaggct
cccgcccatgagcagcatttgatcgcactgcatcggcatggccaccaactgggtggattg
cccacgctcttctgggtttccgtgtgcgcaataatcatagtattccacatattcctgtgc
aagctcattatcaaggagtactgcgagccgagcgataagttaagatatcgttataacaaa
ccgtga

Explanation

Gn.Ex : gene number, exon number (for reference)
Type  : Init = Initial exon
        Intr = Internal exon
        Term = Terminal exon
        Sngl = Single-exon gene
        Prom = Promoter
        PlyA = poly-A signal
S     : DNA strand (+ = input strand; - = opposite strand)
Begin : beginning of exon or signal (numbered on input strand)
End   : end point of exon or signal (numbered on input strand)
Len   : length of exon or signal (bp)
Fr    : reading frame (a codon ending at x is in frame f = x mod 3)
Ph    : net phase of exon (length mod 3)
I/Ac  : initiation signal or acceptor splice site score (x 10)
Do/T  : donor splice site or termination signal score (x 10)
CodRg : coding region score (x 10)
P     : probability of exon (sum over all parses containing exon)
Tscr  : exon score (depends on length, I/Ac, Do/T and CodRg scores)

Comments

The SCORE of a predicted feature (e.g., exon or splice site) is a
log-odds measure of the quality of the feature based on local sequence
properties. Thus, for example, a predicted donor splice site with
score > 100 is excellent; 50-100 is acceptable; 0-50 is weak; and
below 0 is poor (probably not a real donor site).

The PROBABILITY of a predicted exon is the estimated probability under
GENSCAN's model of genomic sequence structure that the exon is correct.
This probability depends in general on global as well as local sequence
properties.  This information can be used to assess the reliability of the
predicted exon, e.g., it would be better to design PCR primers based on
a predicted exon with probability > 0.95 than one with lower probability.

To identify any exons in the DNA sequence and generate a predicted protein sequence, click here:

GenScan

Paste your DNA sequence into the GenScan input window and press the "Run Genscan" button. Select the protein translation with the highest exon P-values and paste this FASTA formatted output into your notebook.

Protein Sequence from Genscan

>14:10:32|GENSCAN_predicted_peptide_2|424_aa MSQICKRGLLISNRLAPAALRCKSTWFSEVQMGPPDAILGVTEAFKKDTNPKKINLGAGA YRDDNTQPFVLPSVREAEKRVVSRSLDKEYATIIGIPEFYNKAIELALGKGSKRLAAKHN VTAQSISGTGALRIGAAFLAKFWQGNREIYIPSPSWGNHVAIFEHAGLPVNRYRYYDKDT CALDFGGLIEDLKKIPEKSIVLLHACAHNPTGVDPTLEQWREISALVKKRNLYPFIDMAY QGFATGDIDRDAQAVRTFEADGHDFCLAQSFAKNMGLYGERAGAFTVLCSDEEEAARVMS QVKILIRGLYSNPPVHGARIAAEILNNEDLRAQWLKDVKLMADRIIDVRTKLKDNLIKLG SSQNWDHIVNQIGMFCFTGLKPEQVQKLIKDHSVYLTNDGRVSMAGVTSKNVEYLAESIH KVTK

Protein Sequence Notes

To scan the protein sequence for the occurrence of motifs/patterns found in the PROSITE database, use:

ScanProsite
Paste the raw (leave off the fasta defline) protein sequence from GenScan into the ScanProsite input box, choose to Exclude patterns with a high probability of occurrence, and press the "Start the Scan" button. Paste the ScanProsite hit into your notebook. To see the Prosite summary for the hit, click on the PDOCxxxx number.

Hit from ScanProsite

[1] PDOC00098 PS00105 AA_TRANSFER_CLASS_1 Aminotransferases class-I pyridoxal-phosphate attachment site 270-283 SFAKNMGLYGERAG

Prosite pattern

270-283 SFAKNMGLYGERAG

Prosite Summary

Aminotransferases share certain mechanistic features with other pyridoxal- phosphate dependent enzymes, such as the covalent binding of the pyridoxal- phosphate group to a lysine residue. On the basis of sequence similarity, these various enzymes can be grouped [1,2] into subfamilies. One of these, called class-I, currently consists of the following enzymes: - Aspartate aminotransferase (AAT) (EC 2.6.1.1). AAT catalyzes the reversible transfer of the amino group from L-aspartate to 2-oxoglutarate to form oxaloacetate and L-glutamate. In eukaryotes, there are two AAT isozymes: one is located in the mitochondrial matrix, the second is cytoplasmic. In prokaryotes, only one form of AAT is found (gene aspC). - Tyrosine aminotransferase (EC 2.6.1.5) which catalyzes the first step in tyrosine catabolism by reversibly transferring its amino group to 2- oxoglutarate to form 4-hydroxyphenylpyruvate and L-glutamate. - Aromatic aminotransferase (EC 2.6.1.57) involved in the synthesis of Phe, Tyr, Asp and Leu (gene tyrB). - 1-aminocyclopropane-1-carboxylate synthase (EC 4.4.1.14) (ACC synthase) from plants. ACC synthase catalyzes the first step in ethylene biosynthesis. - Pseudomonas denitrificans cobC, which is involved in cobalamin biosynthesis. - Yeast hypothetical protein YJL060w. The sequence around the pyridoxal-phosphate attachment site of this class of enzyme is sufficiently conserved to allow the creation of a specific pattern. Description of pattern(s) and/or profile(s) Consensus pattern [GS]-[LIVMFYTAC]-[GSTA]-K-x(2)-[GSALVN]-[LIVMFA]-x-[GNAR]- x-R-[LIVMA]-[GA] [K is the pyridoxal-P attachment site] Sequences known to belong to this class detected by the pattern ALL. Other sequence(s) detected in SWISS-PROT NONE. Last update November 1995 / Pattern and text revised. References [ 1] Bairoch A. Unpublished observations (1992). [ 2] Sung M.H., Tanizawa K., Tanaka H., Kuramitsu S., Kagamiyama H., Hirotsu K., Okamoto A., Higuchi T., Soda K. J. Biol. Chem. 266:2567-2572(1991).

Prosite Notes

To search for proteins with similar sequences, use:

Run a BLASTp search against the SwissProt database by pasting the protein sequence from GenScan into the input box on the Advanced BLAST page. Choose the SwissProt database from the database listbox and the "blastp" program from the program listbox, then press the "Submit" button. Format your results as "Flat query anchored with identities" and paste this alignment into your notebook.

BLASTP Alignment (against SwissProt)

BLASTP 2.0.14 [Jun-29-2000] Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Sch�ffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402. RID: 966881580-16936-21877 Query= 14:10:32|GENSCAN_predicted_peptide_2|424_aa (424 letters) Database: Non-redundant SwissProt sequences 88,348 sequences; 31,835,007 total letters If you have any problems or questions with the results of this search please refer to the BLAST FAQs Taxonomy reports Distribution of 60 Blast Hits on the Query Sequence Score E Sequences producing significant alignments: (bits) Value sp|P00505|AATM_HUMAN ASPARTATE AMINOTRANSFERASE, MITOCHOND... 549 e-156 sp|P05202|AATM_MOUSE ASPARTATE AMINOTRANSFERASE, MITOCHOND... 549 e-156 sp|P00507|AATM_RAT ASPARTATE AMINOTRANSFERASE, MITOCHONDRI... 548 e-156 sp|P00506|AATM_PIG ASPARTATE AMINOTRANSFERASE, MITOCHONDRIA... 543 e-154 sp|P12344|AATM_BOVIN ASPARTATE AMINOTRANSFERASE, MITOCHONDR... 542 e-154 sp|P00508|AATM_CHICK ASPARTATE AMINOTRANSFERASE, MITOCHONDR... 538 e-153 sp|P08907|AATM_HORSE ASPARTATE AMINOTRANSFERASE, MITOCHONDR... 538 e-152 sp|P46643|AAT1_ARATH ASPARTATE AMINOTRANSFERASE, MITOCHONDR... 434 e-121 sp|P28011|AAT1_MEDSA ASPARTATE AMINOTRANSFERASE 1 (TRANSAMI... 422 e-118 sp|P46644|AAT3_ARATH ASPARTATE AMINOTRANSFERASE, CHLOROPLAS... 409 e-114 sp|P28734|AATC_DAUCA ASPARTATE AMINOTRANSFERASE, CYTOPLASMI... 409 e-114 sp|P46645|AAT2_ARATH ASPARTATE AMINOTRANSFERASE, CYTOPLASMI... 408 e-113 sp|P37833|AATC_ORYSA ASPARTATE AMINOTRANSFERASE, CYTOPLASMI... 405 e-113 sp|P00504|AATC_CHICK ASPARTATE AMINOTRANSFERASE, CYTOPLASMI... 394 e-109 sp|P46646|AAT4_ARATH ASPARTATE AMINOTRANSFERASE, CYTOPLASMI... 390 e-108 sp|P17174|AATC_HUMAN ASPARTATE AMINOTRANSFERASE, CYTOPLASM... 390 e-108 sp|P46248|AATM_ARATH ASPARTATE AMINOTRANSFERASE, MITOCHONDR... 385 e-107 sp|P26563|AATM_LUPAN ASPARTATE AMINOTRANSFERASE-P2, MITOCHO... 385 e-106 sp|P00503|AATC_PIG ASPARTATE AMINOTRANSFERASE, CYTOPLASMIC ... 384 e-106 sp|P08906|AATC_HORSE ASPARTATE AMINOTRANSFERASE, CYTOPLASMI... 381 e-105 sp|P05201|AATC_MOUSE ASPARTATE AMINOTRANSFERASE, CYTOPLASM... 381 e-105 sp|P33097|AATC_BOVIN ASPARTATE AMINOTRANSFERASE, CYTOPLASMI... 379 e-105 sp|P13221|AATC_RAT ASPARTATE AMINOTRANSFERASE, CYTOPLASMIC... 376 e-104 sp|P23542|AATC_YEAST ASPARTATE AMINOTRANSFERASE, CYTOPLASMI... 356 5e-98 sp|Q22067|AATC_CAEEL PROBABLE ASPARTATE AMINOTRANSFERASE, C... 340 3e-93 sp|P44425|AAT_HAEIN ASPARTATE AMINOTRANSFERASE (TRANSAMINAS... 336 5e-92 sp|P00509|AAT_ECOLI ASPARTATE AMINOTRANSFERASE (TRANSAMINAS... 325 9e-89 sp|P74861|TYRB_SALTY AROMATIC-AMINO-ACID AMINOTRANSFERASE (... 281 2e-75 sp|P04693|TYRB_ECOLI AROMATIC-AMINO-ACID AMINOTRANSFERASE (... 280 3e-75 sp|P43336|PHHC_PSEAE AROMATIC-AMINO-ACID AMINOTRANSFERASE 279 1e-74 sp|Q01802|AATM_YEAST ASPARTATE AMINOTRANSFERASE, MITOCHONDR... 266 6e-71 sp|P95468|TYRB_PARDE AROMATIC-AMINO-ACID AMINOTRANSFERASE (... 264 3e-70 sp|Q02636|ATTY_RHIME TYROSINE AMINOTRANSFERASE (L-TYROSINE:... 220 5e-57 sp|Q56114|AAT_SALTI ASPARTATE AMINOTRANSFERASE (TRANSAMINAS... 65 2e-10 sp|P72173|AAT_PSEAE ASPARTATE AMINOTRANSFERASE (TRANSAMINAS... 59 2e-08 sp|P12345|AATM_RABIT ASPARTATE AMINOTRANSFERASE, MITOCHONDR... 52 2e-06 sp|O67781|AAT_AQUAE ASPARTATE AMINOTRANSFERASE (TRANSAMINAS... 50 7e-06 sp|P16524|PATA_BACSU PUTATIVE AMINOTRANSFERASE A 45 4e-04 sp|P23034|AAT_BACSP ASPARTATE AMINOTRANSFERASE (TRANSAMINAS... 37 0.088 sp|P14909|AAT_SULSO ASPARTATE AMINOTRANSFERASE (TRANSAMINAS... 35 0.26 sp|P39643|AAT2_BACSU PROBABLE ASPARTATE AMINOTRANSFERASE (T... 34 0.76 sp|P72817|YG54_SYNY3 HYPOTHETICAL 16.8 KD PROTEIN SLL1654 32 1.7 sp|P47039|YJG0_YEAST HYPOTHETICAL AMINOTRANSFERASE YJL060W 32 1.7 sp|Q58179|Y769_METJA HYPOTHETICAL PROTEIN MJ0769 32 2.3 sp|Q02135|HIS8_LACLA HISTIDINOL-PHOSPHATE AMINOTRANSFERASE ... 32 2.9 sp|P23549|GUN3_BACSU ENDOGLUCANASE PRECURSOR (ENDO-1,4-BETA... 32 2.9 sp|P10475|GUN2_BACSU ENDOGLUCANASE PRECURSOR (ENDO-1,4-BETA... 32 2.9 sp|P07983|GUN1_BACSU ENDOGLUCANASE PRECURSOR (ENDO-1,4-BETA... 32 2.9 sp|P35580|MYSO_HUMAN MYOSIN HEAVY CHAIN, NONMUSCLE TYPE B (... 31 3.9 sp|O14209|YDT4_SCHPO HYPOTHETICAL AMINOTRANSFERASE C6B12.04C 31 3.9 sp|O27624|HIS8_METTH PROBABLE HISTIDINOL-PHOSPHATE AMINOTRA... 31 3.9 sp|P52588|PDI_MAIZE PROTEIN DISULFIDE ISOMERASE PRECURSOR (... 31 5.1 sp|O83466|SYI_TREPA ISOLEUCYL-TRNA SYNTHETASE (ISOLEUCINE--... 31 5.1 sp|P08183|MDR1_HUMAN MULTIDRUG RESISTANCE PROTEIN 1 (P-GLYC... 31 5.1 sp|O87320|AATC_RHIME PUTATIVE AMINOTRANSFERASE AATC 31 6.6 sp|P21448|MDR1_CRIGR MULTIDRUG RESISTANCE PROTEIN 1 (P-GLYC... 31 6.6 sp|P46893|PPSA_STAMA PROBABLE PHOSPHOENOLPYRUVATE SYNTHASE ... 31 6.6 sp|P21447|MDR3_MOUSE MULTIDRUG RESISTANCE PROTEIN 3 (P-GLYC... 31 6.6 sp|P07976|HEMA_IACKP HEMAGGLUTININ PRECURSOR [CONTAINS: HEM... 30 8.7 sp|P07977|HEMA_IACKQ HEMAGGLUTININ PRECURSOR [CONTAINS: HEM... 30 8.7 Alignments tmpseq_1 1 MSQICKRGLLISNRLAPAALRCKSTWFSEVQMGPPDAILGVTEAFK--KDTNPKKIN-LG 57 112983 21 ..A..SARA.S.WTH.E.....P.........--R...S..M.-.. 63 112984 21 ..A..SARA.S.WTH.E.....P.........--R...S..M.-.. 63 112987 21 ..A..SARA.S.WTH.E.....P.........--R...S..M.-.. 63 112985 21 ..A..SARA.S.WAH.E.....P.........--R...S..M.-.. 63 1168261 21 ..A..SARA.S.WAH.E.....P.........--R...S..M.-.. 63 112981 1 .ALLQS.L..SAP.R.A.TA.A-.S.W.H.E.....P.........--R...S..M.-.. 56 112982 1 .S.WAH.E.....P.......Y.--R...S..M.-.. 34 1168256 26 ..SM.S.WKS.EPA.K.P........L--A.PS.E.V.-V. 63 2506178 1 MA.QNIT.SPTASSDSV.AHLVRA.E.P.....V.YN--..PS.I.L.-.. 48 1168258 49 ..HLVQA.E.P.....V.YN--..PS.V.L.-.. 79 112972 2 .SV.AN.VRA.E.P.....V.YH--..QS.N.L.-.. 35 1168257 5 ..N.ARA.E.P.....V.YN--N.PS.V...-.. 35 584706 4 .SV.AGLAQA.E.P.....V.YN--..PS.V.V.-.. 37 112971 6 .AA.PRA..V.VFKL.AD.R--E.GDSR.V.-.. 36 1168259 6 .S.LPA.E.PV.S.IF.CR--D.PS.V.L.-.S 35 5902703 7 .A..PQAQ.VLVFKL.AD.R--E.PD.R.V.-.. 37 1168260 49 .PSR.EGIT.A...P....S....--A...GM.L.-.. 83 112979 54 .EGIP.A...P....S...R--A..SDA.L.-.. 84 112976 7 .A..PQAQ.VLVFKLIAD.R--E.PD.R.V.-.. 37 112973 6 .V..PQAQ.VLVFKL.AD.R--E.PD.R.V.-.. 36 112975 7 .AQ.PQA..VLVFKL.AD.R--D.PD.R.V.-.. 37 416566 7 .A..PQAQ.VLVFKL.AD.R--E.PD.R.V.-.. 37 112978 5 SF.AQ.PQA..VLVFKLIAD.R--D.PD.R.V.-.. 37 1703040 3 A.L.NNIELL....LF.IKQRYG--Q.QRAT.VD-.. 36 2492843 2 SF.DGIPVA..IEVFHKNKMYL--DE.A.V.V.-.T 34 1168262 2 .EHIKAA.A.P...LG....--SE.REN...-.. 32 112989 2 .ENITAA.A.P...LADL.R--A.ER.G...-.. 32 2492844 2 .QK.DAYAG.P..SLM.R..--D.SRHD.V.-.S 32 136593 2 .QK.DAYAG.P..TLM.R..--E.PRSD.V.-.S 32 1172478 4 .AK.ARV.G.P...LLD.YR--N.PRAD.LD-.. 34 398985 21 .R.PRA...KV..LS.H..--.AK.VN..D-.T 50 6136085 10 ..K..ALMGE.R--A.PRQG..D-.. 32 399090 11 .PL.ALIGL.R--..ER.G.VD-.. 32 2492840 2 .ENITAA.A.P...LADL.R--A.DR.G...-.. 32 2492841 4 ..A.E.A.R.P...LN...N--A..R.G...-.. 34 112986 1 .S.WAH.E.....P.......Y.--R...S.. 30 6224986 7 .R.SHLK.SPT.TI.-.KA--.ELRA.GVDVI. 36 112988 14 .STT.AI.AKA.EM.AQGIDV.G-.. 38 728772 35 ..-.. 38 1176356 50 --.NQGREL..-.. 60 3183329 10 NK.AASR..VWTL.NQ.TA--ECKV.P-VS-.S 38 tmpseq_1 58 AGAYRDDNTQPFVLPSVREAE-----------------KRVVS-R-S-LDKE--YATIIG 95 112983 64 V.......GK.Y......K..-----------------AQIAA-K-N-....--.LP.G. 101 112984 64 V.......GK.Y......K..-----------------AQIAA-K-N-....--.LP.G. 101 112987 64 V.......GK.Y......K..-----------------AQIAG-K-N-....--.LP.G. 101 112985 64 V.......GK.Y......K..-----------------AQIAA-K-N-....--.LP.G. 101 1168261 64 V.......GK.Y......K..-----------------AQIAA-K-N-....--.LP.A. 101 112981 57 V.......GKSY..NC..K..-----------------AMIAA-K-K-M...--.LP.A. 94 112982 35 V.......GK.Y......K..-----------------AQIAA-K-N-....--.LP.G. 72 1168256 64 V.......GK.V..EC.....-----------------..LAG-S-T-F-M.--.LPMG. 100 2506178 49 V....TEEGK.L..DV..RV.-----------------RQLLNDM-.-RN..--.IP.V. 87 1168258 80 V....TEEGK.L..NV..K..-----------------QQLIND.-T-RI..--.LP.V. 118 112972 36 V....TEEGK.L..NV.KK..-----------------QML.NDQ-.-RV..--.LP.V. 74 1168257 36 V....TEEGK.L..DV..K..-----------------QQL.N-DP.-RV..--.IP.V. 74 584706 38 V....TEEGK.L..NV..R..-----------------QMLIN-NP.-RV..--.LP.T. 76 112971 37 V....T.EG..W...V..KV.-----------------QLIAG-DG.-.NH.--.LP.L. 75 1168259 36 ..T..TEEGK.L..DV..R..-----------------QQLAN---D-....--.LPLN. 72 5902703 38 V....T.DCH.W...V.KKV.-----------------QKIANDN-.-.NH.--.LP.L. 76 1168260 84 V....TEEL..Y..NV.KK..-----------------NLMLE-.-G-DN..--.LP.E. 121 112979 85 V....TEEL..Y..KV.NK..-----------------NLMLE-.-G-QN..--.LA.E. 122 112976 38 V....T.DC..W...V..KV.-----------------Q.IANDS-.-.NH.--.LP.L. 76 112973 37 V....T.DC..W...V..KV.-----------------QKIAN-N-.S.NH.--.LP.L. 75 112975 38 V....T.ES..W...V..KV.-----------------QKIANDN-.-.NH.--.LP.L. 76 416566 38 V....T.DS..W...V..KV.-----------------Q.IANDS-.-INH.--.LP.L. 76 112978 38 V....T.DS..W...V.TKV.-----------------QKIANDH-.-.NH.--.LP.L. 76 1703040 37 I.......GK.W.....KA..-----------------.LIHNDS-.-YNH.--.LG.T. 75 2492843 35 I....TEEG..W...V.H.T.-----------------VEIANDT-.-.NH.--.LPVL. 73 1168262 33 I.V.K.AQGTTPIMHA.K...-----------------..LFD-K-E-KT.N--.L..D. 70 112989 33 I.V.K.ETGKTP..T..KK..-----------------QYLLE-N-E-TT.N--.LG.D. 70 2492844 33 I.L.YNEDGIIPQ.KT.A...-----------------A.LNA-Q-P-HGASL-.LPME. 71 136593 33 I.L.YNEDGIIPQ.QA.A...-----------------A.LNA-Q-P-HGASL-.LPME. 71 1172478 35 V.V.K.AQGLTPI.R..KL..-----------------Q.L.E-Q-E-TT.S--.VGGH. 72 398985 51 V.I.K.GWGKVTTF...AK.Q-----------------.LIE.-HLE-.N.NLS.LP.T. 91 6136085 33 V.V.K.ATGHTPIMRA.HA..-----------------Q.MLE-T-E-TT.T--..GLS. 70 399090 33 V.V...ETGRTPIFRA.KA..-----------------..LLE-T-Q-DS.A--.IGPE. 70 2492840 33 I.V.K.ETGKTP..T..KK..-----------------QYLLE-N-E-TT.N--.LG.D. 70 2492841 35 V.V.YNEEGRIPL.RA.QA..-----------------.ARIE-A-H-APRG--.LP.E. 72 6224986 37 F..GEP.FDT.---DFIK..C-----------------I.ALR-E-G-KT.---..PSA. 70 3183545 46 .KA.A-----------------.KAID-E-N-VTS---.TPNA. 66 112988 39 ..E-P.F..PQNIMDAAIDSM-----------------QQGYT-K---------.TPSG. 70 728772 39 Q.N-P.LP.P.HIVEAL...SLNPSFHGYGPFRGYPFL.EAIA-A-F-YKR.--.GVT.- 91 1176356 61 Q.FFSYSPP.F----AIK..Q-----------------.-ALD-I-P-MVNQ--.SPTR. 93 3183329 39 Q.FF-NY.PPK...----D.A-----------------.KSID-E-V-ACNQ--.SHTR. 71 tmpseq_1 96 IPEFYNKAIELALGK-----GSKRLAAKHNVTAQSIS-GTGALRIGAAFLAKFWQG---- 145 112983 102 LA..CKASA.....E-----N.EV.KSGRF..V.T..-.........S..QR.FKF---- 151 112984 102 LA..CKASA.....E-----NNEV.KSGRF..V.T..-......V..S..QR.FKF---- 151 112987 102 LAD.CKASA.....E-----N.EV.KSGRF..V.T..-......V..S..QR.FKF---- 151 112985 102 LA..CKASA.....E-----NNEV.KSGRY..V.T..-.........N..QR.FKF---- 151 1168261 102 LA..CKASA.....E-----NNEV.KSGRY..V.T..-.........S..QR.FKF---- 151 112981 95 LAD.TRASA.....E-----N.EAFKSGRY..V.G..-...S..V..N..QR.FKF---- 144 112982 73 LA..CKASA.....E-----N.EA.KSGRY..V....-.........N..QR.FKF---- 122 1168256 101 SAKMVDLTLK..Y.D-----N.EFIKD.RIAAV.TL.-....C.LF.D.QKR.SP.---- 150 2506178 88 LAD.NKLSAK.IF.A-----D.PAIQENRVT.V.GL.-...S..V.GE....HYH----- 136 1168258 119 LV..NKLSAK.I..A-----D.PAIRENRIT.VECL.-...S..V.GE....HYH----- 167 112972 75 LAD.NKLSAK.IF.A-----D.PAIQENRVA.V.CL.-...S..V.GE...RHYH----- 123 1168257 75 .SD.NKLSAK.I..A-----D.PAITESRVT.V.CL.-...S..V..E..KTHYHQ---- 124 584706 77 LAD.NKLSAK.IF.A-----D.PAIQENRVA.V.CL.-...S..V.GE...RHYH----- 125 112971 76 L...RAN.SRI...D-----D.PAI.Q.RVGSV.GLG-.........E..RRWYN.---- 125 1168259 73 L...NKLSTK.I..D-----D.PA.KENRV..T.CL.-...S..V..E...TH------- 119 5902703 77 LA..RSC.SR....D-----D.PA.KE.RVGGV..LG-.........D...RWYN.TNNK 130 1168260 122 LAA.NKATA..LF.A-----.HPVIKEQRVA.I.GL.-...S..LA..LIERYFP.---- 171 112979 123 LAA.NKATA..L..A-----DNPAIKQQRVA.V.GL.-...S..L...LIERYFP.---- 172 112976 77 LA..RTC.SR....D-----D.PA.QE.RVGGV..LG-.........E...RWYN.---- 126 112973 76 LA..RSC.SR....D-----D.PA.QE.RVGGV..LG-.........E..SRWYN.TNNK 129 112975 77 LA..RSC.SR.V..D-----N.PAIRENRVGGV..LG-.........D..GRWYN.TDNK 130 416566 77 LA..RTC.SR....D-----D.PA.QE.RVGGV.CLG-.........E...RWYN.---- 126 112978 77 LA..RSC.SQ.V..D-----N.PA.RENGVGGV..LG-A........D...RWYN.TDNK 130 1703040 76 L.SLTSN.AKIIF.T-----Q.DAFQEDRVISV..L.-.....H.S.K.FS..FP----- 124 2492843 74 HEG.RKA.T..V..A-----E.PAIKEERSFGV.CL.-......A..E...SVCN----- 122 1168262 71 .ADYNEQTKA.LF..-----D.EVIQSNRAR.V..LG-.......A.E.IKRQTKA---- 120 112989 71 ....GRCTQ..LF..-----..ALIND.RAR...TPG-......VA.D....NTSV---- 120 2492844 72 LNTYRHTIAP.LF.A-----DHPV.QQQRVA.I.TLG-.S...KV..D..KRYFP----- 120 136593 72 LNCYRHAIAP.LF.A-----DHPV.KQQRVA.I.TLG-.S...KV..D..KRYFPE---- 121 1172478 73 DAL.AARLA.....A-----A.PL.LEQRADAT.TPG-......LAGD.I.HCLP.---- 122 398985 92 SK..QENVMKFLFKESCPQF.PFY..HDRISFV.TL.-.....AVA.K...L.I------ 144 6136085 71 E...QKAMG..I..D-----.L.---SETTA.LATVG-......-Q.LE..RMANP---- 116 399090 71 DLV.LDRLW..V--------.GDTIERS.VAGV.TPG-.S....LA.DLI.RM--.---- 115 2492840 71 .... 74 2492841 73 . 73 6224986 71 ...LREAIA.KL.---------.ENKVEYKPSEIVV.-AGAKMVLFLI.M.ILDE.---- 116 3183545 67 YL.L-RQ.VQ.YM--------K.KADFNYDAESEI.I-T...QA.D...RTILSP.---- 112 112988 71 L.ALKQAI..KF--.-----RDNQ.EY.P.---EI.V-.V..KHVLYTLFQVILNE---- 115 728772 92 -----.PET.V..FG-----.G.---.GLY.LT.CLL-NP.DIAL--------------- 122 1176356 94 R.SLI.SL.K.YSPI-----YNTE.K.E-...VTTGA-NE.I.----SC.MGLLNA---- 138 6166203 65 .K..EY.HLEVEQVFI.N.SDEVLSLSFLT.FNS---- 98 3183329 72 R.SL-R..LSE.YSP-----YF..TL---.PDTEIVV-TA..NEGFFSVF.A.LNP---- 117 tmpseq_1 146 NRE----IYIPSPSWGNHVA-IFEH-AG-----LP-VNRYRY-YDK-----DTCA--LDF 185 112983 152 S.D----VFL.K.T....TP-..RD-..-----MQ-LQG...-..P-----K..G--F.. 191 112984 152 S.D----VFL.K......TP-..RD-..-----MQ-LQG...-..P-----K..G--F.. 191 112987 152 S.D----VFL.K......TP-..RD-..-----MQ-LQG...-..P-----K..G--F.. 191 112985 152 S.D----VFL.K......TP-..RD-..-----MQ-LHS...-..P-----K..G--F.. 191 1168261 152 S.D----VFL.K.T....TP-..RD-..-----MQ-LQS...-..P-----K..G--F.. 191 112981 145 S.D----V.L.K......TP-..RD-..-----.Q-LQA...-..P-----K..S--... 184 112982 123 S.D----VFL.K......TP-..RD-..-----.Q-LHA...-..P-----K..G--F.V 162 1168256 151 S-Q----....V.T.S..HN-.WKD-.Q-----V.-QKT.H.-.HP-----E.KG--... 189 2506178 137 Q.I----..L.T.T....TK-V.NL-..-----.T-.KT...-.AP-----A.RG--... 176 1168258 168 QKT----...TQ.T....PK-..TL-..-----.T-.KT...-..P-----A.RG--.N. 207 112972 124 EHT----V...Q.T....PK-..TL-..-----.S-.KT...-.NP-----E.RG--... 163 1168257 125 S-V----....K.T....PK-V.NL-..-----.S-.EYF..-..P-----A.RG--... 163 584706 126 E.T----....Q.T....PK-V.TL-..-----.T-.RS...-..P-----A.RG--... 165 112971 126 .NNTATPV.VS..T.E..NS-V.MD-..-----FKDIRT...-W.A-----AKRG--..L 170 1168259 120 .K.SV--.FV.N.T....PR-..TL-..-----.S-.QYF..-..P-----KSRG--... 161 5902703 131 .TP----V.VS..T.E..N.-V.SA-..-----FKDIRS...-W.A-----EKRG--..L 171 1168260 172 AK-----VV.S..T....KN-..ND-.K-----V.-WSE...-..P-----K.IG--... 210 112979 173 AK-----VL.SA.T....KN-..ND-.R-----V.-WSE...-..P-----K.VG--... 211 112976 127 TNNKDTPV.VS..T.E..NG-V.TT-..-----FKDIRS...-W.T-----EKRG--..L 171 112973 130 .TP----V.VS..T.E..NG-V.SG-..-----FKDIRS.H.-W.A-----TKRG--..L 170 112975 131 .TP----..VS..T.E..N.-V.SA-..-----FKDIRP.C.-W.A-----EKRG--..L 171 416566 127 TNNKDTPV.VS..T.E..NG-V.IA-..-----FKDIRS.H.-W.A-----AKRG--..L 171 112978 131 .TP----V.VS..T.E..NG-V.SA-..-----FKDIRS...-W.A-----EKRG--..L 171 1703040 125 DKL----V.LSK.T.A..M.-...N-Q.-----.K-TAT.P.-WAN-----E.KS--..L 164 2492843 123 MKT----V.VSN.T....KL-V.KK-..-----FTT.AD.TF-W.Y-----.NKR--VHI 163 1168262 121 -QN----VW.ST.T.P..N.-..NA-V.-----MT-IRE...-..A-----ERK.--..W 159 112989 121 K.-----VWVSN...P..KS-V.NS-..-----.E-.RE.A.-..A-----ENHT--... 159 2492844 121 DAG----VWVSD.T.E..I.-..AG-..-----FE-.ST.PW-..D-----A.NG--IR. 160 136593 122 SG-----VWVSD.T.E....-..AG-..-----FE-.ST.PW-..E-----A.NG--VR. 160 1172478 123 -.G----.WLSD.T.PI.ET-L.AA-..-----.K-.SH.P.-VSA-----.N-R--..V 160 398985 145 S.D----.W..D...A..KN-..QN-N.-----FE--.I...S.Y.-----.G-Q--I.I 183 6136085 117 DLR----VFVSD.T.P...S-.MNF-M.-----..-.QT...-F.A-----E.RG--V.. 156 399090 116 G.G----.WLGL...P..AP-..KA-..-----.D-IAT.DF-F.I-----PSQS--VI. 155 6224986 117 D-.----VLL...Y.VTYPEQ.RFF-G.-----V.-.EVPLK-KE.-----G-------. 151 3183545 113 D-.----VIM.G.IYPGYEP-.INL-C.-----A------KP-VIV-----..TS--HG. 146 112988 116 GD.----VI..I.Y.VSYPE-QVKL-..G----V.-.------.IE-----A.SE--QNY 151 112990 121 .----VIL.D..FYSYAE-VVKLLG.-----K.-IYANLK-WSR-----EE-----G. 156 728772 123 ---------V.N.GYPEYLS-------.-----IT-MA.AEL-.EM-----PL----YEE 150 2501592 31 .R-----SRE.--R.A 39 1176356 139 GD.----VIVFE.FFDQYIP-NI.L-C.GKVVYV.-I.PPKE-L.QRNTRGEEWT--I.. 188 6166203 99 QSP----LLM.DITYSFYPI-YC.L-YR-----I.-FQKVPV-D.-------------.. 132 3183329 118 GD.----VIVME.FFDQYISN.TMN-G.-----V.-.YVPII-PPE-----EGSVKPVSA 160 tmpseq_1 186 ---GGLIEDLK-K----IP----EKS---------IVLLHACAHNPTGVDPTLEQWREIS 224 112983 192 ---T.AV..IS-.----..----.Q.---------VL..............RP...K..A 230 112984 192 ---S.AL..IS-.----..----.Q.---------VL..............RP...K..A 230 112987 192 ---S.AL..IS-.----..----.Q.---------VL..............RP...K.MA 230 112985 192 ---T.AL..IS-.----..----AQ.---------VI..............RP...K.MA 230 1168261 192 ---T.A...IS-.----..----AQ.---------VI..............RP...K.MA 230 112981 185 ---T.AM..IS-.----..----...---------.I..............RQ...K.LA 223 112982 163 ---T.AL..IS-.----..----QQ.---------.I..............RP...K..A 201 1168256 190 ---SA.MD.V.-N----A.----.G.---------FF...............E....... 228 2506178 177 ---Q..L...G-S----A.----SG.---------V....................EQ.R 215 1168258 208 ---Q..L...G-A----AA----PG.---------.................IQ..EQ.R 246 112972 164 ---E.ML...G-S----A.----LGA---------.................I...EQ.R 202 1168257 164 ---K..L...G-A----A.----SGA---------.................S...EQ.R 202 584706 166 ---Q..L...G-S----A.----SGA---------..................D..EQ.R 204 112971 171 ---Q..LD.ME-.----A.----.F.---------.FI..........T...PDE.KQ.A 209 1168259 162 ---K.ML...G-A----A.----PGA---------..V.Q............F...EKFR 200 5902703 172 ---Q.FLN..E-N----A.----.F.---------..V..........I...P...KQ.A 210 1168260 211 ---E.M.A.I.-E----A.----.G.---------FI...G.......I...P...VK.A 249 112979 212 ---E.M...I.-A----A.----.GT---------F....G.......I...P...EK.A 250 112976 172 ---Q.FLS..E-N----A.----.F.---------.FV..........T...P...KQ.A 210 112973 171 ---Q.FLN..E-N----A.----.F.---------.FV..........T...P...KQ.A 209 112975 172 ---Q.FLN..E-N----A.----.F.---------.FV..........T...P...KQ.A 210 416566 172 ---Q.FLN..E-.----A.----.F.---------.FV..........T...P...KQ.A 210 112978 172 ---Q.FLN..E-N----A.----.F.---------.FV..........T...E.E.KQ.A 210 1703040 165 ---N.FLNAIQ-.----A.----.G.---------.FV..S.......L...S...VQ.V 203 2492843 164 ---EKFLS..E-S----A.----...---------VII..G.......M...Q...KLVA 202 1168262 160 ---EH.L...S-Q----AS----.GD---------V....G.C.....I...P...Q.LA 198 112989 160 ---DA..NS.N-E----AQ----AGD---------V..F.G.C.....I.......QTLA 198 2492844 161 ---ND.LAT.N-T----L.----AR.---------.....P.C.....A.L.PS..DAVI 199 136593 161 ---ND.LAT..-T----L.----AR.---------.....P.C.....A.L.ND..DAVI 199 1172478 161 ---EAMLAG.E-R----..----QGD---------V......C.....F.LSHDD..RVL 199 398985 184 ---D.W..Q..-T----FA----YNNQQENNKNPPCII....C.....L...K...EK.I 231 6136085 157 ---E.MKA..A-A----AK----KGD---------M....G.C.....ANL..D..A..A 195 399090 156 ---DN.VSA.E-G----AA----SGD---------A.....SC.....GVLSEA..M..A 194 6224986 152 ---QLSL..V.E.----VT----.RT---------KAIVINSPN....AVYEE.ELKK.A 191 3183545 147 KLTAR....AL-T----PN----T.C---------V..PYPS--.....TLSE.ELKS.A 186 112988 152 ---KITA.Q..-NA---.T----D.T---------KAVIINSPS....MVY.R.ELED.A 191 112990 157 ---SIDVD..QS.----.S----KRT---------KMIVFNNP.....TLFSPNDVKK.V 196 728772 151 ---N.YLP.FE-.----.DPAVL..A---------KLMFLNYPN....AVADAAFYAKAA 193 2501592 40 ---AQMVA..V-.----.H----QSQ---------LI..SVVEK..P.Q.HEAHGMDSPE 78 1176356 189 ---E---QFE.-A----.T----S.T---------KAVIINTP...I.KVF.R.ELTTLG 224 6166203 133 ---KVS.K.YC------.E----NGG---------..IANPN.--..ALALN.KDIE..- 167 3183329 161 ---.AWKL.MN-.LRNA.T----..T---------KMIVINTP...L.KIFSE.ELN..A 203 tmpseq_1 225 ALVKKRNLYPFIDMAYQGFATGDIDRDAQAVR------TFE---ADGHDFCL-AQ--SFA 272 112983 231 TV......FA.F........S..G.K..W...------H.I---EQ.INV..-C.--.Y. 278 112984 231 SV...K..FA.F........S..G.K..W...------H.I---EQ.INV..-C.--.Y. 278 112987 231 .V...K..FA.F........S..G.K..W...------H.I---EQ.INV..-C.--.Y. 278 112985 231 T....N..FA.F........S..GNK..W...------H.I---EQ.INV..-C.--.Y. 278 1168261 231 TV...N..FA.F........S..GNK..W...------H.I---EQ.INV..-C.--.Y. 278 112981 224 SV......LAYF........S...N...W.L.------H.I---EQ.I.VV.-S.--.Y. 271 112982 202 T....N..FA.F........S..GNK..W...------Y.I---EQ.INV..-C.--.Y. 249 1168256 229 Q.F.AKKHFA.F........S..PA...KSI.------I.L---E...HIGI-S.--.Y. 276 2506178 216 Q.IRSKS.L..F.S......S.SL.A...P..------L.V---...GELLV-..--.Y. 263 1168258 247 K.MRSKG.M..F.S......S.SL.T..KPI.------M.V---...GECLV-..--.Y. 294 112972 203 Q.MRSKS.L..F.S......S.SL.A...S..------I.V---...GECLA-..--.Y. 250 1168257 203 Q.MRSKS.L..F.S......S.SL.T...S..------..V---...GECLI-..--.YT 250 584706 205 Q.MRSKA.L..F.S......S.SL.Q...S..------M.V---...GELLM-..--.Y. 252 112971 210 .VM.R.C.F..F.S......S.SL.K..W...------Y.V---SE.FELFC-..--..S 257 1168259 201 R..RSKS.L..F.S......S.SL.A......------M.V---...GECLI-..--.Y. 248 5902703 211 SVM.H.F.F..F.S......S.NLE...W.I.------Y.V---SE.FE.FC-..--..S 258 1168260 250 DVIQEK.HI..F.V......S.SL.E..AS..------L.A---ER.ME.FV-..--.YS 297 112979 251 DVIQEK.HI..F.V......S.SL.E..AS..------L.V---.R.LEVLV-..--.YS 298 112976 211 SVM.R.F.F..F.S......S.NLEK..W.I.------Y.V---SE.FELFC-..--..S 258 112973 210 SVM.R.F.F..F.S......S.NL....W...------Y.V---SE.FELFC-..--..S 257 112975 211 .VMQR.F.F..F.S......S..LEK..W.I.------Y.V---SE.FELFC-..--..S 258 416566 211 SVM.R.F.F..F.S...A..S.SLEK..W.I.------Y.V---SE.FELFC-..--..S 258 112978 211 .VM.R.F.F..F.S......S..LEK..W.I.------Y.V---SE.FELFC-P.--..S 258 1703040 204 DAIASK.HIALF.T.........L.K..Y...------LGVEKLSTVSPVFV-C.--... 254 2492843 203 EVI.RK..FT.F.I......S..PAA..W.I.------Y.V---DQ.MEMVV-S.--... 250 1168262 199 ..SA.NGWL.LF.F....L.N.-L.E..YGL.------A.A---.NHKELLV-.S--..S 245 112989 199 Q.SVEKGWL.LF.F......R.-LEE..EGL.------A.A---.MHKELIV-.S--.YS 245 2492844 200 EI..A.D.I..L.I.....GA.-M.D..YVI.------AIA---SA.LPALV-SN--..S 246 136593 200 EIL.A.E.I..L.I.....GA.-MEE..Y.I.------AIA---SA.LPALV-SN--..S 246 1172478 200 DV.RR.E.L.L..F.....GD.-LEE..W...------L.A---GELPEVLV-TS--.CS 246 398985 232 DTIYELKMV.IV......LES.NLLK..YLL.LCLNVNKYP---NWSNGIF.-C.--... 285 6136085 196 SILE.TGAL.L..L.....GD.-LEE..AGT.------LIA---SRIPEVLI-.A--.CS 242 399090 195 ...AE.G.L.LV.L.....GR.-L.Q.VAGL.------HLL---GVVPEALV-.V--.CS 241 6224986 192 EFCVE.GIFIIS.EC.EY.VY..AKFVSP.SF------SD.---VKNIT.TV--N--A.S 238 3183545 187 ..L.G..VFVLS.EI.SELT---Y..PHYSIA------.YL---R.--QTIV-IN--GLS 229 112988 192 KIALEN.ILIVS.EI.E 208 112990 197 DISRDNKIILLS.EI.DN.VYEGKM.STLE----------D---S.WR..LIYVN--G.S 241 728772 194 .FA.EH.IHLIH.F..-----.AFEF.QKPAS------FL.---.EDAKTVG-.ELY..S 238 2501592 79 .VA.LLEAAQAV-FSQ..I..KT.E.EGM. 107 1176356 225 NICV.H.VVIIS.EV.E 241 6166203 168 -.K.NQ.SIVL..E..-------..FGGETCL------PLL---KKYDNLVV-V.--T.S 207 3183329 204 D..L.H..LVVS.EV. 219 tmpseq_1 273 KNMGLYGERAGAFTVLCSDEEE----AAR-------------VMSQVKILIRGLYSNPPV 315 112983 279 .........V....MV.K.AD.----.K.-------------.E..L.....PM.....L 321 112984 279 .........V.....V.K.A..----.K.-------------.E..L.....P......L 321 112987 279 .........V.....V.K.A..----.K.-------------.E..L.....P......L 321 112985 279 .........V.....V.K.A..----.K.-------------.E..L.....PM...... 321 1168261 279 .........V.....V.K.A..----.K.-------------.E..L.....PM.....I 321 112981 272 ...............I.R.A..----.K.-------------.E..L.....PM.....M 314 112982 250 .........V....MV.K.AD.----.K.-------------.E..L.....P......L 292 1168256 277 .......Q.V.CLS...E.PKQ----.VA-------------.K..LQQ.A.PM.....L 319 2506178 264 .........V..LSIVSKSADV----SS.-------------.E..L.LV..PM..S..I 306 1168258 295 .........V..LSIV.KSADV----.G.-------------.E..L.LV..PM..S..I 337 112972 251 .........V..LSIV.KTADV----.SK-------------.E..L.LV..PM..S..L 293 1168257 251 .........V..LSIV.KSADV----.SK-------------.E....LVV.PM..S..I 293 584706 253 .........V..LSIV.GSADV----.V.-------------.E..L.LV..PM.....I 295 112971 258 ..F...N..V.NLS.VGK..DN----VQ.-------------.L..MEKIV.TTW....S 300 1168259 249 .........I.SL.IV.TS.DV----.KK-------------.EN..LLVV.PM.LT..I 291 5902703 259 ..F...N..V.NL..VGKEP.S----ILQ-------------.L..MEKIV.ITW....A 301 1168260 298 ..L...A..I..IN.V..SADA----.T.-------------.K..L.RIA.PM...... 340 112979 299 ..L...A..I..IN.IS.SP.S----...-------------.K..L.RIA.PM...... 341 112976 259 ..F...N..V.NL..VAKEPDS----IL.-------------.L..MEKIV.VTW....A 301 112973 258 ..F...N..V.NL..VAKEPDS----IL.-------------.L..MQKIV.ITW....A 300 112975 259 ..F...N..V.NL..VGKESDS----VL.-------------.L..MEKIV.ITW....A 301 416566 259 ..F...N..V.NL..VAKEPDS----IL.-------------.L..MEKIV.ITW....A 301 112978 259 ..F...N..V.NL..VGKEHDS----VL.-------------.L..MEKIV.ITW....A 301 1703040 255 ..A.M....V.C.HLALTKQAQNKTIKPA-------------.T..LAKI..SEV....A 301 2492843 251 ..F...N..V.NL..VVNNPAV----I.G-------------FQ..MSLV..ANW....A 293 1168262 246 ..F...N..V....LVAENA.I----.ST-------------SLT...SI..T.....AS 288 112989 246 ..F...N..V..C.LVAA.S.T----VD.-------------AF..M.AA..AN.....A 288 2492844 247 .IFS.....V.GLS.V.E.A.I----...-------------.LG.L.ATV.RI..S..C 289 136593 247 .IFS.....V.GLS.M.E.A.A----.G.-------------.LG.L.ATV.RN..S..N 289 1172478 247 ..F...RD.V..LI.CAQNA.K----LTD-------------LR..LAF.A.N.W.T..A 289 398985 286 .........V.SLS.ITPATAN----NGKFNPLQQKNSLQQNID..L.KIV..M..S..G 341 6136085 243 ..F.I.R..T.CLLA..A.AAT----REL-------------AQGAMAF.N.QT..F..F 285 399090 242 .SF...R.....IFART.STAS----.D.-------------.R.NLAG.A.TS..M..D 284 6224986 239 .SYSMT.W.I.--Y.A.--P..----Y.K-------------.IASL 264 3183545 230 .SHSMT.W.I. 240 112990 242 .TFSMT.W.L.YIVA-----------KRE-------------IIQKMG..AANV.TA.TS 277 728772 239 .TFNMA.W.M-..A. 252 6166203 208 .SRS.A.I.L.----VAYGSA.----.IS-------------HLYD..----NSFNSY.I 242 121796 155 ..G.T.- 160 121790 155 ..G.T.- 160 121782 155 ..G.T.- 160 1346640 960 ....----G..-------------QKL.LEKV------TAEA 978 tmpseq_1 316 HGARIAAEILNNEDLRAQWLKDVKLMADRIIDV-RTKLKD------NL-I-KLGSSQNWD 366 112983 322 N......A...TP...K...QE..G......GM-..Q.VS------..-K-.E..TH..Q 372 112984 322 N......T..TSP...K...QE..G......SM-..Q.VS------..-K-.E...H..Q 372 112987 322 N......T..TSP...K...QE..G......SM-..Q.VS------..-K-.E...H..Q 372 112985 322 N.....ST..TSP...Q...QE..G......SM-..Q.VS------..-K-.E...H..Q 372 1168261 322 N.....ST..TSP...K...HE..G......SM-..Q.VS------..-K-.E...H..Q 372 112981 315 N.....SL...TPE..KE..VE..G......SM-..Q.VS------..-K-.E...H..Q 365 112982 293 N.....ST..TSP...K...QE..G......SM-..Q.VS------..-K-.E...HS.Q 343 1168256 320 ...QLVST..EDPE.KSL...E..V......GM-..T.RE------S.-E-....PLS.E 370 2506178 307 ...S.V.A..KDR..YND.TIEL.A......NM-.QQ.F.------A.-R-AR.TPGD.S 357 1168258 338 ...S.V.V..RDKN.FNE.TLEL.A......SM-.KQ.FE------A.-R-TR.TPGD.S 388 112972 294 ...S.V.A..KDG..YNE.TLEL.A......SM-.QE.FN------A.-Q-AK.TPGD.S 344 1168257 294 ...S.V.T..KSS.MYNN.TIEL.E.....KSM-.QQ.FE------AI-Q-AR.TPGD.S 344 584706 296 ...S.V.T..KDSAMFNE.TVEL.G......SM-.QQ.F.------A.-K-TRETPGD.S 346 112971 301 Q....V.TT.TSPQ.F.E.KDN..T....VLLM-.SE.RS------R.-E-S..TPGT.N 351 1168259 292 ...S.V.T..K.S.MYND.TIEL.G......SM-.QQ.YA------A.-E-AR.TPGD.S 342 5902703 302 Q....V.ST.S.PE.FEE.TGN..T.....LTM-.SE.RA------R.-E-A.KTPGT.N 352 1168260 341 .....V.NVVGDVTMFSE.KAEMEM..G..KT.-.QE.Y.------S.-VS.DK.GKD.S 392 112979 342 .....V.D.VG.PA.FDE.KVEMEM..G..KN.-.QQ.Y.------SISS-.DK.GKD.S 393 112976 302 Q....V.RT.SDPE.FHE.TGN..T.....LSM-.SE.RA------R.-E-A.KTPGT.N 352 112973 301 Q....V.FT.SDPG.FKE.TGN..T.....LSM-.SE.RA------R.-E-A.KTPGT.N 351 112975 302 Q....V.AT.SDPE.FKE.KGN..T.....LTM-.SE.RA------R.-E-A.KTPGT.S 352 416566 302 Q....V.RT.SDPE.FNE.TGN..T.....LTM-.SE.RA------R.-E-A.KTPGT.N 352 112978 302 Q....V.TT.S.PE.FKE.KGN..T.....LTM-.SE.RA------R.-E-A.KTPGT.S 352 1703040 302 Y..K.V.KL.ETPE.TE..H..MVT.SS..TKM-.HA.R.------H.-V-...TPG... 352 2492843 294 .....VHKV.TTPAR.E..NQSIQA.SS..KQM-.AA.LR------H.-M-D..TPGT.. 344 1168262 289 ..GATV.TV..DAQ..QE.ENELTE.RE..KKM-.HLFVQ------L.-K-EY.AE.DFS 339 112989 289 ...SVV.T..S.DA...I.EQELTD.RQ..QRM-.QLFVN------T.-Q-EK.ANRDFS 339 2492844 290 F..QVV.TV.GD.A.K.G..AE.DA.RN...SM-.QT.VK------E.-T-AEMPDR.F. 340 136593 290 F..QVV.AV..D.A.K.S..AE.EE.RT..LAM-.QE.VK------V.-S-TEMPER.F. 340 1172478 290 ...EVV.A..GDSE.KGL.QEE.EG.RS..ASL-.IG.VE------A.-A-PH.LAERFA 340 398985 342 Y.S.VVNVV.SDFK.KQ..F...DF.VQ.LHH.-.QEMF.------R.---------G.P 385 6136085 286 ...K.VSTV.TTPE...D.MAELEAVRSGMLRL-.EQ.AG------E.-R-D.SG.DRFG 336 399090 285 ...AVVRT..DDPE..RD.TEELET.RL.MTGL-.RS.AE------G.----RTRW.SLG 333 112990 278 FVQKA.VKAFDTF.EVN.MVSLF.KRR.VMY.E-L..V. 315 2833575 91 ------.I-L-GI.K.TV.. 102 6166203 243 DSL---.Q.IGEAS.MDEHYFQKNIQ--K..KT-.EVF..------..-V-N.. 282 121796 161 ---NVIY..A.EPNGDVN.KR.I.PY.EEV.S.I.KNDP.------.I-.-IV.TG-T.S 208 121790 161 ---NVIY..A.EPNGDVN.KR.I.PY.EEV.S.I.KNDP.------.I-.-IV.TG-T.S 208 121782 161 ---NVIY..A.EPNGDVN.KR.I.PY.EEV.S.I.KNDP.------.I-.-IV.TG-T.S 208 1346640 979 KIKKMEE...LL..QNSKFI.EK...E...AEC-SSQ.AEEEEKAK..-A-.IRNK. 1032 tmpseq_1 367 HIVN---QIGMFCFTGLKPEQVQKLIKDHSVYLTNDGRVSMAGVTSKNVEYLAESIH-K- 421 112983 373 ..TD---...............ER...EF.I.M.K...I.V.....S..G...HA..-Q- 427 112984 373 ..TD---...............ER.T.EF...M.K...I.V.....G..G...HA..-Q- 427 112987 373 ..TD---...............ER.T.EF...M.K...I.V.....G..G...HA..-Q- 427 112985 373 ...D---.........I.....ER.T.EF.I.M.K...I.V.....G..G...HA..-Q- 427 1168261 373 ..ID---......Y........ER.T.EF.I.M.K...I.V.....G..A...HA..-Q- 427 112981 366 ..TD---...............ER.T.EF.I.M.K...I.V...A.S..G...HA..-Q- 420 112982 344 ..AD---...............ER.T.EF.I.M.K...I.V.....G..G...HA..-Q- 398 1168256 371 .VTK---......YS..T....DR.TSEYHI.M.RN..I......TG..G...NA..-E- 425 2506178 358 ..IK---.....T....N....SI.T.EYHI...S...I....LS..T.PH..HA..-A- 412 1168258 389 ..IK---.....T....N.A..SFMT.EYHI.M.S...I....LS..T.PH..DA..-A- 443 112972 345 ...K---.....T....NS...TFMTNEYHI...S...I....LS.RT.PH..DA.. 398 1168257 345 ..IK---.....T....NK...EFMT.EFHI.M.S...I....LS..T.PH..DAM. 398 584706 347 ..IK---.....T....NSD..AFMRQEYHI.M.S...I....LSGRTIPH..DA..AA- 402 112971 352 ..TD---.....S....N.K..EYM..EKHI..MAS..IN.C.L.T..LD.V.K...-EA 407 1168259 343 ..IK---H....T....SE...RLMA.EYHI.M.Y...I...SLS..T.PQ..DA..-A- 397 5902703 353 ..TD---.....S....N.K..EY.VNEKHI..LPS..INVS.L.T..LD.V.T...-EA 408 1168260 393 F.LK---.....S....NKA.SDNMTDKWH..M.K...I.L..LSLAKC....DA. 445 112979 394 F.LK---.....SY...NKN.SDNMTNKWH..M.K...I.L..LSLAKC....DA. 446 112976 353 ..TD---.....S....N.K..EY..NEKHI..LPS..IN.C.L.T..LD.V.T...-EA 408 112973 352 ..TE---.....S....N.K..EY.VNQKHI..LPS..IN.C.L.T..LD.V.T...-EA 407 112975 353 ..TE---.....S....N.K..EY.VNEKHI..LPS..IN.C.L.T..LD.V.T...-EA 408 416566 353 ..TE---.....S....N.K..EY..NEKHI..LPS..IN.C.L.T..L..V.T...-EA 408 112978 353 ..TE---.....S....N.K..EY.VNEKHI..MPS..IN.C.L.T..LD.V.T..N-EA 408 1703040 353 ....---.C...S....T.QM.KR.EET.A...VAS..A.I..LNQG....V.KA.D-E- 407 2492843 345 ..IQ---.....SY...TSA..DH..AN.K.F.LR...INIC.LNT.....V.KA.D-E- 399 1168262 340 F.IE---.N...S.S..TG...DR.KNEFAI.AVRS..INV..I.ED.IR..C...V-.- 394 112989 340 F.IK---.N...S.S..TK...LR.REEFG..AVAS...NV..M.PD.MAP.C.A. 392 2492844 341 YLLQ---.R...SY...SE...DR.RDEFG...IAS..MCV..LNAS..HRV.KAFA-A- 395 136593 341 YLL.---.R...SY...SAA..DR.REEFG...IAS..MCV..LNTA..QRV.KAFA-A- 395 1172478 341 .VGA---.R...SY...S.Q..AR.RDE.A...VSS..ANV..LHARRLGR..QA.A-Q- 395 398985 386 DL..FAQ.H...YY.RFS.K..EI.RNNSF....G...L.LS..NDS..D..C..LE-A- 443 6136085 337 FVAE---HR...SRL.AT....KRIKEEFGI.MVG.S.INI..LNDNTIPI..RA.I-E- 391 399090 334 AVAD---.E...SMLP.SEAE.MR.RTE.GI.MPAS..INI..LKTAEAAEI. 383 2833575 103 YAKD--------.IKE..L.RFK..VWEYRE..I.K.KY. 134 121796 209 QD.. 212 121790 209 QD.. 212 121782 209 QD.. 212 tmpseq_1 422 VTK 424 112983 428 ... 430 112984 428 ... 430 112987 428 ... 430 112985 428 ... 430 1168261 428 ... 430 112981 421 ... 423 112982 399 ... 401 1168256 426 ... 428 2506178 413 . 413 1168258 444 . 444 584706 403 ... 405 112971 408 ... 410 1168259 398 . 398 5902703 409 ... 411 112976 409 ... 411 112973 408 ... 410 112975 409 ... 411 416566 409 ... 411 112978 409 ... 411 1703040 408 .VR 410 2492843 400 TVR 402 1168262 395 . 395 2492844 396 . 396 136593 396 . 396 1172478 396 . 396 398985 444 .S. 446 6136085 392 . 392 Database: Non-redundant SwissProt sequences Posted date: Aug 20, 2000 10:55 PM Number of letters in database: 31,835,007 Number of sequences in database: 88,348 Lambda K H 0.320 0.136 0.403 Gapped Lambda K H 0.270 0.0470 0.230 Matrix: BLOSUM62 Gap Penalties: Existence: 11, Extension: 1 Number of Hits to DB: 27217193 Number of Sequences: 88348 Number of extensions: 1188888 Number of successful extensions: 2757 Number of sequences better than 10.0: 60 Number of HSP's better than 10.0 without gapping: 37 Number of HSP's successfully gapped in prelim test: 23 Number of HSP's that attempted gapping in prelim test: 2646 Number of HSP's gapped (non-prelim): 63 length of query: 424 length of database: 31,835,007 effective HSP length: 52 effective length of query: 372 effective length of database: 27,240,911 effective search space: 10133618892 effective search space used: 10133618892 T: 11 A: 40 X1: 16 ( 7.4 bits) X2: 38 (14.8 bits) X3: 64 (24.9 bits) S1: 41 (21.8 bits) S2: 66 (30.1 bits)

BLASTP Alignment Notes

To search against the COGs database, click here:

COGs

Clusters of Orthologous Groups of proteins (COGs) were delineated by comparing protein sequences encoded in 21 complete genomes, representing 17 major phylogenetic lineages. Each COG consists of individual proteins or groups of paralogs from at least 3 lineages and thus corresponds to an ancient conserved domain. Use the COGnitor to compare the protein sequence to the COGs database.

Paste the FASTA formatted protein sequence from GenScan into the COGnitor input box and press the "compare to COGs" button. Click on the link to the highest-scoring COG and download the sequence alignment by clicking on the "# proteins" link in the upper left-hand corner of the page and paste the alignment into your notebook. Go back to the previous page and click on the disk icon to save the sequences in the COG to a local file on your desktop to be used as input to Multalin below. Drag this file from your desktop onto your "tools" browser window to display the sequences. Then copy and paste these into your notebook under "COGs FASTA Sequences".

COGs Alignment

CLUSTAL W (1.74) multiple sequence alignment aspC ------------------MFENITAAPADPILGLADLFRADERPGKINLGIGVYKDETGK HI1617 ------------------MFEHIKAAPADPILGLGEAFKSETRENKINLGIGVYKDAQGT tyrB ------------------MFQKVDAYAGDPILTLMERFKEDPRSDKVNLSIGLYYNEDGI CT637 ----------------MSLFEQLPSFSPDSILGLAQAFQEDPREDKINLLLGTYEREKKR CPn0740 ----------------MSFFNHIPTFSPDAILGLQNVFFADKRPEKVNLVIGVYEHPQKR YLR027c MNKRTQEYKNTRAIMSATLFNNIELLPPDALFGIKQRYGQDQRATKVDLGIGAYRDDNGK YKL106w MLRTRLTNCSLWRPYYTSSLSRVPRAPPDKVLGLSEHFKKVKNVNKIDLTVGIYKDGWGK :..: . * :: : : : . *::* :* * aspC TPVLTSVKKAEQYLLENET---TKNYLGIDGIPEFGRCTQELLFGKGSA-----LINDKR HI1617 TPIMHAVKEAEKRLFDKEK---TKNYLTIDGIADYNEQTKALLFGKDSE-----VIQSNR tyrB IPQLQAVAEAEARLNAQPHG--ASLYLPMEGLNCYRHAIAPLLFGADHP-----VLKQQR CT637 YGGFSSVRKAQSVFFDDEK---DKNYLPIKGSSTFLEEMAALCFG---------EVDASR CPn0740 YGGLSCIRKAQTVILEEEQ---NKSYLPISGLQIFLDEMRELVFG---------AVDPSA YLR027c PWVLPSVKAAEKLIHNDSSY--NHEYLGITGLPSLTSNAAKIIFGTQSD-----AFQEDR YKL106w VTTFPSVAKAQKLIESHLELNKNLSYLPITGSKEFQENVMKFLFKESCPQFGPFYLAHDR : .: *: : . ** : * : * . . aspC ARTAQTPGGTGALRVAADFLAKNTSVKRVWVSNPSWPNHKSVFNSAGLE-VREYAYYDAE HI1617 ARTVQSLGGTGALRIAAEFIKRQTKAQNVWISTPTWPNHNAIFNAVGMT-IREYRYYDAE tyrB VATIQTLGGSGALKVGADFLKRYFPESGVWVSDPTWENHVAIFAGAGFE-VSTYPWYDEA CT637 WVGVQAIGGTGALHLGASVYANASLAGKVYIPSQTWGNHSRIFAHQGLA-LEYYPYYDQE CPn0740 IVGFQSLGGTGALHLGARLLSVAKGSGKVYVPEQTWSNHIRIFSQEGLE-VIRYPYYSKE YLR027c VISVQSLSGTGALHISAKFFSKFFPDKLVYLSKPTWANHMAIFENQGLK-TATYPYWANE YKL106w ISFVQTLSGTGALAVAAKFLA-LFISRDIWIPDPSWANHKNIFQNNGFENIYRYSYYKD- *: .*:*** :.* . :::. :* ** :* *: * :: aspC NHTLDFDALINSLNEAQAGD---------VVLFHGCCHNPTGIDPTLEQWQTLAQLSVEK HI1617 RKALDWEHLLEDLSQASEGD---------VVLLHGCCHNPTGIDPTPEQWQELAALSAKN tyrB TNGVRFNDLLATLKTLPARS---------IVLLHPCCHNPTGADLTNDQWDAVIEILKAR CT637 TKELDLQGLKAILRSAPETS---------LVLLHCCCHNPTGKDIPLSEWPEIITIIKER CPn0740 QKQLLFEPLIAFLKEVEKNS---------VILLHGCCHNPTGVDFTEDMWKELAILMKER YLR027c TKSLDLNGFLNAIQKAPEGS---------IFVLHSCAHNPTGLDPTSEQWVQIVDAIASK YKL106w -GQIDIDGWIEQLKTFAYNNQQENNKNPPCIILHACCHNPTGLDPTKEQWEKIIDTIYEL : : : . .::* *.***** * . . * : aspC GWLPLFDFAYQGFARG-LEEDAEGLRAFAAMH------KELIVASSYSKNFGLYNERVG- HI1617 GWLPLFDFAYQGLANG-LDEDAYGLRAFAANH------KELLVASSFSKNFGLYNERVG- tyrB ELIPFLDIAYQGFGAG-MEEDAYAIRAIASAG------LPALVSNSFSKIFSLYGERVG- CT637 DLIPFFDMAYLGFASG-IEEDRRPVRLCIEAG------VTTFVAGGASKIFSLYGSRVG- CPn0740 ELIPFFDTAYQGFAHG-IELDRKPIEIFISEG------NTVLVAASSSKNFALYGERVG- YLR027c NHIALFDTAYQGFATGDLDKDAYAVRLGVEKLSTV---SPVFVCQSFAKNAGMYGERVGC YKL106w KMVPIVDMAYQGLESGNLLKDAYLLRLCLNVNKYPNWSNGIFLCQSFAKNMGLYGERVGS :.:.* ** *: * : * :. ::. . :* .:*..*** aspC ------------ACTLVAADSETVDRAFSQMKAAIRANYSNPPAHGASVVATILSNDALR HI1617 ------------AFTLVAENAEIASTSLTQVKSIIRTLYSNPASHGGATVATVLNDAQLR tyrB ------------GLSVMCEDAEAAGRVLGQLKATVRRNYSSPPNFGAQVVAAVLNDEALK CT637 ------------FFGAIHQDKLDLNRILSFLEEQIRGEYSSPAREGVAIVTSILSNPYLR CPn0740 ------------YFAVHSTFTDELVKIHSFLEEKIRGEYSSPQRWGVEIVSTILSNPYLK YLR027c F---------HLALTKQAQNKTIKPAVTSQLAKIIRSEVSNPPAYGAKIVAKLLETPELT YKL106w LSVITPATANNGKFNPLQQKNSLQQNIDSQLKKIVRGMYSSPPGYGSRVVNVVLSDFKLK : :* *.* * * :*. * aspC AIWEQELTDMRQRIQRMRQLFVNTLQEKGANRDFSFIIKQNGMFSFSGLTKEQVLRLREE HI1617 QEWENELTEMRERIKKMRHLFVQLLKEYGAEQDFSFIIEQNGMFSFSGLTGEQVDRLKNE tyrB ASWLAEVEEMRTRILAMRQELVKVLSTEMPERNFDYLLNQRGMFSYTGLSAAQVDRLREE CT637 QEWELELNGIRQSLEEIRSSFVIAMR-NVAGHSFDFIASQKGFFGYPGFSKEQVLFLREE CPn0740 EEWQSELNFIRESLGKMRTRFVQALR-KVAGHTFDFLLSQHGFFAYPGFSDKQVLFLREQ YLR027c EQWHKDMVTMSSRITKMRHALRDHLVKLGTPGNWDHIVNQCGMFSFTGLTPQMVKRLEET YKL106w QQWFKDVDFMVQRLHHVRQEMFDRLG----WPDLVNFAQQHGMFYYTRFSPKQVEILRNN * :: : : :* : : : .* *:* :. :: * *.: aspC FGVYAVASGRVNVAGMTPDNMAPLCEAIVAVL--------- HI1617 FAIYAVRSGRINVAGITEDNIRYLCESIVKVL--------- tyrB FGVYLIASGRMCVAGLNTANVQRVAKAFAAVM--------- CT637 LGIYTTAGGRFNLNGITDKNINRVTHGFAQAYEYPRSVS-- CPn0740 HAVYTTAGGRMNLNGITEKNIDHVVQSFIQAYEL------- YLR027c HAVYLVASGRASIAGLNQGNVEYVAKAIDEVVRFYTIEAKL YKL106w YFVYLTGDGRLSLSGVNDSNVDYLCESLEAVSKMDKLA--- :* .** : *:. *: : ..: .

COGs FASTA Sequences

>aspC MFENITAAPADPILGLADLFRADERPGKINLGIGVYKDETGKTPVLTSVKKAEQYLLENETTKNYLGIDG IPEFGRCTQELLFGKGSALINDKRARTAQTPGGTGALRVAADFLAKNTSVKRVWVSNPSWPNHKSVFNSA GLEVREYAYYDAENHTLDFDALINSLNEAQAGDVVLFHGCCHNPTGIDPTLEQWQTLAQLSVEKGWLPLF DFAYQGFARGLEEDAEGLRAFAAMHKELIVASSYSKNFGLYNERVGACTLVAADSETVDRAFSQMKAAIR ANYSNPPAHGASVVATILSNDALRAIWEQELTDMRQRIQRMRQLFVNTLQEKGANRDFSFIIKQNGMFSF SGLTKEQVLRLREEFGVYAVASGRVNVAGMTPDNMAPLCEAIVAVL >tyrB MFQKVDAYAGDPILTLMERFKEDPRSDKVNLSIGLYYNEDGIIPQLQAVAEAEARLNAQPHGASLYLPME GLNCYRHAIAPLLFGADHPVLKQQRVATIQTLGGSGALKVGADFLKRYFPESGVWVSDPTWENHVAIFAG AGFEVSTYPWYDEATNGVRFNDLLATLKTLPARSIVLLHPCCHNPTGADLTNDQWDAVIEILKARELIPF LDIAYQGFGAGMEEDAYAIRAIASAGLPALVSNSFSKIFSLYGERVGGLSVMCEDAEAAGRVLGQLKATV RRNYSSPPNFGAQVVAAVLNDEALKASWLAEVEEMRTRILAMRQELVKVLSTEMPERNFDYLLNQRGMFS YTGLSAAQVDRLREEFGVYLIASGRMCVAGLNTANVQRVAKAFAAVM >HI1617 MFEHIKAAPADPILGLGEAFKSETRENKINLGIGVYKDAQGTTPIMHAVKEAEKRLFDKEKTKNYLTIDG IADYNEQTKALLFGKDSEVIQSNRARTVQSLGGTGALRIAAEFIKRQTKAQNVWISTPTWPNHNAIFNAV GMTIREYRYYDAERKALDWEHLLEDLSQASEGDVVLLHGCCHNPTGIDPTPEQWQELAALSAKNGWLPLF DFAYQGLANGLDEDAYGLRAFAANHKELLVASSFSKNFGLYNERVGAFTLVAENAEIASTSLTQVKSIIR TLYSNPASHGGATVATVLNDAQLRQEWENELTEMRERIKKMRHLFVQLLKEYGAEQDFSFIIEQNGMFSF SGLTGEQVDRLKNEFAIYAVRSGRINVAGITEDNIRYLCESIVKVL >CT637 MSLFEQLPSFSPDSILGLAQAFQEDPREDKINLLLGTYEREKKRYGGFSSVRKAQSVFFDDEKDKNYLPI KGSSTFLEEMAALCFGEVDASRWVGVQAIGGTGALHLGASVYANASLAGKVYIPSQTWGNHSRIFAHQGL ALEYYPYYDQETKELDLQGLKAILRSAPETSLVLLHCCCHNPTGKDIPLSEWPEIITIIKERDLIPFFDM AYLGFASGIEEDRRPVRLCIEAGVTTFVAGGASKIFSLYGSRVGFFGAIHQDKLDLNRILSFLEEQIRGE YSSPAREGVAIVTSILSNPYLRQEWELELNGIRQSLEEIRSSFVIAMRNVAGHSFDFIASQKGFFGYPGF SKEQVLFLREELGIYTTAGGRFNLNGITDKNINRVTHGFAQAYEYPRSVS >YKL106w MLRTRLTNCSLWRPYYTSSLSRVPRAPPDKVLGLSEHFKKVKNVNKIDLTVGIYKDGWGKVTTFPSVAKA QKLIESHLELNKNLSYLPITGSKEFQENVMKFLFKESCPQFGPFYLAHDRISFVQTLSGTGALAVAAKFL ALFISRDIWIPDPSWANHKNIFQNNGFENIYRYSYYKDGQIDIDGWIEQLKTFAYNNQQENNKNPPCIIL HACCHNPTGLDPTKEQWEKIIDTIYELKMVPIVDMAYQGLESGNLLKDAYLLRLCLNVNKYPNWSNGIFL CQSFAKNMGLYGERVGSLSVITPATANNGKFNPLQQKNSLQQNIDSQLKKIVRGMYSSPPGYGSRVVNVV LSDFKLKQQWFKDVDFMVQRLHHVRQEMFDRLGWPDLVNFAQQHGMFYYTRFSPKQVEILRNNYFVYLTG DGRLSLSGVNDSNVDYLCESLEAVSKMDKLA >YLR027c MNKRTQEYKNTRAIMSATLFNNIELLPPDALFGIKQRYGQDQRATKVDLGIGAYRDDNGKPWVLPSVKAA EKLIHNDSSYNHEYLGITGLPSLTSNAAKIIFGTQSDAFQEDRVISVQSLSGTGALHISAKFFSKFFPDK LVYLSKPTWANHMAIFENQGLKTATYPYWANETKSLDLNGFLNAIQKAPEGSIFVLHSCAHNPTGLDPTS EQWVQIVDAIASKNHIALFDTAYQGFATGDLDKDAYAVRLGVEKLSTVSPVFVCQSFAKNAGMYGERVGC FHLALTKQAQNKTIKPAVTSQLAKIIRSEVSNPPAYGAKIVAKLLETPELTEQWHKDMVTMSSRITKMRH ALRDHLVKLGTPGNWDHIVNQCGMFSFTGLTPQMVKRLEETHAVYLVASGRASIAGLNQGNVEYVAKAID EVVRFYTIEAKL >CPn0740 MSFFNHIPTFSPDAILGLQNVFFADKRPEKVNLVIGVYEHPQKRYGGLSCIRKAQTVILEEEQNKSYLPI SGLQIFLDEMRELVFGAVDPSAIVGFQSLGGTGALHLGARLLSVAKGSGKVYVPEQTWSNHIRIFSQEGL EVIRYPYYSKEQKQLLFEPLIAFLKEVEKNSVILLHGCCHNPTGVDFTEDMWKELAILMKERELIPFFDT AYQGFAHGIELDRKPIEIFISEGNTVLVAASSSKNFALYGERVGYFAVHSTFTDELVKIHSFLEEKIRGE YSSPQRWGVEIVSTILSNPYLKEEWQSELNFIRESLGKMRTRFVQALRKVAGHTFDFLLSQHGFFAYPGF SDKQVLFLREQHAVYTTAGGRMNLNGITEKNIDHVVQSFIQAYEL

COGs Alignment Notes

To generate a multiple sequence alignment, use:

Paste the sequences from your best-hit COG, saved in your "COGs FASTA Sequences" notebook area, into the input box of Multalin. Also paste in the protein sequence derived from GenScan to include your unknown sequence in this alignment and press the "Start Multalin!" button. Display these results in text form by clicking on the "-Results as a text page (msf) " link. Paste this Multalin display into your notebook.

Multalin Alignment

Multalin version 5.4.1 Copyright I.N.R.A. France 1989, 1991, 1994, 1996 Published research using this software should cite Multiple sequence alignment with hierarchical clustering F. CORPET, 1988, Nucl. Acids Res., 16 (22), 10881-10890 Symbol comparison table: blosum62 Gap weight: 12 Gap length weight: 2 Consensus levels: high=90% low=50% Consensus symbols: ! is anyone of IV $ is anyone of LM % is anyone of FY # is anyone of NDQEBZ MSF: 468 Check: 0 .. Name: aspC Len: 468 Check: 23 Weight: 0.59 Name: HI1617 Len: 468 Check: 194 Weight: 0.59 Name: tyrB Len: 468 Check: 2273 Weight: 1.12 Name: YLR027c Len: 468 Check: 8194 Weight: 1.02 Name: 14:10:32|GENSC Len: 468 Check: 3671 Weight: 1.02 Name: CT637 Len: 468 Check: 628 Weight: 0.87 Name: CPn0740 Len: 468 Check: 4695 Weight: 0.87 Name: YKL106w Len: 468 Check: 534 Weight: 1.91 Name: Consensus Len: 468 Check: 3486 Weight: 0.00 // 1 50 aspC .......... .......... .....MFENI TAAPADPILG LADLFRADER HI1617 .......... .......... .....MFEHI KAAPADPILG LGEAFKSETR tyrB .......... .......... .....MFQKV DAYAGDPILT LMERFKEDPR YLR027c ...MNKRTQE YKNTRAIMS. ...ATLFNNI ELLPPDALFG IKQRYGQDQR 14:10:32|GENSCAN_pre MSQICKRGLL ISNRLAPAAL RCKSTWFSEV QMGPPDAILG VTEAFKKDTN CT637 .......... .......... ...MSLFEQL PSFSPDSILG LAQAFQEDPR CPn0740 .......... .......... ...MSFFNHI PTFSPDAILG LQNVFFADKR YKL106w .......MLR TRLTNCSLWR PYYTSSLSRV PRAPPDKVLG LSEHFKKVKN Consensus .......... .......... ......f..v ...ppD.ilg l.#.%k.d.r 51 100 aspC PGKINLGIGV YKDETGKTPV LTSVKKAEQY L.LENETTKN ..YLGIDGIP HI1617 ENKINLGIGV YKDAQGTTPI MHAVKEAEKR L.FDKEKTKN ..YLTIDGIA tyrB SDKVNLSIGL YYNEDGIIPQ LQAVAEAEAR LNAQPHGASL ..YLPMEGLN YLR027c ATKVDLGIGA YRDDNGKPWV LPSVKAAEKL IHNDSSYNHE ..YLGITGLP 14:10:32|GENSCAN_pre PKKINLGAGA YRDDNTQPFV LPSVREAEKR VVS.RSLDKE ..YATIIGIP CT637 EDKINLLLGT YEREKKRYGG FSSVRKAQS. VFFDDEKDKN ..YLPIKGSS CPn0740 PEKVNLVIGV YEHPQKRYGG LSCIRKAQT. VILEEEQNKS ..YLPISGLQ YKL106w VNKIDLTVGI YKDGWGKVTT FPSVAKAQKL IESHLELNKN LSYLPITGSK Consensus ..K!#L.iG. Y.d..g.... l.s!.kA#k. .....e..k. ..Ylpi.G.. 101 150 aspC EFGRCTQELL FGKGSAL... ..INDKRART AQTPGGTGAL RVAADFLAKN HI1617 DYNEQTKALL FGKDSEV... ..IQSNRART VQSLGGTGAL RIAAEFIKRQ tyrB CYRHAIAPLL FGADHPV... ..LKQQRVAT IQTLGGSGAL KVGADFLKRY YLR027c SLTSNAAKII FGTQSDA... ..FQEDRVIS VQSLSGTGAL HISAKFFSKF 14:10:32|GENSCAN_pre EFYNKAIELA LGKGSKR... ..LAAKHNVT AQSISGTGAL RIGAAFLAKF CT637 TFLEEMAALC FGE....... ..VDASRWVG VQAIGGTGAL HLGASVYAN. CPn0740 IFLDEMRELV FGA....... ..VDPSAIVG FQSLGGTGAL HLGARLLSV. YKL106w EFQENVMKFL FKESCPQFGP FYLAHDRISF VQTLSGTGAL AVAAKFLALF Consensus .f......ll fg........ ..l...r... vQ.lgGtGAL ...A.fla.. 151 200 aspC TS.VKRVWVS NPSWPNHKSV FNSAGLEVRE YAYYDAENHT LDFDALINSL HI1617 TK.AQNVWIS TPTWPNHNAI FNAVGMTIRE YRYYDAERKA LDWEHLLEDL tyrB FP.ESGVWVS DPTWENHVAI FAGAGFEVST YPWYDEATNG VRFNDLLATL YLR027c FP.DKLVYLS KPTWANHMAI FENQGLKTAT YPYWANETKS LDLNGFLNAI 14:10:32|GENSCAN_pre WQGNREIYIP SPSWGNHVAI FEHAGLPVNR YRYYDKDTCA LDFGGLIEDL CT637 ASLAGKVYIP SQTWGNHSRI FAHQGLALEY YPYYDQETKE LDLQGLKAIL CPn0740 AKGSGKVYVP EQTWSNHIRI FSQEGLEVIR YPYYSKEQKQ LLFEPLIAFL YKL106w I..SRDIWIP DPSWANHKNI FQNNGFE.NI YRYSYYKDGQ IDIDGWIEQL Consensus ......!wip .ptW.NH..I F...Gle... Y.yyd..t.. ld..gli..l 201 250 aspC NEAQAGD... ......VVLF HGCCHNPTGI DPTLEQWQTL AQLSVEKGWL HI1617 SQASEGD... ......VVLL HGCCHNPTGI DPTPEQWQEL AALSAKNGWL tyrB KTLPARS... ......IVLL HPCCHNPTGA DLTNDQWDAV IEILKARELI YLR027c QKAPEGS... ......IFVL HSCAHNPTGL DPTSEQWVQI VDAIASKNHI 14:10:32|GENSCAN_pre KKIPEKS... ......IVLL HACAHNPTGV DPTLEQWREI SALVKKRNLY CT637 RSAPETS... ......LVLL HCCCHNPTGK DIPLSEWPEI ITIIKERDLI CPn0740 KEVEKNS... ......VILL HGCCHNPTGV DFTEDMWKEL AILMKERELI YKL106w KTFAYNNQQE NNKNPPCIIL HACCHNPTGL DPTKEQWEKI IDTIYELKMV Consensus k..p..s... .......vlL H.CcHNPTG. Dpt.eqW..i .....e.... 251 300 aspC PLFDFAYQGF ARG.LEEDAE GLRAFA...A M...HKELIV ASSYSKNFGL HI1617 PLFDFAYQGL ANG.LDEDAY GLRAFA...A N...HKELLV ASSFSKNFGL tyrB PFLDIAYQGF GAG.MEEDAY AIRAIA...S A...GLPALV SNSFSKIFSL YLR027c ALFDTAYQGF ATGDLDKDAY AVRLGVEKLS T...VSPVFV CQSFAKNAGM 14:10:32|GENSCAN_pre PFIDMAYQGF ATGDIDRDAQ AVRTFE...A D...GHDFCL AQSFAKNMGL CT637 PFFDMAYLGF ASG.IEEDRR PVRLCI...E A...GVTTFV AGGASKIFSL CPn0740 PFFDTAYQGF AHG.IELDRK PIEIFI...S E...GNTVLV AASSSKNFAL YKL106w PIVDMAYQGL ESGNLLKDAY LLRLCLNVNK YPNWSNGIFL CQSFAKNMGL Consensus p..D.AYqGf a.G.l..Day ..r....... .........v ..sfsKnfg$ 301 350 aspC YNERVGACTL VAADS..... ....ET.... VDRAFSQMKA AIRANYSNPP HI1617 YNERVGAFTL VAENA..... ....EI.... ASTSLTQVKS IIRTLYSNPA tyrB YGERVGGLSV MCEDA..... ....EA.... AGRVLGQLKA TVRRNYSSPP YLR027c YGERVGCFHL ALTKQ..... ....AQNKTI KPAVTSQLAK IIRSEVSNPP 14:10:32|GENSCAN_pre YGERAGAFTV LCSDE..... ....EE.... AARVMSQVKI LIRGLYSNPP CT637 YGSRVGFFGA IHQDK..... ....LD.... LNRILSFLEE QIRGEYSSPA CPn0740 YGERVGYFAV HSTFT..... ....DE.... LVKIHSFLEE KIRGEYSSPQ YKL106w YGERVGSLSV ITPATANNGK FNPLQQKNSL QQNIDSQLKK IVRGMYSSPP Consensus YgeRvG.f.v .......... .......... .....sqlk. .!Rg.ySsPp 351 400 aspC AHGASVVATI LSNDALRAIW EQELTDMRQR IQRMRQLFVN TLQEKGANRD HI1617 SHGGATVATV LNDAQLRQEW ENELTEMRER IKKMRHLFVQ LLKEYGAEQD tyrB NFGAQVVAAV LNDEALKASW LAEVEEMRTR ILAMRQELVK VLSTEMPERN YLR027c AYGAKIVAKL LETPELTEQW HKDMVTMSSR ITKMRHALRD HLVKLGTPGN 14:10:32|GENSCAN_pre VHGARIAAEI LNNEDLRAQW LKDVKLMADR IIDVRTKLKD NLIKLGSSQN CT637 REGVAIVTSI LSNPYLRQEW ELELNGIRQS LEEIRSSFVI AMRNV.AGHS CPn0740 RWGVEIVSTI LSNPYLKEEW QSELNFIRES LGKMRTRFVQ ALRKV.AGHT YKL106w GYGSRVVNVV LSDFKLKQQW FKDVDFMVQR LHHVRQEMFD RL....GWPD Consensus ..G..!va.. Ls...L...W ..#v..mr.r i..mR...v. .$........ 401 450 aspC FSFIIKQNGM FSFSGLTKEQ VLRLREEFGV YAVASGRVNV AGMTPDNMAP HI1617 FSFIIEQNGM FSFSGLTGEQ VDRLKNEFAI YAVRSGRINV AGITEDNIRY tyrB FDYLLNQRGM FSYTGLSAAQ VDRLREEFGV YLIASGRMCV AGLNTANVQR YLR027c WDHIVNQCGM FSFTGLTPQM VKRLEETHAV YLVASGRASI AGLNQGNVEY 14:10:32|GENSCAN_pre WDHIVNQIGM FCFTGLKPEQ VQKLIKDHSV YLTNDGRVSM AGVTSKNVEY CT637 FDFIASQKGF FGYPGFSKEQ VLFLREELGI YTTAGGRFNL NGITDKNINR CPn0740 FDFLLSQHGF FAYPGFSDKQ VLFLREQHAV YTTAGGRMNL NGITEKNIDH YKL106w LVNFAQQHGM FYYTRFSPKQ VEILRNNYFV YLTGDGRLSL SGVNDSNVDY Consensus fd.i..Q.Gm F.%tgls..q V..Lre...! Ylta.GR... aG.n..N!.y 451 468 aspC LCEAIVAVL. ........ HI1617 LCESIVKVL. ........ tyrB VAKAFAAVM. ........ YLR027c VAKAIDEVVR FYTIEAKL 14:10:32|GENSCAN_pre LAESIHKVTK ........ CT637 VTHGFAQAYE YPRSVS.. CPn0740 VVQSFIQAYE L....... YKL106w LCESLEAVSK MDKLA... Consensus l.es...v.. ........

Multalin Alignment Notes

To search for protein domains and view a model structure for your protein, click here:

NCBI's Conserved Domain Search allows you to match your protein sequence to a library of conserved protein domains, generate a multiple sequence alignment based on this match, and explore 3D modeling templates for your sequence.
Paste your protein sequence from GenScan into the CD-Search query box and run the search. From the search results page, generate a multiple sequence alignment for the top 10 sequences representitive of the conserved domain hit. Paste this alignment into your notebook. Before viewing a structure with Cn3D, use the listbox to specify "up to 5" sequences. Invoke Cn3D with a display of a 3D modeling template, and a multiple sequence alignment including your query sequence, by pressing the "Redisplay Alignment" button. In the Cn3D Sequence Window, use the "Alignment/Hide or Show Rows" menu item to hide all but your query and the structurally-anchored sequence shown at the top of the alignment. Residues identical in your sequence and the structural template are shown in red. Locate the Prosite Motif you found earlier within the Cn3D alignment window. Save the Cn3D alignemt by exporting as text to a file on your desktop. Drag this file onto your "tools" window, then select and paste the alignment into your notebook.

CD-Search Domain Hits

gnl|Pfam|pfam00155 aminotran_1, Aminotransferases class-I 338 4e-94 gnl|Pfam|pfam00155, aminotran_1, Aminotransferases class-I query to multiple alignment, display sequences Length = 428 Score = 338 bits (857), Expect = 4e-94 Query: 23 KSTWFSEVQMGPPDAILGVTEAFKKDTNPKKIN----LGAGAYRDDNTQPFVLPSVREAE 78 Sbjct: 1 LSRNATFNSHGQDSSYFLGWQEYEKNPYHEVHNTNGIIQMGLAENQLCFDLLESWLAKNP 60 Query: 79 KRVVSRS-------LDKEYATIIGIPEFYNKAIELALGKGSKRLAAKHNVTAQSISGTGA 131 Sbjct: 61 EAAAFKKNGESIFAELALFQDYHGLPAFKKAMVDFMAEIRGNKVTFDPNHLVLTAGATSA 120 Query: 132 LRIGAAFLAKFWQGNREIYIPSPSWGNHV-AIFEHAGLPVNRYRYYDKDTCALDFGGLIE 190 Sbjct: 121 NETFIFCLADPGE---AVLIPTPYYPGFDRDLKWRTGVEIVPIHCTSSNGFQITETALEE 177 Query: 191 DLKKIPE---KSIVLLHACAHNPTGVDPTLEQWREISALVKKRNLYPFIDMAYQGFATGD 247 Sbjct: 178 AYQEAEKRNLRVKGVLVTNPSNPLGTTMTRNELYLLLSFVEDKGIHLISDEIYSGTAFSS 237 Query: 248 IDRDAQAVRTFEAD---------GHDFCLAQSFAKNMGLYGERAGAFTVLCSDEEEAARV 298 Sbjct: 238 P--SFISVMEVLKDRNCDENSEVWQRVHVVYSLSKDLGLPGFRVGAIYSNDDMVVAAATK 295 Query: 299 M-------SQVKILIRGLYSNP---PVHGARIAAEILNNEDLRAQWLKDVKLMADRIIDV 348 Sbjct: 296 MSSFGLVSSQTQHLLSAMLSDKKLTKNYIAENHKRLKQRQKKLVSGLQKSG-ISCLNGNA 354 Query: 349 RTKLKDNLIKLGSSQNWDHIVNQIGMFCFTGLKPEQVQK-LIKDHSVYLTNDGRVSMAGV 407 Sbjct: 355 GLFCWVDMRHLLR----SNTFEAEMELWKKIVYEVHLNISPGSSCHCTEPGWFRVCFANL 410 Query: 408 TSKNVEYLAESIHKVTK 424 Sbjct: 411 PERTLDLAMQRLKAFVG 427

CD-Search Alignment

All chains Virtual Bonds All Atoms Launch Cn3D HTML Display Text Display FASTA with gaps Phylip format 10 20 30 40 50 60 . | . | . | . | . | . | 1B8G_B 5 NATFNSHGQDSSYFLGWQEYEKNPYHEVHNTNGIIQMGLAENQLCFDLLESWLAKNPEAA 64 query 26 WFSEVQMGPPDAILGVTEAFKKDTNPKKIN----LGAGAYRDDNTQPFVLPSVREAEKRV 81 1ART 1 MFENITAAPADPILGLADLFRADERPGKIN----LGIGVYKDETGKTPVLTSVKKAEQYL 56 1AJS_A 5 VFAEVPQAQPVLVFKLIADFREDPDPRKVN----LGVGAYRTDDCQPWVLPVVRKVEQRI 60 7AAT_A 3 WWSHVEMGPPDPILGVTEAFKRDTNSKKMN----LGVGAYRDDNGKPYVLNCVRKAEAMI 58 1168256 32 WWKSVEPAPKDPILGVTEAFLADPSPEKVN----VGVGAYRDDNGKPVVLECVREAEKRL 87 1168259 4 ILSSVLPAPEDPVLSVIFACRDDPSPVKLN----LSAGTYRTEEGKPLVLDVVRRAEQQL 59 2506178 17 VFAHLVRAPEDPILGVTVAYNKDPSPIKLN----LGVGAYRTEEGKPLVLDVVRRVERQL 72 1168260 52 RFEGITMAPPDPILGVSEAFKADTNGMKLN----LGVGAYRTEELQPYVLNVVKKAENLM 107 1168262 1 MFEHIKAAPADPILGLGEAFKSETRENKIN----LGIGVYKDAQGTTPIMHAVKEAEKRL 56 70 80 90 100 110 120 . | . | . | . | . | . | 1B8G_B 65 AFKKNGESIFAELALFQDYHGLPAFKKAMVDFMAEIRGNKVTFDPNHLVLTAGATSANET 124 query 82 VSR----------KEYATIIGIPEFYNKAIELALGKGSKRLAAKHNVTAQSISGTGALRI 134 1ART 57 LEN----------KNYLGIDGIPEFGRCTQELLFGKGSALINDKRARTAQTPGGTGALRV 109 1AJS_A 61 ANNSSLN------HEYLPILGLAEFRTCASRLALGDDSPALQEKRVGGVQSLGGTGALRI 114 7AAT_A 59 AAKK-MD------KEYLPIAGLADFTRASAELALGENSEAFKSGRYVTVQGISGTGSLRV 111 1168256 88 AGS--TF------MEYLPMGGSAKMVDLTLKLAYGDNSEFIKDKRIAAVQTLSGTGACRL 139 1168259 60 AND----------KEYLPLNGLPEFNKLSTKLILGDDSPALKENRVVTTQCLSGTGSLRV 111 2506178 73 LNDMSRN------KEYIPIVGLADFNKLSAKLIFGADSPAIQENRVTTVQGLSGTGSLRV 126 1168260 108 LERGDN-------KEYLPIEGLAAFNKATAELLFGAGHPVIKEQRVATIQGLSGTGSLRL 160 1168262 57 FDK----------KNYLTIDGIADYNEQTKALLFGKDSEVIQSNRARTVQSLGGTGALRI 109 130 140 150 160 170 180 . | . | . | . | . | . | 1B8G_B 125 FIFCLADPGE-------AVLIPTPYYPGFDRDLKWRTGVEIV-PIHCTSSNGFQITETAL 176 query 135 GAAFLAKFWQG----NREIYIPSPSWGNHV-AIFEHAGLPVN-RYRYYDKDTCALDFGGL 188 1ART 110 AADFLAKNTSV-----KRVWVSNPSWPNHK-SVFNSAGLEVR-EYAYYDAENHTLDFDAL 162 1AJS_A 115 GAEFLARWYNGTNNKDTPVYVSSPTWENHN-GVFTTAGFKDIRSYRYWDTEKRGLDLQGF 173 7AAT_A 112 GANFLQRFFKF----SRDVYLPKPSWGNHT-PIFRDAGLQLQ-AYRYYDPKTCSLDFTGA 165 1168256 140 FADFQKRFSPG-----SQIYIPVPTWSNHH-NIWKDAQVPQK-TYHYYHPETKGLDFSAL 192 1168259 112 GAEFLATHNKE-----SVIFVPNPTWGNHP-RIFTLAGLSVQ-YFRYYDPKSRGLDFKGM 164 2506178 127 GGEFLAKHYHQ-----RIIYLPTPTWGNHT-KVFNLAGLTVK-TYRYYAPATRGLDFQGL 179 1168260 161 AAALIERYFPG-----AKVVISSPTWGNHK-NIFNDAKVPWS-EYRYYDPKTIGLDFEGM 213 1168262 110 AAEFIKRQTKA-----QNVWISTPTWPNHN-AIFNAVGMTIR-EYRYYDAERKALDWEHL 162 190 200 210 220 230 240 . | . | . | . | . | . | 1B8G_B 177 EEAYQEAEKRNLRVKGVLVTNPSNPLGTTMTRNELYLLLSFVEDKGIHLISDEIYSGTAF 236 query 189 IEDLKKIPE---KSIVLLHACAHNPTGVDPTLEQWREISALVKKRNLYPFIDMAYQGFAT 245 1ART 163 INSLNEAQA---GDVVLFHGCCHNPTGIDPTLEQWQTLAQLSVEKGWLPLFDFAYQGFAR 219 1AJS_A 174 LSDLENAPE---FSIFVLHACAHNPTGTDPTPEQWKQIASVMKRRFLFPFFDSAYQGFAS 230 7AAT_A 166 MEDISKIPE---KSIILLHACAHNPTGVDPRQEQWKELASVVKKRNLLAYFDMAYQGFAS 222 1168256 193 MDDVKNAPE---GSFFLLHACAHNPTGVDPTEEQWREISQLFKAKKHFAFFDMAYQGFAS 249 1168259 165 LEDLGAAPP---GAIVVLQACAHNPTGVDPTFEQWEKFRRLVRSKSLLPFFDSAYQGFAS 221 2506178 180 LEDLGSAPS---GSVVLLHACAHNPTGVDPTLEQWEQIRQLIRSKSLLPFFDSAYQGFAS 236 1168260 214 IADIKEAPE---GSFILLHGCAHNPTGIDPTPEQWVKIADVIQEKNHIPFFDVAYQGFAS 270 1168262 163 LEDLSQASE---GDVVLLHGCCHNPTGIDPTPEQWQELAALSAKNGWLPLFDFAYQGLAN 219 250 260 270 280 290 300 . | . | . | . | . | . | 1B8G_B 237 SSP--SFISVMEVLKDRNCDENSEVWQRVHVVYSLSKDLGLPGFRVGAIYSNDDMVVAAA 294 query 246 GDIDRDAQAVRTFEAD---------GHDFCLAQSFAKNMGLYGERAGAFTVLCSDEEEAA 296 1ART 220 G-LEEDAEGLRAFAAM---------HKELIVASSYSKNFGLYNERVGACTLVA---ADSE 266 1AJS_A 231 GNLEKDAWAIRYFVSE---------GFELFCAQSFSKNFGLYNERVGNLTVVA---KEPD 278 7AAT_A 223 GDINRDAWALRHFIEQ---------GIDVVLSQSYAKNMGLYGERAGAFTVIC---RDAE 270 1168256 250 GDPARDAKSIRIFLED---------GHHIGISQSYAKNMGLYGQRVGCLSVLC---EDPK 297 1168259 222 GSLDADAQAVRMFVAD---------GGECLIAQSYAKNMGLYGERIGSLTIVC---TSED 269 2506178 237 GSLDADAQPVRLFVAD---------GGELLVAQSYAKNMGLYGERVGALSIVS---KSAD 284 1168260 271 GSLDEDAASVRLFAER---------GMEFFVAQSYSKNLGLYAERIGAINVVC---SSAD 318 1168262 220 G-LDEDAYGLRAFAAN---------HKELLVASSFSKNFGLYNERVGAFTLVA---ENAE 266 310 320 330 340 350 360 . | . | . | . | . | . | 1B8G_B 295 TKMSSFGLVSSQTQHLLSAMLSDKKLTKNYIAENHKRLKQRQKKLVSGLQKS-G-ISCLN 352 query 297 RV-------MSQVKILIRGLYSNP---PVHGARIAAEILNNEDLRAQWLKDV-KLMADRI 345 1ART 267 TVD----RAFSQMKAAIRANYSNP---PAHGASVVATILSNDALRAIWEQELTD-MRQRI 318 1AJS_A 279 SIL----RVLSQMQKIVRVTWSNP---PAQGARIVARTLSDPELFHEWTGNVKT-MADRI 330 7AAT_A 271 EAK----RVESQLKILIRPMYSNP---PMNGARIASLILNTPELRKEWLVEVKG-MADRI 322 1168256 298 QAV----AVKSQLQQLARPMYSNP---PLHGAQLVSTILEDPELKSLWLKEVKV-MADRI 349 1168259 270 VAK----KVENQVLLVVRPMYLTP---PIHGASIVATILKNSDMYNDWTIELKG-MADRI 321 2506178 285 VSS----RVESQLKLVIRPMYSSP---PIHGASIVAAILKDRDLYNDWTIELKA-MADRI 336 1168260 319 AAT----RVKSQLKRIARPMYSNP---PVHGARIVANVVGDVTMFSEWKAEMEM-MAGRI 370 1168262 267 IAS----TSLTQVKSIIRTLYSNP---ASHGGATVATVLNDAQLRQEWENELTE-MRERI 318 370 380 390 400 410 420 . | . | . | . | . | . | 1B8G_B 353 GNAGLFCWVDMRHLLR----SN-----TFEAEMELWKKIVYEVHLNISPGSSCHCTEPGW 403 query 346 IDVRTKLKDNLIKLGSSQNWDH-----IVNQIGMFCFTGLKPEQVQK-LIKDHSVYLTND 399 1ART 319 QRMRQLFVNTLQEKGA----NRDF-SFIIKQNGMFSFSGLTKEQVLR-LREEFGVYAVAS 372 1AJS_A 331 LSMRSELRARLEALKT----PGTW-NHITDQIGMFSFTGLNPKQVEY-LINQKHIYLLPS 384 7AAT_A 323 ISMRTQLVSNLKKEGS----SHNW-QHITDQIGMFCFTGLKPEQVER-LTKEFSIYMTKD 376 1168256 350 IGMRTTLRESLEKLGS----PLSW-EHVTKQIGMFCYSGLTPEQVDR-LTSEYHIYMTRN 403 1168259 322 ISMRQQLYAALEARGT----PGDW-SHIIKHIGMFTFTGLSEEQVRL-MAKEYHIYMTYD 375 2506178 337 INMRQQLFDALRARGT----PGDW-SHIIKQIGMFTFTGLNPEQVSI-LTKEYHIYLTSD 390 1168260 371 KTVRQELYDSLVSKDK----SGKDWSFILKQIGMFSFTGLNKAQSDN-MTDKWHVYMTKD 425 1168262 319 KKMRHLFVQLLKEYGA----EQDF-SFIIEQNGMFSFSGLTGEQVDR-LKNEFAIYAVRS 372 430 440 . | . | 1B8G_B 404 FRVCFANLPERTLDLAMQRLKAFV 427 query 400 GRVSMAGVTSKNVEYLAESIHKVT 423 1ART 373 GRVNVAGMTPDNMAPLCEAIVAVL 396 1AJS_A 385 GRINMCGLTTKNLDYVATSIHEAV 408 7AAT_A 377 GRISVAGVASSNVGYLAHAIHQVT 400 1168256 404 GRISMAGVTTGNVGYLANAIHEVT 427 1168259 376 GRISMASLSSKTVPQLADAIHAVV 399 2506178 391 GRISMAGLSSKTVPHLAHAIHAVV 414 1168260 426 GRISLAGLSLAKCEYLADAIIDSY 449 1168262 373 GRINVAGITEDNIRYLCESIVKVL 396

Cn3D Alignment

10         20         30         40         50         60         70 
                   .    |     .    |     .    |     .    |     .    |     .    |     .    | 
6980405 > 1    ~~~~~~~~~~ ~~~~~~~~~~ ~~~~~~~mlS RNATFNSHGQ DSSYFLGWQE YEKNPYHEVH NtngiIQMGL  43
query   > 1    ~~~~~~msqi ckrgllisnr lapaalrckS TWFSEVQMGP PDAILGVTEA FKKDTNPKKI N~~~~LGAGA  60
443542  > 1    ~~~~~~~~~~ ~~~~~~~~~~ ~~~~~~~~~S SWWSHVEMGP PDPILGVTEA FKRDTNSKKM N~~~~LGVGA  37
1168256 > 1    malammirna askrgmtpis ghfgglrsmS SWWKSVEPAP KDPILGVTEA FLADPSPEKV N~~~~VGVGA  66
2506178 > 1    ~~~~~~~~~~ ~~~~~masqn itpsptassD SVFAHLVRAP EDPILGVTVA YNKDPSPIKL N~~~~LGVGA  51

80         90        100        110        120        130        140 
                   .    |     .    |     .    |     .    |     .    |     .    |     .    | 
6980405 > 44   AENQLCFDLL ESWLAKNPEA AAFKkngesi faeLALFQDY HGLPAFKKAM VDFMAEIRGN KVTFDPNHLV  113
query   > 61   YRDDNTQPFV LPSVREAEKR VVSRs~~~~~ ~~lDKEYATI IGIPEFYNKA IELALGKGSK RLAAKHNVTA  123
443542  > 38   YRDDNGKPYV LNCVRKAEAM IAAKk~~~~~ ~~mDKEYLPI AGLADFTRAS AELALGENSE AFKSGRYVTV  100
1168256 > 67   YRDDNGKPVV LECVREAEKR LAGSt~~~~~ ~~~FMEYLPM GGSAKMVDLT LKLAYGDNSE FIKDKRIAAV  128
2506178 > 52   YRTEEGKPLV LDVVRRVERQ LLNDm~~~~~ ~srNKEYIPI VGLADFNKLS AKLIFGADSP AIQENRVTTV  115

150        160        170        180        190        200        210 
                   .    |     .    |     .    |     .    |     .    |     .    |     .    | 
6980405 > 114  LTAGATSANE TFIFCLADPG E~~~AVLIPT PYYPGFDrDL KWRTGVEIVP IHCTSSNGFQ ITETALEEAY  180
query   > 124  QSISGTGALR IGAAFLAKFW QgnrEIYIPS PSWGNHV~AI FEHAGLPVNR YRYYDKDTCA LDFGGLIEDL  192
443542  > 101  QGISGTGSLR VGANFLQRFF KfsrDVYLPK PSWGNHT~PI FRDAGLQLQA YRYYDPKTCS LDFTGAMEDI  169
1168256 > 129  QTLSGTGACR LFADFQKRFS Pg~sQIYIPV PTWSNHH~NI WKDAQVPQKT YHYYHPETKG LDFSALMDDV  196
2506178 > 116  QGLSGTGSLR VGGEFLAKHY Hq~rIIYLPT PTWGNHT~KV FNLAGLTVKT YRYYAPATRG LDFQGLLEDL  183

220        230        240        250        260        270        280 
                   .    |     .    |     .    |     .    |     .    |     .    |     .    | 
6980405 > 181  QEAEKrnlRV KGVLVTNPSN PLGTTMTRNE LYLLLSFVED KGIHLISDEI YSGTAFSSP~ ~SFISVMEVL  248
query   > 193  KKIPE~~~KS IVLLHACAHN PTGVDPTLEQ WREISALVKK RNLYPFIDMA YQGFATGDId rDAQAVRTFE  259
443542  > 170  SKIPE~~~KS IILLHACAHN PTGVDPRQEQ WKELASVVKK RNLLAYFDMA YQGFASGDIn rDAWALRHFI  236
1168256 > 197  KNAPE~~~GS FFLLHACAHN PTGVDPTEEQ WREISQLFKA KKHFAFFDMA YQGFASGDPa rDAKSIRIFL  263
2506178 > 184  GSAPS~~~GS VVLLHACAHN PTGVDPTLEQ WEQIRQLIRS KSLLPFFDSA YQGFASGSLd aDAQPVRLFV  250

290        300        310        320        330        340        350 
                   .    |     .    |     .    |     .    |     .    |     .    |     .    | 
6980405 > 249  KDrncdense vWQRVHVVYS LSKDLGLPGF RVGAIYSNDd mvVAAATkms sfglvsSQTQ HLLSAMLSDK  318
query   > 260  AD~~~~~~~~ ~GHDFCLAQS FAKNMGLYGE RAGAFTVLCs deEEAARv~~ ~~~~~mSQVK ILIRGLYSNP  313
443542  > 237  EQ~~~~~~~~ ~GIDVVLSQS YAKNMGLYGE RAGAFTVIC~ ~~RDAEEak~ ~~~rveSQLK ILIRPMYSNP  290
1168256 > 264  ED~~~~~~~~ ~GHHIGISQS YAKNMGLYGQ RVGCLSVLC~ ~~EDPKQav~ ~~~avkSQLQ QLARPMYSNP  317
2506178 > 251  AD~~~~~~~~ ~GGELLVAQS YAKNMGLYGE RVGALSIVS~ ~~KSADVss~ ~~~rveSQLK LVIRPMYSSP  304

360        370        380        390        400        410        420 
                   .    |     .    |     .    |     .    |     .    |     .    |     .    | 
6980405 > 319  kltKNYIAEN HKRLKQRQKK LVSGLQKS~G ~ISCLNGNAG LFCWVDMRHL LR~~~~SN~~ ~~TFEAEMEL  378
query   > 314  ~~~PVHGARI AAEILNNEDL RAQWLKDV~K lMADRIIDVR TKLKDNLIKL GSsqnwDH~~ ~~IVNQIGMF  375
443542  > 291  ~~~PMNGARI ASLILNTPEL RKEWLVEVkG ~MADRIISMR TQLVSNLKKE GS~~~~SHnw qhITDQIGMF  352
1168256 > 318  ~~~PLHGAQL VSTILEDPEL KSLWLKEVkV ~MADRIIGMR TTLRESLEKL GS~~~~PLsw ehVTKQIGMF  379
2506178 > 305  ~~~PIHGASI VAAILKDRDL YNDWTIELkA ~MADRIINMR QQLFDALRAR GT~~~~PGdw shIIKQIGMF  366

430        440        450        460        470    
                   .    |     .    |     .    |     .    |     .    |    
6980405 > 379  WKKIVYEVHL NIsPGSSCHC TEPGWFRVCF ANLPERTLDL AMQRLKAFVG e~~  429
query   > 376  CFTGLKPEQV QK~LIKDHSV YLTNDGRVSM AGVTSKNVEY LAESIHKVTK ~~~  424
443542  > 353  CFTGLKPEQV ER~LTKEFSI YMTKDGRISV AGVASSNVGY LAHAIHQVTK ~~~  401
1168256 > 380  CYSGLTPEQV DR~LTSEYHI YMTRNGRISM AGVTTGNVGY LANAIHEVTK ss~  430
2506178 > 367  TFTGLNPEQV SI~LTKEYHI YLTSDGRISM AGLSSKTVPH LAHAIHAVVT rva  418

Other Tools for DNA and Protein Sequence Analysis