Annotation d'une séquence nucléique de bactérie

Récupérer la séquence

Nous récupérons la séquence de Bacteriovorax Marinus (bactérie Gram négative parasite d'autres bactéries) sur

ftp://ftp.sanger.ac.uk/pub/pathogens/bm/BM.dbs

et nous découpons le morceau qui nous échoit, des bases 10000 à 19999.

10000bases

Recherche des ORFs à l'aide d'ORF Finder (NCBI)

Nous recherchons des cadres de lecture ouverts d'au moins 300 paires de bases, en spécifiant "code génétique bactérien" (ce qui ne change rien dans notre cas).

*

*

orf_2_300pb.html
orfig.cgi_1.html (cadres de lecture ouverts d'au moins 100 paires de bases)

Nous obtenons les 12 ORFs suivants :

Frame    Position  Taille
   +1  3739..5019    1281
   -3  8073..9212    1140
   -3  5988..7076    1089
   -2  7063..8076    1014
   +1  1876..2856     981
   +3  1167..1925     759
   -1  5342..5974     633
   +2   548..1165     618
   +2  9317..9739     423
   +1   112..516      405
   +2  3230..3613     384
   +3  5607..5930     324

En fait, les positions ne décrivent pas réellement les ORFs puisque ORF Finder repère les portions qui vont d'un codon ATG à un codon STOP.

Comparaison avec les bases de données

Afin de vérifier la présence de ces ORFs, nous avons effectué des Blastx sur la séquence entière puis sur les morceaux de 3kb de cette séquence.

Ainsi nous avons retrouvé des homologies (plus ou moins fortes) avec des protéines connues. Par ce procédé, de petits CDS, inférieurs à 300pb, peuvent être repérés alors qu'ils ne l'ont pas été par ORF Finder. De plus cela nous permet aussi d'éliminer les pseudogènes.

*

Blast.cgi_1_tout.html

*

Blast.cgi_2_1-3000.html

*

Blast.cgi_1-1200.html

blast_1700_2800.htm
blast_1700-3800.htm
blast_5000-6000.html

*

Blast.cgi_9000-10000.html

*

Résultats :

ORF1   +1  3739..5019 1281
Blast      3739-4959  +1

ORF2  -3   8073..9212  1140
Blast      8112-9176 -3

ORF3  -3   5988..7076  1089
Blast      5994-7055  -3

ORF4  -2   7063..8076  1014
Blast      7087-7914 -2

ORF5  +1  1876..2856  981
RIEN

ORF6  +3  1167..1925  759
Blast 1182-1718 +3

ORF7  -1  5342..5974  633
Blast     5402-5938 -1

ORF8  +2  548..1165  618
Blast 599-1144 +2    E=4e-4

ORF9 +2 9317..9739  423
Blast 9368-9580 +2

ORF10  +1 112..516 405
Blast     25-324 +1  E=1e-3

ORF11  +2  3230..3613  384
Blast  2852-3610 +2

ORF12  +3  5607..5930  324
Blast 5402-5938 -1   Rien

Lorsque l'on a repéré un ORF par ORF Finder et que l'on retrouve une homologie par Blastx sur cette même portion, on est quasiment sûr que cette portion correspond à un CDS.

Dans notre cas,9 des 12 ORFs ont des similitudes avec des séquences connues, les ORFs 5, 10 et 12 n'en ont pas.

Recherche des codons start

Pour transformer les ORFs en CDS, nous cherchons la présence d'un codon start (XTG), à l'aide des résultats des Blast précédents. Si plusieurs séquences des bases de données s'aligent avec notre ORF et ont leur codon start au même endroit, on regarde si l'ORF a aussi un codon start à cet endroit.

Sinon, on cherche un codon XTG dans le cadre de lecture, éventuellement en amont de celui proposé par ORF Finder.

ORF 1

ORF1   +1  3739..5019 1281
Blast      3739-4959  +1

Les 2 des 3 meilleurs Blasts commencent en 3739. Le dernier commence un codon plus tôt. Sur notre séquence, ce codon est bien : ATG.

ORF 2

ORF2  -3   8073..9212  1140
Blast      8112-9176 -3

Position du codon start suggérée par les trois meilleurs résultats du blast :

Requête  9176  9182  9185
Sujet      11     9     7
Start    9206  9206  9203

On a bien ATG (ou plutôt CAT, car on est dans le sens inverse).

ORF 3

ORF3  -3   5988..7076  1089
Blast      5994-7055  -3

Position du codon start suggérée par les trois meilleurs résultats du blast :

Requête  7055  7055  7055
Sujet      17    12    12
Start    7103  7088  7088

On n'a pas de codon start en 7088

>>> s[7085:7088]
'CTA'

A partir de la position donnée par l'ordinateur :

CAT TCT TTG ATC *

Donc le codon start CAT est bien en 7073-7076.

ORF 4

ORF4  -2   7063..8076  1014
Blast      7087-7914 -2

Position du codon start suggérée par les trois meilleurs résultats du blast :

Requête  7818  7914  7761
sujet      79    34    90
start    8052  8013  8028

Aucune majorité ne se dégage. On n'a pas de codon start en 8052, 8013 ou 8028.

>>> s[8010:8016]
'ATCAAG'
>>> s[8025:8031]
'TCTTGT'
>>> s[8049:8055]
'GTTATT'

Il n'y a pas de codon star avant. On garde donc la position du codon ATG donnée par ORF Finder.

ORF 5

ORF5  +1  1876..2856  981

Il n'y avait pas de résultat de Blast, et il n'y a pas de codon start alternatif en amont de celui proposé par ORFinder.

ORF 6

ORF6  +3  1167..1925  759
Blast 1182-1718 +3

Requête  1142  1182  1182
Sujet      18    47    44

On garde la suggestion d'ORF Finder.

ORF 7

ORF7  -1  5342..5974  633
Blast     5402-5938 -1

Requête 5938  5938  5932
Sujet     12    12    14
Start   5971  5971  5971

On a bien un codon start CAT en 5971-5974 :

>>> s[5968:5974]
'CGTCAT'

ORF 8

ORF8  +2  548..1165  618
Blast 599-1144 +2   E=4e-4

Requête  599  584  596
Sujet     44   22   22

On garde la proposition d'ORF Finder.

ORF 9

ORF9 +2 9317..9739  423
Blast 9368-9580 +2

Requête  9368  9362  9380
Sujet       28    11    17
Start     9341  9352  9364

On garde la proposition d'ORF Finder.

ORF 10

ORF10  +1 112..516 405
Blast     25-324 +1

On garde la proposition d'ORF Finder.

ORF 11

ORF11  +2  3230..3613  384
Blast  2852-3610 +2

Requpête  2852  2852  2852
Sujet       10     4     4
Start     2825  2843  2843

On a bien un codon start TTG en 2843-2845 :

>>> s[2842:2845]
'TTG'

ORF 12

ORF12  +3  5607..5930  324

On garde la proposition d'ORF Finder.

Traduction des CDS

On vérifie la pertinence des ORF trouvés à l'aide de plusieurs Blastp. Voici juste le premier :

Blastp_swissprot.html

Recherche des promoteurs

Nous utilisons WWW Signal Scan :

http://bimas.dcrt.nih.gov/molbio/signal

avec la base de données TDF (et pas Transfac puisqu'il s'agit d'une base de données pour les eucaryotes).

CDS 1

On cherche dans la chaine a[3340:3840] (ici, nous avons utilisé Python, "a" représente toute la séquence, le premier caractère a pour indice 0 : ici, on est autour du codon start du premier CDS, 400 bases en amont, 100 bases en aval).

Input sequence contained 500 base pairs
Signal File(s): prok

     Factor or Site Name      Loc.(Str.)       Signal Sequence        SITE #

30S_rRNA.IF3          site    167 (+) AGGT                            S01172 
30S_rRNA.IF3          site    351 (-) AGGT                            S01172 
input.seq:  500 base pairs
sigma-70              fact    359 (-) TATAAT                          S00129

CDS 2

Sur a[9000:9500] :

30S_rRNA.IF3          site    423 (+) AGGT                            S01172 
30S_rRNA.IF3          site    432 (-) AGGT                            S01172 
30S_rRNA.IF3          site    497 (-) AGGT                            S01172 
input.seq:  500 base pairs
sigma-70              fact    305 (+) TATAAT                          S00129 
sigma-70              fact    389 (+) TATAAT                          S00129

CDS 3

Sur a[7000:7500] :

30S_rRNA.IF3          site    138 (-) AGGT                            S01172 
30S_rRNA.IF3          site    210 (+) AGGT                            S01172 
30S_rRNA.IF3          site    325 (+) AGGT                            S01172 
30S_rRNA.IF3          site    405 (+) AGGT                            S01172 
input.seq:  500 base pairs
nitrogen_regula       site    399 (+) TTTTGCA                         S01161

CDS 4

Sur a[7950:8500] :

30S_rRNA.IF3          site    132 (+) AGGT                            S01172 
30S_rRNA.IF3          site    159 (+) AGGT                            S01172 
30S_rRNA.IF3          site    270 (-) AGGT                            S01172 
30S_rRNA.IF3          site     49 (-) AGGT                            S01172 
30S_rRNA.IF3          site    505 (-) AGGT                            S01172 
30S_rRNA.IF3          site     88 (-) AGGT                            S01172 
30S_rRNA.IF3          site     98 (+) AGGT                            S01172 
input.seq:  550 base pairs
sigma-70              fact    150 (-) TATAAT                          S00129 
sigma-70              fact    396 (-) TATAAT                          S00129

CDS 5

Sur a[1400:2000] :

30S_rRNA.IF3          site    112 (+) AGGT                            S01172 
30S_rRNA.IF3          site    156 (+) AGGT                            S01172 
30S_rRNA.IF3          site    183 (+) AGGT                            S01172 
30S_rRNA.IF3          site    405 (+) AGGT                            S01172 
30S_rRNA.IF3          site    432 (+) AGGT                            S01172 
input.seq:  600 base pairs
sigma-70              fact     28 (+) TATAAT                          S00129

CDS 6

Sur a[750:1300] :

30S_rRNA.IF3          site    250 (+) AGGT                            S01172 
30S_rRNA.IF3          site    385 (+) AGGT                            S01172 
30S_rRNA.IF3          site    435 (+) AGGT                            S01172 
30S_rRNA.IF3          site    452 (-) AGGT                            S01172 
input.seq:  550 base pairs
malT                  fact    315 (-) GGAKGA                          S01107 
sigma-70              fact    497 (+) TATAAT                          S00129 
sigma-70              fact    525 (+) TATAAT                          S00129

(un peu trop loin)

CDS 7

Sur a[5600:6100]

30S_rRNA.IF3          site    294 (+) AGGT                            S01172 
30S_rRNA.IF3          site    456 (-) AGGT                            S01172 
input.seq:  500 base pairs
sigma-70              fact    201 (+) TATAAT                          S00129

CDS 8

Sur a[50:650]

30S_rRNA.IF3          site     22 (+) AGGT                            S01172 
30S_rRNA.IF3          site    225 (+) AGGT                            S01172 
30S_rRNA.IF3          site    255 (-) AGGT                            S01172 
30S_rRNA.IF3          site    375 (+) AGGT                            S01172 
30S_rRNA.IF3          site     40 (+) AGGT                            S01172 
30S_rRNA.IF3          site    511 (-) AGGT                            S01172 
input.seq:  600 base pairs
lambda.c              site    573 (+) GGYGTRYG                        S01204 
XylR                  fact    324 (+) TTGANCAAATC                     S01780

CDS 9

etc.

(Ce serait la même procédure pour les autres CDS.)

Conclusions

Une majorité de nos CDS semblent être des gènes, car on retrouve une "TATA box" (sigma-70). C'est normal, car chez les bactéries, la majorité de l'ADN est codant.

L'un d'entre eux présente un promoteur lié au métabolisme de l'azote.

Autres logiciels effectuant la première partie de cette analyse (recherche d'ORF, de CDS, avec d'éventuelles confirmations par des Blast)

Frame D

http://www.toulouse.inra.fr/FrameD.html

Voici le résultat pour notre séquence :

*

FrameD.html

Eugène

http://www.inra.fr/bia/T/EuGene/

Autres logiciels qu'on aurait pu utiliser pour la deuxième partie de l'analyse (annotations)

Artemis

C'est un éditeur d'annotations.

http://www.sanger.ac.uk/Software/Artemis/

*

Nos résultats semblent corrects puisque les CDS ne se chevauchent pas (sauf le CDS 12 qui recouvre une partie du CDS 7 : il serait donc superflu). De plus l'ensemble des CDS couvre pratiquement toute la séquence (sauf une petite portion entre les CDS 1 et 7 : un CDS semble n'avoir pas été repéré dans le cadre de lecture -2)

Présentation des résultats.

                                                          Cadre de 
CDS  Stop  ATG(ORF) XTG(ORF) XTG(Blastx) XTG(blastp) Type lecture  Fonction inférée (blast)  Promoteur
1    5019  3739              idem                    1    +1       isomérase                 TATA box
2    8073  9212              idem                    1    -3       aminotransferase          TATA box
3    5988  7076              idem                    1    -3       dioxygénase               Métabolisme de l'azote
4    7063  8076              idem                    1    -2       isomérase                 TATA box
5    2856  1876     1948                             2    +1                                 TATA box
6    1925  1167              idem                    1    +3       phosphatidyl transférase  TATA box
7    5342  5974              idem                    1    -1       flavine-réductase-like/mono-oxygénase/protéine       TATA box
8    1165   548              idem                    1    +2       rien (E=1e-3)             TATA box
9    9739  9317              idem                    1    +2       protéine
10    516   112                                      2    +1            
11   3613  2936              idem                    1    +2       pseudo-uridine-synthase
12   5930  5607                                      2    +3

où le type est :

1: ORF + Blast
2: ORF
3: Blast

Domaines et Motifs

Exemple avec le CDS 1 :

PFAM

On trouve trois motifs : Trigger_N, Trigger_C et FKBP_C. On rejette le dernier, car il est spécifique aux vertébré.

*

Pfam1.htm
Pfam1Trigger_N.htm
Pfam1Trigger_C.htm
Pfam1_FKBP_C.htm

SignalP

On recherche un peptide-signal chez notre bactérie (c'est une Gram -), mais on n'en trouve pas.

< Is the sequence a signal peptide?
# Measure  Position  Value  Cutoff  Conclusion 
  max. C    27       0.222   0.49   NO
  max. Y   370       0.140   0.36   NO
  max. S    44       0.594   0.88   NO
  mean S     1-369   0.066   0.54   NO

*

signalP_1.html
SignalP_doc.html

TMPred

Recherche de domaines transmembranaires (vu la nature de la protéine, il ne devrait pas y en avoir).

TMpred_1.html

Les autres protéines

Nous traitons juste la suivante : PFAM trouve un domaine Aminotran.

*

Pfam2.htm
Pfam2Aminotran_1_2.htm

Pas de peptide-signal :

< Is the sequence a signal peptide?
# Measure  Position  Value  Cutoff  Conclusion 
  max. C   204       0.423   0.49   NO
  max. Y   243       0.162   0.36   NO
  max. S   130       0.570   0.88   NO
  mean S     1-242   0.115   0.54   NO

*

signalP_2.html

Pas de domaine transmembranaire :

*

TMpred_2.html

STRING

Nous avons aussi regardé STRING, utile pour des protéines de fonction similaire.

http://dag.embl-heidelberg.de/newstring_cgi/show_input_page.pl

Fichiers

Fichier Fasta contenant les séquences

>cds1_3739-5019
MSYTVETINDCTKKLVFNFETLDLTAEIKTAIIQKQKTTSLKGFRKGKAPLSMVEQVYGP
QIQSEALNQFVQNQFFDAVQKEELRICGYPTFENMNYEEGKSVKFDALVEIFPTVEVKNL
DKITVAKETVSVSDEDVAAMEKNYLGSRAEMKEVEGDVKLEKGHFAVLNFQGEKEDGERP
ENMKGEEFLLEIGSGQFIPGFEDGMIGMKKGEKKNIELTFPGDYHVEDLKEAKVTFETEL
LEIKQKIFPDFTDELAKEFGFESVEDFKTKTKDNLFKQKEREVAEKMHQEILEKLIEANT
FDVPASLVSQQEASLREDLSRNLKGQGFNDEMLKEYFEKWSGDMTDKATFQVRSGLILDN
LAKKFNVEASDSDFDAKIEEMAAGSGMQADQIKSYYASDAKLKGNLMYAIREEKTFEKIK
EEIKLK
>cds2_8073-9212
MEKLARTLVPEYLKDLKVYQAGKPIDEVAREKGLTKISKLASNENPLGPSPYAIKEMTGG
LWDLHRYPDMHAFQLKKSLCGLYSLEPGNIILGNGSEGIMAYIARAFLQPGDEVLTCENT
FIGFYILARSVGANLKKVPLTSDYRFDVEALAKSITSKTKAIYIANPNNPTGTYITKKEF
DYLMEYVPDHVIVLLDEAYFEFAKDCDDYPDSMDYRYDNVITLRTFSKAYGLSGIRVGYG
FAHDELISNLSKVKLPFEPNLIGQLGAKGALNDTPHLSRTLKNNKKRYNETFDFLTKHDF
NPIKSITNFITYKTGSLEASEWMFENLLNEGVIIRPLKANEMPEYVRVSLGNKEEMQHYF
EAMVKILPKYNDLFGRPTK
>cds3_5988-7076 
MESFKSSGTFSKQAHVKIPEGLYEEEHGRKGFFGRVSQIYHQNPPVNWTNIEGDLK
PRCQKPMFGDHLKANYFQPVLFNNDVTINIARYTESFECFFRNADFDELYFIHQGEGRFE
TIYGHLSYKKGDYITIPRGTTYKLFIDNETKIFKIESQSEFEQPDRGMLGPNALYDQTVI
ETPECAIGSEQDLEEYKVEVKRLGNITTITYPFNPLDAKGWKGSVYPSKLSIYDICPVMS
HRYHIPPSGHTTFVCRNFVVCSFVERPLEDSKHGVLRVPFYHSNIDYDEVLFYHQGDFFS
RDNIDAGALTFHPQGIHHGPHPKAFNSVDEKTHTDEFAVMVDTRFPLAPTTWFVENEVKD
YWKSWM
>cds4_7063-8076
MKICHYRNNLVPGGSTRLGILDENEGIIIDPNFVWACDYEREGKYNPYERANRTLPSSLF
SVLNLCDDPLDSLQDSYGLFQFLKLVGDLKTRNGTPTFYKLDDESISLTKPLDKIATYRD
FYAHEKHVAKGFEKRNEPIPEAWYEIPAYYKGSTHGFIGPEEEVLWPGYTNILDYELELG
MVVGKEGINIKEEDALKHIFGFTILNDISARDIQKKEMAIRLGPAKGKDFCSIIGPVITT
IDEFDGIEPDLLMTAKINGEEWSRGQSGDSHFSFAQMITHVSQDEWVLPGDLFGSGTVGT
GCGLEIDKWIQPGDEIELFVEGIGTLKNKIGSKNGKF
>cds6_1167-1925 
MIDQPKRLAFFLPNTFTALNMACGFASIIMAWKGQFYNASMILLLGAIFDSVDGRVARMT
GTQSQFGEQFDSISDVVSFGMAPAFLVYNCFFKDLGRLGMVVSFLYLLCGALRLARFNAN
IDKVSSDYFQGLPIPTAALGLVGYVLLAIEFHLIKTLTPFTIFYVVLYSLLMISNIPFYS
FKNATWVKTHKKRVLAIIFLLLALIFTYEQLMIGVITGAYVLGGLVYFITHKGALEDVFS
WKSENDEINESN
>cds7_5342-5974
MKTFETNGEFKDNYKFLIGSILPRPIAVVSTINENGTNNVAPFSFFTAVSAKPMIIAFS
PMIKSSTGEMKDTPRNIFREKEFVVNFVSEDIIDQINTTSVELPYGEDEFKLAGLTPIDS
DMVKAKRILESKIHFECIYRDHLSYGDQPGCGQIITGEVVKVHVNEELLEEGRIITENFK
PVGRGAGNDWILCDHLIQRERLMKAQIQK
>cds8_548-1165
MGLTYLPKWIYSCITFVALLLMLIIGVWGFLFAALVYGILFAIFRKQKEDFRKDSNENVI
VSPVNGRVYKIEKNVDHEFFGKDMTSVLIQVPFWKEFGLFFPVKSEIHDVQASCDSCLDH
LVKFRLVNGMDIGLAVGQNILRLAPQIMVLPGDRGKQKVNFGFLPMGGEVRVFIPSALEV
LINEKDEVVAGQGILAGIPTDIEEK
>cds9_9317-9739
MTSKYYYGQFTEEHLKLLKTGISLYNEEKFWECHEEVEDLWLADYGDDARYVYWVVIQVA
TSLYHYLDDNLNGAEGMIRKAKRKLEICEKKNVETELLYKYLSWEKFKKIIRKIPEKSKI
EDYNELYSFKFKNPNHWDKL
>cds11_3230-3613
LSFYKIILRYKGTQYQGWQKQPHTSQTIQGQLEKALKKISKSDEIHTIGSGRTDSGVHAL
GQVVRVQIPLELEPLSLLKALNSHLPNDIECIHSENSSELFNPVFDAKDKTYKYLFSLNG
RRNALVDDSMTCLDRPMDIEKMREACELFIGEHDFADFYTVGTDISSTVRVIYDCKLHLE
KQQGFLGEVYPEHYIFEVKGSGFLKQMVRLMVGTLWNIGLGKVELADLKMALNSPSGAKL
AAVAPSNGLYLCEVNY

Vous pouvez le télécharger ici :

resultat.fasta

Fichier EMBL contenant les annotations

FT   CDS                3739..5019
FT                      /label=cds1
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MSYTVETINDCTKKLVFNFETLDLTAEIKTAIIQKQKTTSLKGFRKGKAPLSMVEQVYGPQIQSEALNQFVQNQFFDAVQKEELRICGYPTFENMNYEEGKSVKFDALVEIFPTVEVKNLDKITVAKETVSVSDEDVAAMEKNYLGSRAEMKEVEGDVKLEKGHFAVLNFQGEKEDGERPENMKGEEFLLEIGSGQFIPGFEDGMIGMKKGEKKNIELTFPGDYHVEDLKEAKVTFETELLEIKQKIFPDFTDELAKEFGFESVEDFKTKTKDNLFKQKEREVAEKMHQEILEKLIEANTFDVPASLVSQQEASLREDLSRNLKGQGFNDEMLKEYFEKWSGDMTDKATFQVRSGLILDNLAKKFNVEASDSDFDAKIEEMAAGSGMQADQIKSYYASDAKLKGNLMYAIREEKTFEKIKEEIKLK"
  
FT   CDS                complement(8073..9212)
FT                      /label=cds2
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MEKLARTLVPEYLKDLKVYQAGKPIDEVAREKGLTKISKLASNENPLGPSPYAIKEMTGGLWDLHRYPDMHAFQLKKSLCGLYSLEPGNIILGNGSEGIMAYIARAFLQPGDEVLTCENTFIGFYILARSVGANLKKVPLTSDYRFDVEALAKSITSKTKAIYIANPNNPTGTYITKKEFDYLMEYVPDHVIVLLDEAYFEFAKDCDDYPDSMDYRYDNVITLRTFSKAYGLSGIRVGYGFAHDELISNLSKVKLPFEPNLIGQLGAKGALNDTPHLSRTLKNNKKRYNETFDFLTKHDFNPIKSITNFITYKTGSLEASEWMFENLLNEGVIIRPLKANEMPEYVRVSLGNKEEMQHYFEAMVKILPKYNDLFGRPTK"
  
FT   CDS                complement(5988..7076)
FT                      /label=cds3
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MESFKSSGTFSKQAHVKIPEGLYEEEHGRKGFFGRVSQIYHQNPPVNWTNIEGDLKPRCQKPMFGDHLKANYFQPVLFNNDVTINIARYTESFECFFRNADFDELYFIHQGEGRFETIYGHLSYKKGDYITIPRGTTYKLFIDNETKIFKIESQSEFEQPDRGMLGPNALYDQTVIETPECAIGSEQDLEEYKVEVKRLGNITTITYPFNPLDAKGWKGSVYPSKLSIYDICPVMSHRYHIPPSGHTTFVCRNFVVCSFVERPLEDSKHGVLRVPFYHSNIDYDEVLFYHQGDFFSRDNIDAGALTFHPQGIHHGPHPKAFNSVDEKTHTDEFAVMVDTRFPLAPTTWFVENEVKDYWKSWM"
  
FT   CDS                complement(7063..8076)
FT                      /label=cds4
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MKICHYRNNLVPGGSTRLGILDENEGIIIDPNFVWACDYEREGKYNPYERANRTLPSSLFSVLNLCDDPLDSLQDSYGLFQFLKLVGDLKTRNGTPTFYKLDDESISLTKPLDKIATYRDFYAHEKHVAKGFEKRNEPIPEAWYEIPAYYKGSTHGFIGPEEEVLWPGYTNILDYELELGMVVGKEGINIKEEDALKHIFGFTILNDISARDIQKKEMAIRLGPAKGKDFCSIIGPVITTIDEFDGIEPDLLMTAKINGEEWSRGQSGDSHFSFAQMITHVSQDEWVLPGDLFGSGTVGTGCGLEIDKWIQPGDEIELFVEGIGTLKNKIGSKNGKF"
  
FT   CDS                1876..2856
FT                      /label=cds5
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MSFHGRAKMMKSMKVIKVAFTILLMSASFAQDFGQRVDGDIPNAMDEVEGGNSPYIQGSDERPMDKVEKGKTSAMVPGESDYGTKQSEGKDATQFNIGAPFSGTESDQYITYTNKDILKGLSKKSKSSFSLKFFQNNFDYTDNRGVYDRTFGGDSGAKGGSIHLSRDKFLYKGFINIGYGGGAGVGYSTGKGIFSDDGTVSNTRFNLYSLPLDLRLVLELPIGEVIKLSAAGGPSAMGLIQNRSDRDDGDKDKEKKQVGFGYFAEGKFKLNLGHLFTDTGFEFYRDHEVSFMSLDLAVRMQNYSGFGDDIEISGMSYGVGFTFEFL"
  
FT   CDS                1167..1925
FT                      /label=cds6
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MIDQPKRLAFFLPNTFTALNMACGFASIIMAWKGQFYNASMILLLGAIFDSVDGRVARMTGTQSQFGEQFDSISDVVSFGMAPAFLVYNCFFKDLGRLGMVVSFLYLLCGALRLARFNANIDKVSSDYFQGLPIPTAALGLVGYVLLAIEFHLIKTLTPFTIFYVVLYSLLMISNIPFYSFKNATWVKTHKKRVLAIIFLLLALIFTYEQLMIGVITGAYVLGGLVYFITHKGALEDVFSWKSENDEINESN"
  
FT   CDS                complement(5342..5974)
FT                      /label=cds7
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MKTFETNGEFKDNYKFLIGSILPRPIAVVSTINENGTNNVAPFSFFTAVSAKPMIIAFSPMIKSSTGEMKDTPRNIFREKEFVVNFVSEDIIDQINTTSVELPYGEDEFKLAGLTPIDSDMVKAKRILESKIHFECIYRDHLSYGDQPGCGQIITGEVVKVHVNEELLEEGRIITENFKPVGRGAGNDWILCDHLIQRERLMKAQIQK"
  
FT   CDS                548..1165
FT                      /label=cds8
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MGLTYLPKWIYSCITFVALLLMLIIGVWGFLFAALVYGILFAIFRKQKEDFRKDSNENVIVSPVNGRVYKIEKNVDHEFFGKDMTSVLIQVPFWKEFGLFFPVKSEIHDVQASFT   CDS             CLDHLVKFRLVNGMDIGLAVGQNILRLAPQIMVLPGDRGKQKVNFGFLPMGGEVRVFIPSALEVLINEKDEVVAGQGILAGIPTDIEEK"
  
FT   CDS                9317..9739
FT                      /label=cds9
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MTSKYYYGQFTEEHLKLLKTGISLYNEEKFWECHEEVEDLWLADYGDDARYVYWVVIQVATSLYHYLDDNLNGAEGMIRKAKRKLEICEKKNVETELLYKYLSWEKFKKIIRKIPEKSKIEDYNELYSFKFKNPNHWDKL"
  
FT   CDS                112..516
FT                      /label=cds10
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MRISEGMAQVLEWQDIPIYSFYHFSVPFILGIERGAWVSKAFKGEIFLYEWRGEKVEKSLHSEKDLSSLQEKLSPELGEFWTHFDGVIDQISRSSAQLIKEKPEEVFSYVAESQLREKPFYYRSLENEFHVSNK"
  
FT   CDS                2852..3613
FT                      /label=cds11
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="LSFYKIILRYKGTQYQGWQKQPHTSQTIQGQLEKALKKISKSDEIHTIGSGRTDSGVHALGQVVRVQIPLELEPLSLLKALNSHLPNDIECIHSENSSELFNPVFDAKDKTYKYLFSLNGRRNALVDDSMTCLDRPMDIEKMREACELFIGEHDFADFYTVGTDISSTVRVIYDCKLHLEKQQGFLGEVYPEHYIFEVKGSGFLKQMVRLMVGTLWNIGLGKVELADLKMALNSPSGAKLAAVAPSNGLYLCEVNY"
  
FT   CDS                5607..5930
FT                      /label=cds12
FT                      /codon_start=1
FT                      /transl_table=11
FT                      /translation="MSESIGVSPANLNSSSPYGSSTEVVLIWSIISSLTKFTTNSFSLKIFLGVSFISPVELLIIGEKAIIIGFALTAVKNEKGATLFVPFSLIVETTAIGLGRIDPIRNL"

Vous pouvez le télécharger ici :

resultat.embl

Claire Simon, Vincent Zoonekynd
latest modification on Mon Mar 1 11:09:32 CET 2004