Nous récupérons la séquence de Bacteriovorax Marinus (bactérie Gram négative parasite d'autres bactéries) sur
ftp://ftp.sanger.ac.uk/pub/pathogens/bm/BM.dbs
et nous découpons le morceau qui nous échoit, des bases 10000 à 19999.
10000bases
Nous recherchons des cadres de lecture ouverts d'au moins 300 paires de bases, en spécifiant "code génétique bactérien" (ce qui ne change rien dans notre cas).
orf_2_300pb.html orfig.cgi_1.html (cadres de lecture ouverts d'au moins 100 paires de bases)
Nous obtenons les 12 ORFs suivants :
Frame Position Taille +1 3739..5019 1281 -3 8073..9212 1140 -3 5988..7076 1089 -2 7063..8076 1014 +1 1876..2856 981 +3 1167..1925 759 -1 5342..5974 633 +2 548..1165 618 +2 9317..9739 423 +1 112..516 405 +2 3230..3613 384 +3 5607..5930 324
En fait, les positions ne décrivent pas réellement les ORFs puisque ORF Finder repère les portions qui vont d'un codon ATG à un codon STOP.
Afin de vérifier la présence de ces ORFs, nous avons effectué des Blastx sur la séquence entière puis sur les morceaux de 3kb de cette séquence.
Ainsi nous avons retrouvé des homologies (plus ou moins fortes) avec des protéines connues. Par ce procédé, de petits CDS, inférieurs à 300pb, peuvent être repérés alors qu'ils ne l'ont pas été par ORF Finder. De plus cela nous permet aussi d'éliminer les pseudogènes.
Blast.cgi_1_tout.html
Blast.cgi_2_1-3000.html
Blast.cgi_1-1200.html blast_1700_2800.htm blast_1700-3800.htm blast_5000-6000.html
Blast.cgi_9000-10000.html
Résultats :
ORF1 +1 3739..5019 1281 Blast 3739-4959 +1 ORF2 -3 8073..9212 1140 Blast 8112-9176 -3 ORF3 -3 5988..7076 1089 Blast 5994-7055 -3 ORF4 -2 7063..8076 1014 Blast 7087-7914 -2 ORF5 +1 1876..2856 981 RIEN ORF6 +3 1167..1925 759 Blast 1182-1718 +3 ORF7 -1 5342..5974 633 Blast 5402-5938 -1 ORF8 +2 548..1165 618 Blast 599-1144 +2 E=4e-4 ORF9 +2 9317..9739 423 Blast 9368-9580 +2 ORF10 +1 112..516 405 Blast 25-324 +1 E=1e-3 ORF11 +2 3230..3613 384 Blast 2852-3610 +2 ORF12 +3 5607..5930 324 Blast 5402-5938 -1 Rien
Lorsque l'on a repéré un ORF par ORF Finder et que l'on retrouve une homologie par Blastx sur cette même portion, on est quasiment sûr que cette portion correspond à un CDS.
Dans notre cas,9 des 12 ORFs ont des similitudes avec des séquences connues, les ORFs 5, 10 et 12 n'en ont pas.
Pour transformer les ORFs en CDS, nous cherchons la présence d'un codon start (XTG), à l'aide des résultats des Blast précédents. Si plusieurs séquences des bases de données s'aligent avec notre ORF et ont leur codon start au même endroit, on regarde si l'ORF a aussi un codon start à cet endroit.
Sinon, on cherche un codon XTG dans le cadre de lecture, éventuellement en amont de celui proposé par ORF Finder.
ORF1 +1 3739..5019 1281 Blast 3739-4959 +1
Les 2 des 3 meilleurs Blasts commencent en 3739. Le dernier commence un codon plus tôt. Sur notre séquence, ce codon est bien : ATG.
ORF2 -3 8073..9212 1140 Blast 8112-9176 -3
Position du codon start suggérée par les trois meilleurs résultats du blast :
Requête 9176 9182 9185 Sujet 11 9 7 Start 9206 9206 9203
On a bien ATG (ou plutôt CAT, car on est dans le sens inverse).
ORF3 -3 5988..7076 1089 Blast 5994-7055 -3
Position du codon start suggérée par les trois meilleurs résultats du blast :
Requête 7055 7055 7055 Sujet 17 12 12 Start 7103 7088 7088
On n'a pas de codon start en 7088
>>> s[7085:7088] 'CTA'
A partir de la position donnée par l'ordinateur :
CAT TCT TTG ATC *
Donc le codon start CAT est bien en 7073-7076.
ORF4 -2 7063..8076 1014 Blast 7087-7914 -2
Position du codon start suggérée par les trois meilleurs résultats du blast :
Requête 7818 7914 7761 sujet 79 34 90 start 8052 8013 8028
Aucune majorité ne se dégage. On n'a pas de codon start en 8052, 8013 ou 8028.
>>> s[8010:8016] 'ATCAAG' >>> s[8025:8031] 'TCTTGT' >>> s[8049:8055] 'GTTATT'
Il n'y a pas de codon star avant. On garde donc la position du codon ATG donnée par ORF Finder.
ORF5 +1 1876..2856 981
Il n'y avait pas de résultat de Blast, et il n'y a pas de codon start alternatif en amont de celui proposé par ORFinder.
ORF6 +3 1167..1925 759 Blast 1182-1718 +3 Requête 1142 1182 1182 Sujet 18 47 44
On garde la suggestion d'ORF Finder.
ORF7 -1 5342..5974 633 Blast 5402-5938 -1 Requête 5938 5938 5932 Sujet 12 12 14 Start 5971 5971 5971
On a bien un codon start CAT en 5971-5974 :
>>> s[5968:5974] 'CGTCAT'
ORF8 +2 548..1165 618 Blast 599-1144 +2 E=4e-4 Requête 599 584 596 Sujet 44 22 22
On garde la proposition d'ORF Finder.
ORF9 +2 9317..9739 423 Blast 9368-9580 +2 Requête 9368 9362 9380 Sujet 28 11 17 Start 9341 9352 9364
On garde la proposition d'ORF Finder.
ORF10 +1 112..516 405 Blast 25-324 +1
On garde la proposition d'ORF Finder.
ORF11 +2 3230..3613 384 Blast 2852-3610 +2 Requpête 2852 2852 2852 Sujet 10 4 4 Start 2825 2843 2843
On a bien un codon start TTG en 2843-2845 :
>>> s[2842:2845] 'TTG'
ORF12 +3 5607..5930 324
On garde la proposition d'ORF Finder.
On vérifie la pertinence des ORF trouvés à l'aide de plusieurs Blastp. Voici juste le premier :
Blastp_swissprot.html
Nous utilisons WWW Signal Scan :
http://bimas.dcrt.nih.gov/molbio/signal
avec la base de données TDF (et pas Transfac puisqu'il s'agit d'une base de données pour les eucaryotes).
On cherche dans la chaine a[3340:3840] (ici, nous avons utilisé Python, "a" représente toute la séquence, le premier caractère a pour indice 0 : ici, on est autour du codon start du premier CDS, 400 bases en amont, 100 bases en aval).
Input sequence contained 500 base pairs Signal File(s): prok Factor or Site Name Loc.(Str.) Signal Sequence SITE # 30S_rRNA.IF3 site 167 (+) AGGT S01172 30S_rRNA.IF3 site 351 (-) AGGT S01172 input.seq: 500 base pairs sigma-70 fact 359 (-) TATAAT S00129
Sur a[9000:9500] :
30S_rRNA.IF3 site 423 (+) AGGT S01172 30S_rRNA.IF3 site 432 (-) AGGT S01172 30S_rRNA.IF3 site 497 (-) AGGT S01172 input.seq: 500 base pairs sigma-70 fact 305 (+) TATAAT S00129 sigma-70 fact 389 (+) TATAAT S00129
Sur a[7000:7500] :
30S_rRNA.IF3 site 138 (-) AGGT S01172 30S_rRNA.IF3 site 210 (+) AGGT S01172 30S_rRNA.IF3 site 325 (+) AGGT S01172 30S_rRNA.IF3 site 405 (+) AGGT S01172 input.seq: 500 base pairs nitrogen_regula site 399 (+) TTTTGCA S01161
Sur a[7950:8500] :
30S_rRNA.IF3 site 132 (+) AGGT S01172 30S_rRNA.IF3 site 159 (+) AGGT S01172 30S_rRNA.IF3 site 270 (-) AGGT S01172 30S_rRNA.IF3 site 49 (-) AGGT S01172 30S_rRNA.IF3 site 505 (-) AGGT S01172 30S_rRNA.IF3 site 88 (-) AGGT S01172 30S_rRNA.IF3 site 98 (+) AGGT S01172 input.seq: 550 base pairs sigma-70 fact 150 (-) TATAAT S00129 sigma-70 fact 396 (-) TATAAT S00129
Sur a[1400:2000] :
30S_rRNA.IF3 site 112 (+) AGGT S01172 30S_rRNA.IF3 site 156 (+) AGGT S01172 30S_rRNA.IF3 site 183 (+) AGGT S01172 30S_rRNA.IF3 site 405 (+) AGGT S01172 30S_rRNA.IF3 site 432 (+) AGGT S01172 input.seq: 600 base pairs sigma-70 fact 28 (+) TATAAT S00129
Sur a[750:1300] :
30S_rRNA.IF3 site 250 (+) AGGT S01172 30S_rRNA.IF3 site 385 (+) AGGT S01172 30S_rRNA.IF3 site 435 (+) AGGT S01172 30S_rRNA.IF3 site 452 (-) AGGT S01172 input.seq: 550 base pairs malT fact 315 (-) GGAKGA S01107 sigma-70 fact 497 (+) TATAAT S00129 sigma-70 fact 525 (+) TATAAT S00129
(un peu trop loin)
Sur a[5600:6100]
30S_rRNA.IF3 site 294 (+) AGGT S01172 30S_rRNA.IF3 site 456 (-) AGGT S01172 input.seq: 500 base pairs sigma-70 fact 201 (+) TATAAT S00129
Sur a[50:650]
30S_rRNA.IF3 site 22 (+) AGGT S01172 30S_rRNA.IF3 site 225 (+) AGGT S01172 30S_rRNA.IF3 site 255 (-) AGGT S01172 30S_rRNA.IF3 site 375 (+) AGGT S01172 30S_rRNA.IF3 site 40 (+) AGGT S01172 30S_rRNA.IF3 site 511 (-) AGGT S01172 input.seq: 600 base pairs lambda.c site 573 (+) GGYGTRYG S01204 XylR fact 324 (+) TTGANCAAATC S01780
etc.
(Ce serait la même procédure pour les autres CDS.)
Une majorité de nos CDS semblent être des gènes, car on retrouve une "TATA box" (sigma-70). C'est normal, car chez les bactéries, la majorité de l'ADN est codant.
L'un d'entre eux présente un promoteur lié au métabolisme de l'azote.
http://www.toulouse.inra.fr/FrameD.html
Voici le résultat pour notre séquence :
FrameD.html
http://www.inra.fr/bia/T/EuGene/
C'est un éditeur d'annotations.
http://www.sanger.ac.uk/Software/Artemis/
Nos résultats semblent corrects puisque les CDS ne se chevauchent pas (sauf le CDS 12 qui recouvre une partie du CDS 7 : il serait donc superflu). De plus l'ensemble des CDS couvre pratiquement toute la séquence (sauf une petite portion entre les CDS 1 et 7 : un CDS semble n'avoir pas été repéré dans le cadre de lecture -2)
Cadre de CDS Stop ATG(ORF) XTG(ORF) XTG(Blastx) XTG(blastp) Type lecture Fonction inférée (blast) Promoteur 1 5019 3739 idem 1 +1 isomérase TATA box 2 8073 9212 idem 1 -3 aminotransferase TATA box 3 5988 7076 idem 1 -3 dioxygénase Métabolisme de l'azote 4 7063 8076 idem 1 -2 isomérase TATA box 5 2856 1876 1948 2 +1 TATA box 6 1925 1167 idem 1 +3 phosphatidyl transférase TATA box 7 5342 5974 idem 1 -1 flavine-réductase-like/mono-oxygénase/protéine TATA box 8 1165 548 idem 1 +2 rien (E=1e-3) TATA box 9 9739 9317 idem 1 +2 protéine 10 516 112 2 +1 11 3613 2936 idem 1 +2 pseudo-uridine-synthase 12 5930 5607 2 +3
où le type est :
1: ORF + Blast 2: ORF 3: Blast
On trouve trois motifs : Trigger_N, Trigger_C et FKBP_C. On rejette le dernier, car il est spécifique aux vertébré.
Pfam1.htm Pfam1Trigger_N.htm Pfam1Trigger_C.htm Pfam1_FKBP_C.htm
On recherche un peptide-signal chez notre bactérie (c'est une Gram -), mais on n'en trouve pas.
< Is the sequence a signal peptide? # Measure Position Value Cutoff Conclusion max. C 27 0.222 0.49 NO max. Y 370 0.140 0.36 NO max. S 44 0.594 0.88 NO mean S 1-369 0.066 0.54 NO
signalP_1.html SignalP_doc.html
Recherche de domaines transmembranaires (vu la nature de la protéine, il ne devrait pas y en avoir).
TMpred_1.html
Nous traitons juste la suivante : PFAM trouve un domaine Aminotran.
Pfam2.htm Pfam2Aminotran_1_2.htm
Pas de peptide-signal :
< Is the sequence a signal peptide? # Measure Position Value Cutoff Conclusion max. C 204 0.423 0.49 NO max. Y 243 0.162 0.36 NO max. S 130 0.570 0.88 NO mean S 1-242 0.115 0.54 NO
signalP_2.html
Pas de domaine transmembranaire :
TMpred_2.html
Nous avons aussi regardé STRING, utile pour des protéines de fonction similaire.
http://dag.embl-heidelberg.de/newstring_cgi/show_input_page.pl
>cds1_3739-5019 MSYTVETINDCTKKLVFNFETLDLTAEIKTAIIQKQKTTSLKGFRKGKAPLSMVEQVYGP QIQSEALNQFVQNQFFDAVQKEELRICGYPTFENMNYEEGKSVKFDALVEIFPTVEVKNL DKITVAKETVSVSDEDVAAMEKNYLGSRAEMKEVEGDVKLEKGHFAVLNFQGEKEDGERP ENMKGEEFLLEIGSGQFIPGFEDGMIGMKKGEKKNIELTFPGDYHVEDLKEAKVTFETEL LEIKQKIFPDFTDELAKEFGFESVEDFKTKTKDNLFKQKEREVAEKMHQEILEKLIEANT FDVPASLVSQQEASLREDLSRNLKGQGFNDEMLKEYFEKWSGDMTDKATFQVRSGLILDN LAKKFNVEASDSDFDAKIEEMAAGSGMQADQIKSYYASDAKLKGNLMYAIREEKTFEKIK EEIKLK >cds2_8073-9212 MEKLARTLVPEYLKDLKVYQAGKPIDEVAREKGLTKISKLASNENPLGPSPYAIKEMTGG LWDLHRYPDMHAFQLKKSLCGLYSLEPGNIILGNGSEGIMAYIARAFLQPGDEVLTCENT FIGFYILARSVGANLKKVPLTSDYRFDVEALAKSITSKTKAIYIANPNNPTGTYITKKEF DYLMEYVPDHVIVLLDEAYFEFAKDCDDYPDSMDYRYDNVITLRTFSKAYGLSGIRVGYG FAHDELISNLSKVKLPFEPNLIGQLGAKGALNDTPHLSRTLKNNKKRYNETFDFLTKHDF NPIKSITNFITYKTGSLEASEWMFENLLNEGVIIRPLKANEMPEYVRVSLGNKEEMQHYF EAMVKILPKYNDLFGRPTK >cds3_5988-7076 MESFKSSGTFSKQAHVKIPEGLYEEEHGRKGFFGRVSQIYHQNPPVNWTNIEGDLK PRCQKPMFGDHLKANYFQPVLFNNDVTINIARYTESFECFFRNADFDELYFIHQGEGRFE TIYGHLSYKKGDYITIPRGTTYKLFIDNETKIFKIESQSEFEQPDRGMLGPNALYDQTVI ETPECAIGSEQDLEEYKVEVKRLGNITTITYPFNPLDAKGWKGSVYPSKLSIYDICPVMS HRYHIPPSGHTTFVCRNFVVCSFVERPLEDSKHGVLRVPFYHSNIDYDEVLFYHQGDFFS RDNIDAGALTFHPQGIHHGPHPKAFNSVDEKTHTDEFAVMVDTRFPLAPTTWFVENEVKD YWKSWM >cds4_7063-8076 MKICHYRNNLVPGGSTRLGILDENEGIIIDPNFVWACDYEREGKYNPYERANRTLPSSLF SVLNLCDDPLDSLQDSYGLFQFLKLVGDLKTRNGTPTFYKLDDESISLTKPLDKIATYRD FYAHEKHVAKGFEKRNEPIPEAWYEIPAYYKGSTHGFIGPEEEVLWPGYTNILDYELELG MVVGKEGINIKEEDALKHIFGFTILNDISARDIQKKEMAIRLGPAKGKDFCSIIGPVITT IDEFDGIEPDLLMTAKINGEEWSRGQSGDSHFSFAQMITHVSQDEWVLPGDLFGSGTVGT GCGLEIDKWIQPGDEIELFVEGIGTLKNKIGSKNGKF >cds6_1167-1925 MIDQPKRLAFFLPNTFTALNMACGFASIIMAWKGQFYNASMILLLGAIFDSVDGRVARMT GTQSQFGEQFDSISDVVSFGMAPAFLVYNCFFKDLGRLGMVVSFLYLLCGALRLARFNAN IDKVSSDYFQGLPIPTAALGLVGYVLLAIEFHLIKTLTPFTIFYVVLYSLLMISNIPFYS FKNATWVKTHKKRVLAIIFLLLALIFTYEQLMIGVITGAYVLGGLVYFITHKGALEDVFS WKSENDEINESN >cds7_5342-5974 MKTFETNGEFKDNYKFLIGSILPRPIAVVSTINENGTNNVAPFSFFTAVSAKPMIIAFS PMIKSSTGEMKDTPRNIFREKEFVVNFVSEDIIDQINTTSVELPYGEDEFKLAGLTPIDS DMVKAKRILESKIHFECIYRDHLSYGDQPGCGQIITGEVVKVHVNEELLEEGRIITENFK PVGRGAGNDWILCDHLIQRERLMKAQIQK >cds8_548-1165 MGLTYLPKWIYSCITFVALLLMLIIGVWGFLFAALVYGILFAIFRKQKEDFRKDSNENVI VSPVNGRVYKIEKNVDHEFFGKDMTSVLIQVPFWKEFGLFFPVKSEIHDVQASCDSCLDH LVKFRLVNGMDIGLAVGQNILRLAPQIMVLPGDRGKQKVNFGFLPMGGEVRVFIPSALEV LINEKDEVVAGQGILAGIPTDIEEK >cds9_9317-9739 MTSKYYYGQFTEEHLKLLKTGISLYNEEKFWECHEEVEDLWLADYGDDARYVYWVVIQVA TSLYHYLDDNLNGAEGMIRKAKRKLEICEKKNVETELLYKYLSWEKFKKIIRKIPEKSKI EDYNELYSFKFKNPNHWDKL >cds11_3230-3613 LSFYKIILRYKGTQYQGWQKQPHTSQTIQGQLEKALKKISKSDEIHTIGSGRTDSGVHAL GQVVRVQIPLELEPLSLLKALNSHLPNDIECIHSENSSELFNPVFDAKDKTYKYLFSLNG RRNALVDDSMTCLDRPMDIEKMREACELFIGEHDFADFYTVGTDISSTVRVIYDCKLHLE KQQGFLGEVYPEHYIFEVKGSGFLKQMVRLMVGTLWNIGLGKVELADLKMALNSPSGAKL AAVAPSNGLYLCEVNY
Vous pouvez le télécharger ici :
resultat.fasta
FT CDS 3739..5019 FT /label=cds1 FT /codon_start=1 FT /transl_table=11 FT /translation="MSYTVETINDCTKKLVFNFETLDLTAEIKTAIIQKQKTTSLKGFRKGKAPLSMVEQVYGPQIQSEALNQFVQNQFFDAVQKEELRICGYPTFENMNYEEGKSVKFDALVEIFPTVEVKNLDKITVAKETVSVSDEDVAAMEKNYLGSRAEMKEVEGDVKLEKGHFAVLNFQGEKEDGERPENMKGEEFLLEIGSGQFIPGFEDGMIGMKKGEKKNIELTFPGDYHVEDLKEAKVTFETELLEIKQKIFPDFTDELAKEFGFESVEDFKTKTKDNLFKQKEREVAEKMHQEILEKLIEANTFDVPASLVSQQEASLREDLSRNLKGQGFNDEMLKEYFEKWSGDMTDKATFQVRSGLILDNLAKKFNVEASDSDFDAKIEEMAAGSGMQADQIKSYYASDAKLKGNLMYAIREEKTFEKIKEEIKLK" FT CDS complement(8073..9212) FT /label=cds2 FT /codon_start=1 FT /transl_table=11 FT /translation="MEKLARTLVPEYLKDLKVYQAGKPIDEVAREKGLTKISKLASNENPLGPSPYAIKEMTGGLWDLHRYPDMHAFQLKKSLCGLYSLEPGNIILGNGSEGIMAYIARAFLQPGDEVLTCENTFIGFYILARSVGANLKKVPLTSDYRFDVEALAKSITSKTKAIYIANPNNPTGTYITKKEFDYLMEYVPDHVIVLLDEAYFEFAKDCDDYPDSMDYRYDNVITLRTFSKAYGLSGIRVGYGFAHDELISNLSKVKLPFEPNLIGQLGAKGALNDTPHLSRTLKNNKKRYNETFDFLTKHDFNPIKSITNFITYKTGSLEASEWMFENLLNEGVIIRPLKANEMPEYVRVSLGNKEEMQHYFEAMVKILPKYNDLFGRPTK" FT CDS complement(5988..7076) FT /label=cds3 FT /codon_start=1 FT /transl_table=11 FT /translation="MESFKSSGTFSKQAHVKIPEGLYEEEHGRKGFFGRVSQIYHQNPPVNWTNIEGDLKPRCQKPMFGDHLKANYFQPVLFNNDVTINIARYTESFECFFRNADFDELYFIHQGEGRFETIYGHLSYKKGDYITIPRGTTYKLFIDNETKIFKIESQSEFEQPDRGMLGPNALYDQTVIETPECAIGSEQDLEEYKVEVKRLGNITTITYPFNPLDAKGWKGSVYPSKLSIYDICPVMSHRYHIPPSGHTTFVCRNFVVCSFVERPLEDSKHGVLRVPFYHSNIDYDEVLFYHQGDFFSRDNIDAGALTFHPQGIHHGPHPKAFNSVDEKTHTDEFAVMVDTRFPLAPTTWFVENEVKDYWKSWM" FT CDS complement(7063..8076) FT /label=cds4 FT /codon_start=1 FT /transl_table=11 FT /translation="MKICHYRNNLVPGGSTRLGILDENEGIIIDPNFVWACDYEREGKYNPYERANRTLPSSLFSVLNLCDDPLDSLQDSYGLFQFLKLVGDLKTRNGTPTFYKLDDESISLTKPLDKIATYRDFYAHEKHVAKGFEKRNEPIPEAWYEIPAYYKGSTHGFIGPEEEVLWPGYTNILDYELELGMVVGKEGINIKEEDALKHIFGFTILNDISARDIQKKEMAIRLGPAKGKDFCSIIGPVITTIDEFDGIEPDLLMTAKINGEEWSRGQSGDSHFSFAQMITHVSQDEWVLPGDLFGSGTVGTGCGLEIDKWIQPGDEIELFVEGIGTLKNKIGSKNGKF" FT CDS 1876..2856 FT /label=cds5 FT /codon_start=1 FT /transl_table=11 FT /translation="MSFHGRAKMMKSMKVIKVAFTILLMSASFAQDFGQRVDGDIPNAMDEVEGGNSPYIQGSDERPMDKVEKGKTSAMVPGESDYGTKQSEGKDATQFNIGAPFSGTESDQYITYTNKDILKGLSKKSKSSFSLKFFQNNFDYTDNRGVYDRTFGGDSGAKGGSIHLSRDKFLYKGFINIGYGGGAGVGYSTGKGIFSDDGTVSNTRFNLYSLPLDLRLVLELPIGEVIKLSAAGGPSAMGLIQNRSDRDDGDKDKEKKQVGFGYFAEGKFKLNLGHLFTDTGFEFYRDHEVSFMSLDLAVRMQNYSGFGDDIEISGMSYGVGFTFEFL" FT CDS 1167..1925 FT /label=cds6 FT /codon_start=1 FT /transl_table=11 FT /translation="MIDQPKRLAFFLPNTFTALNMACGFASIIMAWKGQFYNASMILLLGAIFDSVDGRVARMTGTQSQFGEQFDSISDVVSFGMAPAFLVYNCFFKDLGRLGMVVSFLYLLCGALRLARFNANIDKVSSDYFQGLPIPTAALGLVGYVLLAIEFHLIKTLTPFTIFYVVLYSLLMISNIPFYSFKNATWVKTHKKRVLAIIFLLLALIFTYEQLMIGVITGAYVLGGLVYFITHKGALEDVFSWKSENDEINESN" FT CDS complement(5342..5974) FT /label=cds7 FT /codon_start=1 FT /transl_table=11 FT /translation="MKTFETNGEFKDNYKFLIGSILPRPIAVVSTINENGTNNVAPFSFFTAVSAKPMIIAFSPMIKSSTGEMKDTPRNIFREKEFVVNFVSEDIIDQINTTSVELPYGEDEFKLAGLTPIDSDMVKAKRILESKIHFECIYRDHLSYGDQPGCGQIITGEVVKVHVNEELLEEGRIITENFKPVGRGAGNDWILCDHLIQRERLMKAQIQK" FT CDS 548..1165 FT /label=cds8 FT /codon_start=1 FT /transl_table=11 FT /translation="MGLTYLPKWIYSCITFVALLLMLIIGVWGFLFAALVYGILFAIFRKQKEDFRKDSNENVIVSPVNGRVYKIEKNVDHEFFGKDMTSVLIQVPFWKEFGLFFPVKSEIHDVQASFT CDS CLDHLVKFRLVNGMDIGLAVGQNILRLAPQIMVLPGDRGKQKVNFGFLPMGGEVRVFIPSALEVLINEKDEVVAGQGILAGIPTDIEEK" FT CDS 9317..9739 FT /label=cds9 FT /codon_start=1 FT /transl_table=11 FT /translation="MTSKYYYGQFTEEHLKLLKTGISLYNEEKFWECHEEVEDLWLADYGDDARYVYWVVIQVATSLYHYLDDNLNGAEGMIRKAKRKLEICEKKNVETELLYKYLSWEKFKKIIRKIPEKSKIEDYNELYSFKFKNPNHWDKL" FT CDS 112..516 FT /label=cds10 FT /codon_start=1 FT /transl_table=11 FT /translation="MRISEGMAQVLEWQDIPIYSFYHFSVPFILGIERGAWVSKAFKGEIFLYEWRGEKVEKSLHSEKDLSSLQEKLSPELGEFWTHFDGVIDQISRSSAQLIKEKPEEVFSYVAESQLREKPFYYRSLENEFHVSNK" FT CDS 2852..3613 FT /label=cds11 FT /codon_start=1 FT /transl_table=11 FT /translation="LSFYKIILRYKGTQYQGWQKQPHTSQTIQGQLEKALKKISKSDEIHTIGSGRTDSGVHALGQVVRVQIPLELEPLSLLKALNSHLPNDIECIHSENSSELFNPVFDAKDKTYKYLFSLNGRRNALVDDSMTCLDRPMDIEKMREACELFIGEHDFADFYTVGTDISSTVRVIYDCKLHLEKQQGFLGEVYPEHYIFEVKGSGFLKQMVRLMVGTLWNIGLGKVELADLKMALNSPSGAKLAAVAPSNGLYLCEVNY" FT CDS 5607..5930 FT /label=cds12 FT /codon_start=1 FT /transl_table=11 FT /translation="MSESIGVSPANLNSSSPYGSSTEVVLIWSIISSLTKFTTNSFSLKIFLGVSFISPVELLIIGEKAIIIGFALTAVKNEKGATLFVPFSLIVETTAIGLGRIDPIRNL"
Vous pouvez le télécharger ici :
resultat.embl
Claire Simon, Vincent Zoonekynd
latest modification on Mon Mar 1 11:09:32 CET 2004