Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
Département Génie Biologique
ANNEE UNIVERSITAIRE 2016/2017
RAPPORT DE STAGEOption : Analyses Biologiques et Biochimiques
Fichant Arnaud
Lieu du stage : Laboratoire de Microbiologie des Environnements ExtrêmesRue Dumont D'Urville29280 Plouzané
Culture, extraction et séquençage d'isolats aérobies etanaérobies thermophiles et hyperthermophiles issus de
la collection UBOCC
Remerciements
Je tiens à remercier tout d'abord ma maître de stage Nadège Quintin pour m’avoir donné l’occasionde réaliser ce stage ainsi que le Dr Loïs Maignien pour m’avoir supervisé et le Pr Mohamed Jebbarde m’avoir accueilli dans le laboratoire.
Je remercie toutes les personnes du laboratoire pou leur aide et pour les 10 semaines passées dansune ambiance agréable.
Je tiens à remercier tout particulièrement Sabrina et Marc qui m’ont aidé et conseillé durant mesmanipulations de biologie moléculaire.
Je remercie enfin Damien qui m’a permis grâce à ses nombreuses interventions de réaliser le travaild’analyses des séquences et de bio-informatique.
Avant-Propos
Le LMEE ou Laboratoire de Microbiologie des Environnements Extrêmes est une unité mixte derecherche affiliée au CNRS (Centre National de Recherche Scientifique), l’IFREMER (Institut deRecherche et d’Exploitation de la MER) ainsi qu’à l’UBO (Université de Bretagne Occidentale). Lelaboratoire est sur deux sites, le site de l’IFREMER et le site de l’IUEM (Institut UniversitaireEuropéen de la Mer) où s’est déroulé mon stage.
Le LMEE a une thématique de recherche orientée vers l’étude des micro-organismes desenvironnements marins où les conditions de températures et de pression sont dites extrêmes. LeLMEE s’oriente plus spécialement sur trois grands axes de recherche :
- L’exploration de la diversité des micro-organismes par l’étude des bactéries, virus et archéesprésents dans les environnements extrêmes tel que les sites hydrothermaux.
- La compréhension de l’interaction entre les différentes communautés microbiennes mais aussientre procaryotes et eucaryotes.
- L’étude de la maintenance du génome chez des micro-organismes thermophiles ethyperthermophiles ayant un intérêt biotechnologique.
Listes des abréviationsBases azotés :
A : Adénosine
C : Cytosine
G : Guanine
T : Thymine
PB : Paire de Bases
ADN : Acide DésoxiriboNucléique
ARN : Acide RiboNucléique
ARNr 16S : Acide RiboNucléique ribosomique constituant la petite sous unité 16S des ribosomes
ADNr 16S : ADN codant pour l'ARNr 16S
Amorce F : amorce « Forward » ou sens
Amorce R : amorce « Reverse » ou anti-sens
BET : Bromure d'éthidium
DMSO : Diméthylsulfoxyde
dNTP : DesoxyriboNucléotide TriPhophate
ddNTP : DidésoxyriboNucléotide TriPhosphate
EDTA : Éthylène Diamine Tétra-Acétique
PCR : Polymérase Chain Reaction
RPM : Rotation Par Minute
SDS : Sodium DodécylSulfate
TAE : Tris Acétate EDTA
UV : Ultra-violet.
Bases de données :
EMBL : European Molecular Biology Laboratory (http://www.embl.org/)
LTP : « The All-Species Living Tree » Project ( https://www.arb-silva.de/projects/living-tree/)
RDP : Ribosomal Database Project
Table des figures
Figure 1: Principe de l'Accès et Partage des Avantages……………………………………………. .1
Figure 2: Schéma de fonctionnement d'une cheminée hydrothermale………………………….........3
Figure 3 : Localisation des zones variables et conservées de l'ARNr 16S………………………… ..4
Figure 4 : Rampe à gaz……………………………………………………………………………….6
Figure 5 : Milieux de culture en fioles et en tubes…………………………………………………...6
Figure 6 : NanoDrop® ND-1000……………………………………………………………………8
Figure 7: Zone dépôt surface inférieur Nanodrop……………………………………………………8
Figure 8 : Cycle de PCR servant à l'amplification de l'ADNr 16S…………………………………10
Figure 9: Schéma d'injection, détection et traitement des produits de séquençage à travers un gelcapillaire…………………………………………………………………………………………….12
Figure 10: (a) Souche VM 41 sur 162 1%, (b) Souche Thermus aquaticus sur 162 0,1%………….14
Figure 11: Migration des Produits PCR "Archéen"…………………………………………………16
Figure 12: Migration des Produits PCR "Bactériens"………………………………………………16
Figure 13: Assemblage de la séquence "Reverse" et "Forward" de la souche GE-03 à l'aide dulogiciel GLC Genomics…………………………………………………………………...……...…17
Figure 14: Conflit entre les séquences F et R de la souche GE-03….……………………………...17
Figure 15: Chromatogrammes de la souches GE-03 (a) séquence F (b) séquence R……………….18
Figure 16: Détermination de la Taxonomie de GE-03 à l'aide de Classifier………………………..18
Figure 17: Arbre Phylogénique composé de 88 séquences ………………………………………...19
Table des Tableaux
Tableau 1: Caractéristiques des amorces pour PCR "Archées"……………………………………..10
Tableau 2: Composition du Mélange réactionnel…………………………………………………...10
Tableau 3: Caractéristiques des amorces pour PCR "Bactéries"……………………………………11
Tableau 4: Résultats des analyses au Nanodrop…………………………………………………….15
Table des matières1. Introduction......................................................................................................................................1
1.1 Protocole de Nagoya.................................................................................................................11.2 La collection de l'UBOCC........................................................................................................21.3 Origine des souches étudiées....................................................................................................21.4 Utilisation de l'ARNr 16S en tant que marqueur taxonomique universel.................................31.5 Objectifs du stage......................................................................................................................4
2. Matériels et méthodes......................................................................................................................4
2.1 Échantillons..............................................................................................................................42.1.1 Conservation.....................................................................................................................42.1.2 L’ordre des Thermococcales.............................................................................................52.1.3 Le genre Thermus.............................................................................................................5
2.2 Culture des échantillons............................................................................................................52.2.1 Milieux de culture.............................................................................................................5
2.2.1.1 Milieux liquides.........................................................................................................52.2.1.2 Milieux solides..........................................................................................................6
2.2.2 Inoculation et suivie de culture.........................................................................................72.2.2.1 Inoculation et suivie : Thermococcales.....................................................................72.2.2.2 Inoculation et suivie : Thermus.................................................................................7
2.3 Techniques de biologie moléculaire..........................................................................................72.3.1 Extraction d'ADN..............................................................................................................72.3.2 Quantification et qualité de l'ADN....................................................................................82.3.3 Amplification par PCR......................................................................................................9
2.3.3.1 PCR classique : Thermococcales.............................................................................102.3.3.2 PCR sur colonie : Thermus......................................................................................11
2.3.4 Gel de contrôle des produits PCR...................................................................................112.3.5 Le séquençage Sanger.....................................................................................................12
2.4 Analyses de séquences............................................................................................................13
3. Résultats et Discussion..................................................................................................................14
3.1 Culture et états frais................................................................................................................143.1.1 Milieux liquides..............................................................................................................143.1.2 Milieux solides................................................................................................................14
3.2 Quantification et qualité de l’ADN.........................................................................................153.3 Gel de contrôle des produits PCR...........................................................................................16
3.3.1 Migration Thermococcales..............................................................................................163.3.2 Migration Thermus..........................................................................................................16
3.4 Analyses de séquence..............................................................................................................17
4. Conclusion......................................................................................................................................20
Bibliographie......................................................................................................................................21
Annexes..............................................................................................................................................22
1. Introduction
1.1 Protocole de Nagoya
Les ressources génétiques représentent aujourd'hui un enjeu important permettant de répondre auxbesoins dans de nombreux domaines. Elles permettent la préservation de la diversité génétique ainsique la caractérisation des ressources pouvant avoir des applications dans divers secteurs (santé,alimentation, matériaux…). Afin d'en améliorer l'accès et de permettre un partage plus juste etéquitable des avantages en découlant, le protocole de Nagoya a été mis en place.
Le protocole de Nagoya est adopté le 29 octobre 2010 et entre en vigueur le 12 octobre 2014. Lesrègles qu'il fixe permettent un contrôle plus important sur l'accès et le partage des avantages (APA)qu'auparavant (Figure 1), afin de répondre à différents objectifs :
- La conservation de la diversité biologique de part sa préservation et la caractérisation desressources génétiques.
- L'utilisation durable de la diversité biologique par des activités de recherche et de développementsur les ressources génétiques.
- Le partage juste et équitable des avantages provenant de cette utilisation. Ces avantages peuventêtre monétaires comme une redevance sur les applications obtenues ou non monétaires comme unecoopération scientifique et un partage des résultats.
Figure 1: Principe de l'Accès et Partage des Avantages
Un accord entre le fournisseur des ressources génétiques et son utilisateur doit être mis en placeavec différentes conditions. Un permis peu ensuite être délivré par l'utilisateur des ressources afinde réaliser des activités de recherche et de développement. Enfin l'utilisateur doit partager lesavantages obtenus de façon monétaire ou non monétaire auprès du fournisseur des ressources.
1
1.2 La collection de l'UBOCC
L'UBOCC ou la Collection de Culture de l'Université de Bretagne Occidentale est une collectioncréée en 2007. Elle est située dans différents locaux des services de l'UBO : à l'ESIAB (ÉcoleSupérieure d'Ingénieur en Agroalimentaire de Bretagne Atlantique) et au sein de l'IUEM. L'UBOCCa pour rôle de préserver et de distribuer les différents micro-organismes qu'elle conserve à sespartenaires ou à des organismes extérieurs après accord. Les souches sont disponibles pour laréalisation de divers travaux de recherche au sein de l'UBO mais aussi à la vente après la signatured'un MTA (Material Transfert Agreement).
Le service l'UBOCC est réparti en 2 collections :
Une collection agro-environnementale : Hébergée dans les locaux de l’ESIAB, elle est issue destravaux de recherche du LUBEM (Laboratoire Universitaire de Biodiversité et ÉcologieMicrobienne). La collection est composée majoritairement de champignons mais aussi de levures etde bactéries. Les isolats servent pour l'enseignement des étudiants de l'ESIAB.
Une collection marine : Hébergée à l'IUEM dans les locaux du LMEE. Les isolats sontprincipalement des bactéries et des archées, aérobies ou anaérobies, allant de la mésophilie àl'hyperthermophilie tous issus des environnements extrêmes. Ces souches sont l’aboutissement de20 ans d’échantillonnage lors de campagnes océanographiques à travers le globe.
Dans le cadre du protocole de Nagoya, l'UBOCC s'engage à donner accès à ces ressourcesgénétiques. Cela nécessite de déterminer des informations précises pour chaque isolat dont sataxonomie.
1.3 Origine des souches étudiées
Les souches marines de la collection de l'UBOCC proviennent de campagnes d'échantillonnagesréalisées par le LMEE près de sites hydrothermaux profonds situés au niveau des dorsalesocéaniques et des zones de subduction. Au niveau de ces sites on trouve une intense activitétectonique et volcanique entraînant la formation de failles au niveau de la croûte océanique. L'eaude mer s'y infiltre et se rapproche de plus en plus de chambre magmatique de plus de 1200°C. Enraison de la montée en température et de la pression, l'eau de mer devient moins dense et remonte àla surface. En remontant elle se charge en éléments chimiques ainsi qu'en métaux dissous par lepassage à travers la roche et jaillit à la surface à une température proche de 400°C. Le contact entrele fluide extrêmement chaud et l'eau de mer glacée (4°C) provoque un refroidissement brutal. Lesmétaux dissous précipitent alors et forment des cheminées hydrothermales (Figure 2).
Ces évents hydrothermaux abritent une communauté microbienne qui repose principalement sur laproduction de composés organiques et de composés réduits par des bactéries chimiosynthétiques(Jannasch et al., 1979 ; Prieur et al., 1995). Les archées hyperthermophiles réducteurs de soufre fontpartie de cet écosystème abritant des espèces de tous les domaines du vivant (Holden et al., 2001).
2
Les prélèvements des souches étudiées pendant mon stage ont été réalisés au niveau de cescheminées hydrothermales appelées aussi fumeurs noirs. Les principales zones de collecte ont étéles dorsales médio-Atlantique et Est Pacifique. Certaines souches proviennent aussi de l'océanIndien. Les prélèvements ont été cultivés à partir de fluide, de sédiments ou encore de morceaux decheminée prélevés à des profondeurs allant de 800 à 3600 m.
1.4 Utilisation de l'ARNr 16S en tant que marqueur taxonomique universel
L'ARNr 16S est présent chez tous les Procaryotes, en effet il code pour la petite sous-unité 16S desribosomes qui sont nécessaires à la synthèse des protéines. Ce gène est composé de régions ditesconservées et d'autres dites variables (Figure 3) :
- Les régions conservées sont des sites actifs, très peu de mutation y sont possible comme ils serventà la synthèse protéique. Ces sites sont aussi utilisés pour la conception d'amorces généralistes.
- Les régions variables sont des sites structurels, ces sites hypervariables de l'ARNr 16S sontsoumis à la pression évolutive et subissent donc de nombreuses mutations. Ce sont ces régions quisont utilisées pour établir la classification taxonomique des microorganismes.
L'ARNr 16S est choisi préférentiellement aux autres gènes composant les ribosomes comme le 5Sou le 23S, pour sa taille. En effet les 1500pb de ce gène permettent de réaliser un séquençageSanger dans les deux sens. De plus ce gène est utilisé depuis des décennies et sert à alimenter lesbases de données qui permettent d’établir la correspondance entre la séquence et sa taxonomie.
3
Figure 2: Schéma de fonctionnement d'une cheminée hydrothermale
1.5 Objectifs du stage
Jusqu'à présent, l'identification des microorganismes de la collection marine de l'UBOCC aprincipalement reposé sur des critères physiologiques et morphologiques. Cependant dans le cadredu protocole de Nagoya, le développement de la collection en base de données publique nécessiteune identification plus précise, et vérifiée par des critères moléculaires. L'identification des plus de3000 souches de la collection par le séquençage de leur 16S devient donc indispensable.
Pour ce stage, l’intérêt s'est porté sur les bactéries du genre Thermus ainsi que sur les Archées del'ordre Thermococcales correspondant à une partie des souches thermophiles et hyperthermophilesde la collection.
2. Matériels et méthodes
2.1 Échantillons
2.1.1 Conservation
Les isolats bactériens et archéens sont conservés à -80°C dans des cryotubes de 2 mL de milieu . Unagent cryoconservation le DMSO (Diméthyl Sulfoxyde) est ajouté à ces 2 mL de culture en phaseexponentielle afin d'éviter la dégradation des cellules lors de la surgélation.
4
Figure 3: Localisation des zones variableset conservées de l'ARNr 16S
2.1.2 L’ordre des Thermococcales
Les Thermococcales font partie du domaine des Archées, l'ordre est constitué de la familleThermococcaceae qui est divisée en trois genres, les Thermococcus, les Pyrococcus et lesPalaeococcus. Au niveau morphologique, ces coccis sont mobiles et font environ 1 μm. Ce sont desmicro-organismes hyperthermophiles, anaérobies stricts qui poussent entre 80 et 90°C. Leurmétabolisme est chimio-organotrophe, en effet ces Archées se développent rapidement sur dessubstrats protéiques ou sucrés en puisant du carbone. Les Thermococcales sont aussi capables deréduire le Soufre élémentaire S° en hydrogène saturé ou sulfure d'hydrogène (H2S) ce qui permet lastimulation de leurs croissance et participe à l'anaérobiose ( Nercessian et al., 2004 ).
2.1.3 Le genre Thermus
Le genre Thermus appartient au domaine des Bactéries. Ces micro-organismes sont des gramnégatifs de forme bacillaire, non mobiles. Elles sont thermophiles et poussent entre 50°C et 80°Cavec un optimum de croissance autour de 70°C. Comme pour les Thermococcales ce sont desorganismes chimio-organotrophes mais aérobies avec l’O2 comme accepteur final d’électrons et quisont aussi anaérobies facultatives avec les nitrates . Leurs sources de carbone sont les acides aminéset les protéines. La première espèce isolée a été Thermus aquaticus qui a donné son nom à la Taqpolymérase qui est largement utilisé dans la biologie moléculaire. Elle a été isolée au niveau d'unesource chaude au parc national de Yellowstone aux États-Unis (Brock., et al 1969).
2.2 Culture des échantillons
2.2.1 Milieux de culture
2.2.1.1 Milieux liquides
La culture en milieux liquides a été privilégiée pour les Thermococcales, en effet les conditionsd'anaérobiose y sont ainsi plus facilement maîtrisées. Deux milieux de culture sont utilisés dans unpremier temps, les milieux Ravot et TRM (Annexes 1 et 2). Le milieu utilisé est le même que celuide la mise en conservation afin de mettre les souches dans de bonnes conditions et ainsi limiter lestress déjà important dû à la congélation.
Ces milieux sont riches en NaCl nécessaire à la croissance de ces microorganismes marins. Lesmatières organiques comme le tryptone ou les extraits de levure servent de source de carbone etsont d'abord ajoutés, sont ensuite apportés tampons, sels et autres éléments indispensables à lacroissance des Thermococcales. La rézasurine sert d'indicateur d’anaérobiose, elle devient rose enprésence d'oxydant à bas potentiel redox comme l’oxygène et incolore lors de conditiond’anaérobiose.
Les milieux après ajustage du pH à 7 pour le milieu Ravot et 6,8 pour le TRM sont transvasés dansune bouteille d'un litre avant d'être stérilisés par un autoclavage à 121°C. Les tampons phosphatessont ajoutés après refroidissement afin de ne pas être dégradés. Les milieux sont répartis ensuitedans des tubes Hungates ou des fioles Pénicilline de 100 mL. Un ajout de soufre élémentairetyndallisé est réalisé à hauteur de 2 mg/mL, servant ainsi d'accepteur final d'électrons pour cesArchées. Les tubes et fioles sont fermés par des septums en caoutchouc stérilisés puis sertis par desbouchons à vis ou des capsules en aluminium (Figure 5).
5
Afin de permettre la culture des Thermococcales les milieux doivent être dépourvus d'oxygène.L'air contenu dans les fioles et les tubes est ainsi remplacé par de l'azote à l'aide d'une rampe à gaz(Figure 4) . Cet appareil permet d'alterner entre une phase gazeuse sous flux d'azote constant et unephase de vide. L'alternance répétée entre ces deux phases permet d'éliminer progressivement l’airprésent dans les milieux afin de les rendre anoxiques. Pour finir, le milieu est réduit par l'ajout deNa2S (Soduim sulfide)à 5 % qui permet d'éliminer toute trace d'oxygène. Le dégazage ainsi que laréduction du milieu se traduisent par un changement de couleur, le milieu passe de rose à incolore.
2.2.1.2 Milieux solides
La culture sur milieux solides est réalisée pour les Bactéries du genre Thermus, étant des bactériesaérobies, la méthode de culture en milieux solides est simple et dépourvue des contraintesqu'imposent les conditions d'anaérobiose. Plusieurs milieux sont ainsi utilisés :
- Le milieu 162 1 % NaCl (Annexe 3) ainsi que ces dérivés sont majoritairement utilisés pour laculture de ces Bactéries marines. Le tryptone et les extraits de levure servent de source de carbonecomme pour les Thermococcales. A ces éléments sont ajoutés la Base A et le Tampon B. La Base Aest une solution constituée d'éléments traces ou rares ainsi que d'éléments ferreux tandis que leTampon B est composé d'éléments phosphatés et joue donc le rôle de tampon phosphate.
- Le 162 0,1 % est dix fois moins concentré en sel que le milieu original à 1 %.
- Le milieu 160 quant à lui est dix fois moins concentré en tampon phosphate que le milieu 162.
- Le milieu Marine Broth 2 % est obtenu à partir d'une poudre déshydratée commerciale, il est richeen NaCl, les extraits de levures et les peptones servent cette fois de source de carbone.
Afin de rendre ces milieux solides, 15g/L d'agar est ajouté dans les bouteilles avant un autoclavageà 121°C. Ces bouteilles sont remplies au demi afin d'éviter un débordement dû à la prise de volumedu milieu lors de sa solidification.
Le coulage des milieux est réalisé sous une hotte à flux laminaire. Après refroidissement du milieuet avant sa solidification, aux alentours de 50-60°C, un volume d'environ 15 mL est délivré danschaque boîte de Pétri. Pour finir, les boîtes sont laissées sous hotte pour permettre leurrefroidissement ainsi que la solidification des milieux.
6
Figure 5: Milieux de culture en fioles et en tubes
Figure 4: Rampe à gaz
Tube Hungate avec bouchon en caoutchouc
Fiole Pénicilline avec capsule en aluminium
2.2.2 Inoculation et suivie de culture
2.2.2.1 Inoculation et suivie : Thermococcales
Pour les Thermococcales, après décongélation lente d'un cryotube sur glace, un inoculum de 100μL est injecté de façon stérile à l'aide d'une seringue et aiguille à usage unique dans un tubeHungate contenant 5 mL de milieu. La culture est par la suite incubée à une température de 85°Cpendant 16 à 24 heures. Un état frais est réalisé afin d'observer la croissance des cellules aumicroscope optique x400 et x1000. La phase exponentielle de croissance des microorganismes peutêtre déterminée par l'aspect, le nombre et la division ou non des cellules. Si la croissance estsuffisante, une inoculation en grand volume est réalisée. Un volume de 500 μL est prélevé à partirdu tube Hungate et est injecté toujours de façon stérile dans une fiole de Pénicilline de 100 mLcontenant 50 mL de milieu. L'incubation est réalisée de la même façon que précédemment et unnouvel état frais est effectué après 16 à 24 heures d'incubation.
2.2.2.2 Inoculation et suivie : Thermus
Pour les Thermus, l’ensemencement est réalisé sous hotte à flux laminaire. Après décongélationlente des cryotubes, un volume de 20 μL est déposé au bord d'une boîte de Pétri à l'aide d'unemicropipette. L'étalement est réalisé selon la méthode des cadrans à l'aide d'une anse en plastiquejetable. Les boîtes sont ensuite empilées par quinze avant d'être mises à incuber à 70 ou 75°C,selon les souches, pendant 16 à 24 heures. Les boîtes sont placées dans un emballage plastique pouréviter le dessèchement. Les cultures sont ensuite observées dans un environnement stérile, leursaspects ainsi que le bon isolement des colonies sont analysés. Les boîtes ou le développement estinsuffisant sont remises à incuber ou relancer.
2.3 Techniques de biologie moléculaire
2.3.1 Extraction d'ADN
L’extraction de l'ADN archéen est réalisée par la méthode Phénol Chloroforme alcool Isoamylique(Annexe 4).
L'extraction est réalisée à partir des fioles Pénicillines contenant un grand volume de culture pourassurer une quantité d'ADN suffisante. Une centrifugation à 1500 rpm est d’abord réalisée afin dedécanter les résidus de souffre, la culture est ensuite transférée dans un autre Falcon 50 mL puis uneseconde centrifugation est réalisée à 7000g afin d'obtenir un culot cellulaire.Une lyse cellulaire est faite en plusieurs étapes afin de séparer l'ADN du reste du contenu cellulaire.Pour cela le culot est repris dans du tampon TNE composé de Tris-HCL, NaCl permettant laconservation de l'ADN mais aussi d' EDTA qui inhibe les DNAses. La lyse chimique est réaliséepar l'ajout à ce tampon de SDS (Sodium Dodécyl Sulfate) ainsi que de N-Lauryl-Sarcosyl, cesdétergents permettent la création de brèches dans la paroi cellulaire ainsi que la dénaturation desacides nucléiques. Par la suite l'ajout de ribonuclésase réalisant la dégradation de l'ARN et de laprotéinase K dégradant les protéines permet d'effectuer la lyse enzymatique des cellules. Lessouches sont ensuite incubées pendant une heure à 55°C afin d'être dans les conditions optimums dela protéinase K.
7
Suite à l'incubation, l’ADN des cellules lysées est extrait par méthode PCI. Ainsi un volume de PCIest ajouté : le phénol entraîne une précipitation des protéines, le chloroforme dissout les lipides etl'alcool isoamylique empêche la formation de mousse. Après l'agitation du mélange on obtient uneémulsion et une centrifugation est réalisée. La phase aqueuse supérieure est ensuite collectée etajoutée à un volume de chloroforme, une nouvelle centrifugation est alors effectuée. La phasesupérieure est une nouvelle fois récupérée et de l'isopropanol est ajouté à la phase aqueuse, cela apour effet de créer un milieu hydroalcoolique de force ionique élevé précipitant l'ADN. Une peloted'ADN est alors observée par retournement du tube.
Enfin, l'échantillon est centrifugé. Après élimination de l’isopropanol, l’ADN est ensuite lavé àl'aide d'une solution d'alcool à 70 %. Pour finir, une dernière centrifugation est effectuée, lesurnageant est éliminé et l'ADN est séché avant d'être solubilisé dans un tampon TE de faible forceionique contenant de l'EDTA.
2.3.2 Quantification et qualité de l'ADN
Les échantillons d'ADN purs sont caractérisés par un spectrophotomètre de sensibilité trèsimportante : Le NanoDrop® ND-1000 (Figure 6).
Le Nanodrop permet ainsi une mesure sur une large gamme de concentration, ne rendant pas lesdilutions nécessaires et à partir d'un faible volume d'échantillon. En effet, un dépôt de 0,5 à 1 μL auniveau de la surface inférieur de l'appareil (Figure 7) permet la détermination de la concentrationen acides nucléiques dans l’échantillon.
La pureté des échantillons peut être déterminée grâce aux ratios obtenus par des mesures auxlongueurs d'ondes 230, 260 et 280 nm. Ensuite le logiciel du Nanodrop calcule ces ratios parrapport aux absorbances mesurées. Le ratios A260/280 permet de mettre en évidence unecontamination par des protéines ou par des réactifs d'extraction tel que le phénol. Le ratio A260/230permet d'observer une éventuelle présence de contaminants co-purifiés comme des sels ou dessolvants ainsi que des éléments organiques. Un solution d’ADN est considérée comme pure lorsqueces ratios sont compris entre 1,8 et 2.
8
Figure 7: Zone dépôt surfaceinférieur Nanodrop
Figure 6: NanoDrop® ND-1000
2.3.3 Amplification par PCR
La PCR (Polymerase Chain Reaction) est une technique d'amplification in vitro utilisée ici pouramplifier le gène codant pour ARNr 16S. La PCR permet de cibler le gène d'ADN codant pourl'ARNr 16S à l'aide d'amorces d'oligonucléotides spécifiques à ce dernier. Ce gène est ensuiterecopié par des cycles répétés afin d'obtenir un nombre important de copie.
Les amorces choisies doivent avoir plusieurs caractéristiques. Tout d'abord les oligonucléotidesdoivent être spécifiques et complémentaires du gène ciblé, ici l'ADNr 16S. Une amorce est dite« Forward » si elle s’insère dans le sens 5'-3' tandis que l'autre est dite « Reverse » et s’insère dansle sens 3'-5’ du brin complémentaire. Les extrémités 3' des deux amorces pointent donc l'une versl'autre. Ensuite les amorces ne doivent pas être complémentaires entre elles afin d'éviter laformation de dimères d'amorces. Enfin les amorces doivent avoir une température de fusion (Tm)assez proche afin de pouvoir réaliser l'hybridation.
Un mélange réactionnel de PCR est préparé, ce dernier contient du Tampon 5X, du MgCl2, desdNTPs en excès ainsi que le couple d'amorces spécifiques. L'enzyme d'ADN polymérase appeléeTaq polymérase est ajoutée en dernier du fait de sa sensibilité à la température.
Le mélange réactionnel de PCR est transféré dans des barrettes de tubes de PCR de 200 μL. Unvolume de 24 μL ou 25 μL est déposé dans chaque tubes en fonction du type de PCR réalisée.L'ADN est ensuite ajouté au mélange et les barrettes sont placées dans un thermocycleur où lesdifférentes étapes de la PCR sont effectuées.
Dénaturation initiale : Cette étape permet de faire passer l'ADN double brin en ADN simple brin,en effet une forte température est appliquée ce qui permet de casser les liaisons maintenant laformation double brin.
Cycle de PCR : Il s'agit d'une répétition de plusieurs étapes permettant l'amplification en grandnombre de l'ADNr 16S.
-Dénaturation : Comme l'étape initiale, cette dénaturation permet la séparation de l'ADN doublebrin. Elle est essentielle afin que les amorces puissent se fixer sur chaque brin par la suite.
-Hybridation : Cette étape correspond à la fixation des amorces sur les brins d'ADN, pour cela unetempérature d'hybridation (Th) légèrement inférieure à celle de la température de fusion (Tm) desamorces est appliquée. Cette température est adaptée en fonction du couple d'oligonucléotideschoisis.
-Élongation : La GoTaq polymérase se fixe au niveau des amorces dans le sens 5'-3' et complète lebrin avec les nucléotides complémentaires présents en excès dans le mélange. Cette étape estréalisée à 72°C qui est la température optimum de l'enzyme.
Le cycle est répété 25 fois, chaque nouveau double brin formé sert de matrice au suivant, laformation est exponentielle. Cela permet d'obtenir un nombre très important de copies du gènecodant pour l'ARN 16S qui a été choisi spécifiquement.
Élongation finale : A la fin du cycle de PCR, l'élongation est poursuivie afin d'être sûr de réaliserl'amplification de tous les amplicons formés.
9
2.3.3.1 PCR classique : Thermococcales
Les amorces choisies pour l'amplification de Thermococcales sont soit spécifiques aux Archées ousoit Universelles. Ces amorces ont été choisies pour permettre l’amplification du gène codant pourl'ARNr 16S, l'amorce Arc 8 « Forward » ( Teske et al., 2002) se fixe au niveau de la base 8 du gèneet l'amorce universelle 1492 « Reverse » ( Khemariya et al., 2013) au niveau de la base 1492(Tableau 1).
Les différents réactifs du mélange réactionnel sont ajoutés selon les proportions du Tableau 2 :
Pour cette PCR , une addition de 1 μL d’ADN extrait à 24 μL de mix est effectuée.
Les étapes de la PCR sont réalisées comme indiqué dans la Figure 8:
10
Figure 8: Cycle de PCR servant à l'amplification de l'ADNr 16S
Tableau 2: Composition du Mélange réactionnel
R é a c t i f s C o n c e n t r a t io n in i t ia le C o n c e n t r a t io n f in a leT a m p o n 5 X 1 X 5M g C l2 2 5 m M 1 ,5 m M 1 ,5d N T P s 0 ,6 2 5
A m o r c e F o r w a r d 0 ,5A m o r c e R e v e r s e 0 ,5
G o T a q p o ly m é r a s e 1 U 0 ,2E a u M i l l iQ / / 1 5 ,6 7 5
A D N m a t r i c e / / 1V o lu m e T o t a l / / 2 5
V o lu m e s (μL )
1 0 mM 2 5 0 μ M1 0 μ L 0 ,2 μ L1 0 μ L 0 ,2 μ L
5 U /μ L
Tableau 1: Caractéristiques des amorces pour PCR "Archées"
Amorces Séquence 5'-3' Température de fusion (TM)A8F TCC GGT TGA TCC TGC C 54°C
U1492R GGT TAC CTT GTT ACG ACT T 58°C
2.3.3.2 PCR sur colonie : Thermus
Une approche différente est réalisée pour la PCR des Bactéries du genre Thermus. En effet, uneméthode de PCR sur colonie a été appliquée. Cela permet de réaliser l'amplification du gène codantpour l'ARN 16S sans avoir à réaliser une extraction d'ADN total au préalable.
Les amorces utilisées pour l'amplification du gène codant pour l'ARN 16S bactérien sont l'amorceBac 8 « Forward » (Teske et al ., 2002) qui se fixe au niveau de la base 8 du gène et l'amorceUniverselle 1492 « Reverse » au niveau de la base 1492 (Khemariya et al., 2013).
Le mélange réactionnel utilisé est le même que pour les Thermococcales (Tableau 2) mais avec lesamorces choisies ci-dessus ( Tableau 3).
Sous une hotte à flux laminaire, un volume de 25 μL de mélange réactionnel est transféré dans untubes PCR. Ensuite une colonie isolée sur boîte de Pétri est piquée à l'aide d'un cure-dent stérile,puis plongée dans le tube PCR contenant le mix, un mouvement de rotation du cure-dent esteffectué afin de déposer un maximum de cellules dans le mix réactionnel.
Certaines étapes de PCR sont modifiées, en effet la dénaturation initiale passe de 5 à 15 minutesafin de provoquer un choc physique sur les bactéries afin de les lyser et en libérer le contenucellulaire. La température d'hybridation passe à 56°C du fait de la température de fusion (Tm) desamorces plus importante que celles des Archées.
2.3.4 Gel de contrôle des produits PCR
La migration est réalisée sur un gel d’agarose à 0,8 %. L'agarose ajouté à du TAE 1X est solubiliséà l’aide d’un micro-ondes . Le mélange qui a été porté à ébullition est refroidi avant d’ajouter duBET (Bromure d’éthidium), ce produit est hautement toxique (mutagène et cancérigène), lesmanipulations sont donc réalisées dans une pièce prévue à cet effet. Par la suite le mélange est coulédans un moule où des peignes servant à créer des puits on été préalablement placés.
Après solidification du gel, les peignes sont délicatement retirés. Un dépôt de 3 μL d’un marqueurdu taille 1kb est tout d’abord réalisé afin de déterminer la taille du produit amplifié grâce à unegamme de fragments d'ADN de différentes tailles. Ensuite un mélange de 1 μL de tampon decharge Orange G 6x et de 5 μL de produit PCR, est déposé dans chaque puits.
La migration est effectuée à 100 Volts pendant 30 minutes à l’aide d’un appareil d’électrophorèse,les ADN étant chargés négativement ils migrent vers l’anode correspondant au pôle positif. Lavisualisation de la migration se fait par Ultra-violet à l’aide d’un Transilluminator. En effet, le BETest un agent intercalant qui s’insère dans l’ ADN et qui permet de voir la molécule lorsqu’elle estexcitée par une lumière UV.
11
Tableau 1: Caractéristiques des amorces pour PCR "Bactéries"Amorces Séquence 5'-3' Température de fusion (TM)
B8F AGA GTT TGA TCA TGG CTC AG 58U1492R GGT TAC CTT GTT ACG ACT T 58
La migration a pour objectif de vérifier la présence d’amplicons de 1500 paires de bases attestant dela réussite de l’amplification. Pour toutes les PCR un témoin négatif, contenant de l’eau milliQ, estréalisé.
2.3.5 Le séquençage Sanger
Les échantillons de produits PCR sont envoyés pour séquençage à un prestataire extérieur :Beckman Coulter Genomics en Grande-Bretagne.
Le séquençage est réalisé par la méthode Sanger. Pour cette méthode, les mêmes réactifs que ceuxcontenus dans le mélange réactionnel de PCR sont utilisés sur le fragment d’ADNr 16S amplifiémais seulement une seule amorce est utilisé pour la réaction. Des didésoxynucléotide triphosphates(ddNTPs) sont ajoutés en plus des dNTPs classiques au mélange. Ce sont des nucléotides modifiéschimiquement, ils ne possèdent pas de groupement hydroxyle permettant la liaison phosphodiesteravec le nucléotide suivant, à la place les ddNTPs sont marqués par un fluorochrome spécifique pourchaque bases azotées (A,T,C,G).
Lors de la réaction de séquençage, après séparation de l’ADN double brin par une augmentation dela température, l’amorce vient se fixer sur le brin d’ADN et la Taq polymérase se fixe ensuite poursynthétiser un nouveau brin d’ADN. Durant la réaction les ddNTPs viennent se positionner de façonaléatoire sur le brin ce qui stoppe l’action de la polymérase comme les ddNTPs empêchent la liaisonavec le nucléotide suivant. A la fin de la réaction de nombreux brins de longueur variable sontobtenus permettant par la suite de reconstituer la séquence complète.
12
Figure 9: Schéma d'injection, détection et traitement des produits de séquençage à travers un gel capillaire.
Ensuite une électrophorèse capillaire est réalisée à partir du produit de la réaction de séquençage, cedernier est injecté dans un gel capillaire qui entraîné par un courant électrique va faire migrer lesfragments d’ADN obtenus en fonction de leurs taille. En effet, les fragments d’ADN les plus petitsmigreront plus vite. A la sortie du capillaire un laser à 260 nm permet l’excitation desfluorochromes des ddNTPs, ces derniers émettent ainsi une lumière spécifique qui est collectée parun détecteur. Le passage de tous les fragments d’ADN marqués à leur extrémité 3’ à différentniveau du gène permet l’obtention après traitement d’un chromatogramme avec une partie de laséquence du gène amplifié (Figure 9).
La méthode Sanger permet de séquencer 800 pb avec une qualité suffisante ,or l’ARNr 16S fait auxalentours de 1500 pb pour les Bactéries et de 1400pb pour les Archées. Il est donc nécessaire deréaliser un séquençage avec l’amorce « Forward » et un autre avec l’amorce « Reverse » afind’obtenir la séquence complète du gène par superposition de la zone commune des deux séquencesd’environ 800pb obtenues.
2.4 Analyses des séquences
Dans un premier temps deux fichiers en format .fasta sont obtenus ainsi que deuxchromatogrammes. Ces fichiers correspondent au séquençage du gène dans le sens « Forward » et« Reverse ». Afin d'obtenir la séquence total du gène appelée séquence consensus, les deuxséquences doivent être assemblées, alignées puis comparées aux bases de données afin dedéterminer la taxonomie des souches d'origines.
Le logiciel GLC Genomics Workbech permet d'assembler les deux séquences. Pour cela la séquence« Reverse » est rendue reverse et complémentaire afin de pouvoir la superposée à la séquence« Forword ». Par la suite des conflits apparaissent dans la zone de superposition des deuxséquences, ils sont corrigés en vérifiant les chromatogrammes et en choisissant ainsi le nucléotide leplus adapté par rapport à son score de qualité.
Dans un second temps, l’affiliation taxonomique est déterminée à l’aide du portail en ligne RDP(https://rdp.cme.msu.edu/). L'outil Classifier du portail permet de vérifier que la souchecorresponde au genre suspecté, en effet il permet d'établir la taxonomie de la souche précisément dudomaine jusqu'au genre, voir de l'espèce. Par la suite les séquences sont comparées à d'autresséquences des bases de données grâce à l'outil Seq match. Cela permet d'observer si une desséquences s’aligne à 100 % sur une souche type des banques de données et ainsi de déterminerdirectement sa taxonomie.
En parallèle, sur le portail arb-silva ( https://www.arb-silva.de/ ), les séquences d'ARNr 16S sontalignées avec d'autres séquences types ou des séquences environnementales proches issus des basesde données. L'alignement permet de placer les zones conservées et variables de l'ARNr 16S auxmêmes endroits vu que toutes les séquences réunies n'ont pas été amplifiées avec les mêmesamorces et jusqu'au même niveau du gène.
Pour finir toutes les séquences sont importées sur le logiciel Seaview ou les extrémités desséquences sont effacées car très peu fiables. Quelques séquences issus d'une autre famille sont aussiajoutées aux séquences regroupées appartenant soit à la famille Thermococcales ou soit au genreThermus. Ces séquences ajoutées servent d' « outgroup » afin de créer la racine d’un arbrephylogénique. L' arbre est enfin réalisé pour pouvoir observer les espèces les plus proches dessouches analysées et déterminer leur appartenance à des espèces connues (soit regroupés en clademonophylétique contenant une seule souche types ou à de nouveaux groupes taxonomiques).
13
Les arbres sont calculés par la méthode de maximum de probabilité grâce à l'algorithme PhyML quireconstruit l’arbre le plus probable parmi l’ensemble des arbres possibles.
3. Résultats et DiscussionPour ce qui est des Thermococcales 22 des 28 souches restantes de la collection ont pu êtrecultivées et extraites et 20 d'entre elles ont pu être envoyées à séquencer (Annexe 6). En ce quiconcerne les souches du genre Thermus 53 des 68 souches ont pu être cultivées et 44 d'entre ellesont pu être amplifiées et envoyées à séquencer (Annexe 7).
3.1 Culture et états frais
3.1.1 Milieux liquides
La croissance des cellules est tout d'abord observée par un trouble du milieu, un état frais réalisé aumicroscope optique x400 ou x1000 permet d'observer la croissance cellulaire. L'observation deplusieurs phases cellulaires et une division des cellules se caractérisant par la présence de cocci côteà côte permet d’attester d’une population cellulaire suffisante pour réaliser l'extraction.
3.1.2 Milieux solides
La croissance des souches est observée par d'un bon isolement par la méthodes des cadrans. Lepolymorphisme du genre Thermus est très important d'une souches à l’autre.
Les colonies sont d'aspects lisses et rondes, elles sont opaques à la lumière et de forme semi-bombée. Elles sont le plus souvent de couleur blanches (a) mais elles présentes parfois un pigmentjaune-orangé (b) qui à été décris lors de la découverte de Thermus aquaticus (Brock, T. D.,1969) .Les colonies bien isolées comme sur la figure 1 dans la partie supérieure droite de la boîte peuventservir ensuite pour réaliser une PCR sur colonie.
14
(a
Figure 10: (a) Souche VM 41 sur 162 1%, (b) Souche Thermus aquaticus sur 162 0,1%
3.2 Quantification et qualité de l’ADN
Les concentrations calculées par le Nanodrop indiquent que les échantillons contiennenténormément d'ADN ( Colonne 3 ). Des dilutions seront donc nécessaires pour la suite des PCR, au1/2, au 1/5ème au 1/100ème et au 1/1000ème. Les ratios A260/230 et A260/280 sont valides pour laplupart des souches. Certaines ont des ratios assez faibles (< 1,8) comme les échantillons 3 et 13 quiattestent d'une présence de composés organiques mais aussi de réactifs co-purifiés durantl'extraction.
15
Tableau 2: Résultats des analyses au NanodropEchantillons Numéro ng/uL A260/280 A260/230
GE 25 1 1968,3 1,92 1,72GE 22 2 4357,9 1,73 1,62GE 21 3 4604,1 1,63 1,57GE 18 4 1206,2 2 2,03
CIR 12a 5 3258,1 1,91 1,87GE 03 6 1492,7 1,95 1,87
AMT c66 7 4297 1,74 1,68E15 d17 8 4697,7 1,6 1,71GE 02 9 3251 1,88 1,88IRI 51a 10 1337,3 1,86 1,53E15 d24 11 1500 2 2,17EXT 04c 12 4071,7 1,8 1,8EXT 02c 13 4735,5 1,54 1,52EXT 07c 14 4143,2 1,78 1,81EXT 03c 15 4566,7 1,66 1,6GE 09 16 4186,9 1,77 1,75
E15 d18 17 2524,6 1,95 2,2E15 d21 18 3170,8 1,97 2,15E15 p5 19 3208,5 1,97 2,12E10 p13 20 932 2,03 2,12E15 p34 21 277,3 1,98 2,07E15 p12 22 1210,1 2 2,04
3.3 Gel de contrôle des produits PCR
3.3.1 Migration Thermococcales
La première migration n’ayant pas fonctionnée, une amorce plus spécifique aux Archéas été choisieainsi qu'une température de fusion plus élevée ( Annexe 5).
Après ces changements, une nouvelle migration est effectuée, les échantillons sont dilués au 1000ème,un nouveau couple d'amorces A8F/ A1492R est utilisé et une température d’hybridation de 56°C aulieu de 53°C est appliquée.
Avec ces nouvelles conditions (Figure 11) la majorité des produits PCR sont amplifiés, leséchantillons 7, 14, 19 n'étant pas assez concentrés ils n'ont pas été envoyés à séquencer.L’échantillon 22 étant multibande il n’est pas sélectionné. Une nouvelle PCR sera réalisée avec unedilution au 1/100ème pour les échantillons 7, 14,19 et 22.
3.3.2 Migration Thermus
L a Figure 12 illustre un exemple de PCR sur colonie de l’ARNr 16S de 10 souches du genreThermus :
16
Figure 11 : Migration des Produits PCR "Archéens"
Figure 12: Migration des Produits PCR "Bactériens"
1500 pb
1500 pb
1500 pb
Ici toutes les souches ont été amplifiées sauf pour celle de l’échantillon numéro 6. Cette souche serafinalement amplifiée après plusieurs essais.
3.4 Analyses des séquences
La Figure 13 montre l’alignement effectué pour une souche de Thermococcales :
Sur cette exemple, 3 conflits apparaissent entre les deux séquences au niveau de la zone desupposition. Ces conflits sont présents au début et à la fin de la zone de superposition desséquences. En effet, ces extrémités correspondent à l'association du début d'une séquence avec la find'une autre. La fin de séquence étant au-delà de la limite des 800pb fiables du séquençage deserreurs peuvent apparaître avec le début de l'autre séquence comme ici.
La Figure 14, illustre le premier conflit affiché sur la Figure 13. Deux bases différentes, A et G sonttrouvées à la position 858 de la séquence F (en vert) et à la position 538 reverse et complémentairede la séquence R (en rouge). Les chromatogrammes sont alors vérifiés pour déterminer si la base Gchoisie par le logiciel est valide.
17
Figure 13: Assemblage des séquences "Reverse" et "Forward" de la souche GE-03 à l'aide du logiciel GLC Genomics
Figure 14: Conflit entre les séquences F et R de la souche GE-03
Le chromatogramme de la séquence F (a) montre qu'il y a un croisement entre un pic de base A et Gau niveau de la base 858 indiquant une possible erreur d'analyse durant le séquençage. Sur lechromatogramme de la séquence R (b), un pic net de base C est observé à la position 538, cettebase lorsque la séquence est rendu complémentaire et reverse devient alors un G. Le score dequalité n'étant que de 8 pour la base A alors que celui de la base C est de 48, c'est la base Gcomplémentaire qui sera utilisée pour la séquence consensus (Figure 15).
La séquence consensus obtenue après vérification de tous les conflits est comparée aux bases dedonnées comme indiqué sur la Figure 16 :
La souche GE-03 appartient ici au genre Thermococcus. Sur les 19 souches dont le séquençage afonctionné, 17 appartiennent au genre Thermococcus et 2 appartiennent au genre Pyrococcus(Annexe 6).
Les espèces de l'ordre Thermococcales ont très peu de variation au niveau de leur ADNr 16S et ilest difficile de déterminer directement l'espèce. Un arbre phylogénique (Figure 17) a donc étéétabli à partir des 19 séquences (encadrés bleus) ainsi que de 61 séquences de Thermococcalesproches provenant de bases de données en ligne (SILVA, RDP, greengenes, EMBL, LTP).L'« outgroup » est composé de 8 séquences du genre Methanolobus (encadré rouge).
18
Figure 15: Chromatogrammes de la souches GE-03 (a) séquence Forward (b) séquence Reverse
Figure 16: Détermination de la Taxonomie de GE-03 à l'aide de Classifier
19Figure 17: Arbre phylogénique composé de 88 séquences
4. Conclusion
Au cours de mon stage, l'extraction d'ADN et la réalisation d'amplifications par PCR a permisl'obtention de 19 séquences de Thermococcales. Grâce à la méthode de PCR sur colonie qui n'avaitjusqu’à lors jamais été testée au laboratoire sur des souches thermophiles, plus de la moité dessouches de Thermus ont pu être séquencées.
Ces résultats vont participer à l'enrichissement des données moléculaires de la collection sur cessouches présentant de nombreux intérêts. En effet les caractéristiques des lipides membranaires desArchées ainsi que leurs polymères ont par exemple de nombreuses applications dans des domainesvariés (santé, agroalimentaire, cosmétiques). Les enzymes thermophiles et hyperthermophiles issusde ces souches présentent quant à elles déjà de nombreuses application dans le domaine desbiotechnologies (Querellou., 2010).
Mais le travail effectué est à poursuivre :
- Les méthodes de culture ainsi que de biologie moléculaire peuvent être revues ou améliorées afinde permettre le séquençage des souches dont les manipulations avant l'envoi à séquencer n'ont pasfonctionnées.
- Une étude phylogénétique des souches de Thermococcales à partir de l'arbre établi serait à réaliserafin de déterminer la taxonomie de chacune d'entre elles, ces données pourront ensuite servir desupport pour des travaux de recherche réalisés au laboratoire.
- L'analyse des séquences de Thermus est elle aussi à poursuivre, en effet les séquences obtenuesn'ont pas eu le temps d'être traitées. Comme pour les Archées l'analyse doit être réaliser encommençant par la création d'un arbre phylogénique puis la détermination de la taxonomie.
Les séquences ainsi que leurs analyses serviront après détermination de leur taxonomie, grâce à leurADN 16S, à alimenter la base de données publique de l'UBOCC participant ainsi à la réalisation desobjectifs du protocole de Nagoya.
20
Bibliographie
Teske, A., Hinrichs, K. U., Edgcomb, V., de Vera Gomez, A., Kysela, D., Sylva, S. P., ... &Jannasch, H. W. (2002). Microbial diversity of hydrothermal sediments in the Guaymas Basin:evidence for anaerobic methanotrophic communities. Applied and Environmental Microbiology,68(4), 1994-2007.
Nercessian, O., Reysenbach, A. L., Prieur, D., & Jeanthon, C. (2003). Archaeal diversity associatedwith in situ samplers deployed on hydrothermal vents on the East Pacific Rise (13 N).Environmental Microbiology, 5(6), 492-502.
Roussel, E. G., Sauvadet, A. L., Chaduteau, C., Fouquet, Y., Charlou, J. L., Prieur, D., & CambonBonavita, M. A. (2009). Archaeal communities associated with shallow to deep subseafloorsediments of the New Caledonia Basin. Environmental microbiology, 11(9), 2446-2462.
Byrne, N. (2008). Etude de la diversité métabolique des micro-organismes des sourceshydrothermales (Doctoral dissertation, Université de Bretagne Occidentale).
Brock, T. D., & Freeze, H. (1969). Thermus aquaticus gen. n. and sp. n., a nonsporulating extremethermophile. Journal of bacteriology, 98(1), 289-297.
Jannasch, H. W., & Wirsen, C. O. (1979). Chemosynthetic primary production at East Pacific seafloor spreading centers. Bioscience, 29(10), 592-598.
Holden, J. F., Takai, K., Summit, M., Bolton, S., Zyskowski, J., & Baross, J. A. (2001). Diversityamong three novel groups of hyperthermophilic deep-sea Thermococcus species from three sites inthe northeastern Pacific Ocean. FEMS microbiology ecology, 36(1), 51-60.
Prieur, D., Erauso, G., & Jeanthon, C. (1995). Hyperthermophilic life at deep-sea hydrothermalvents. Planetary and space science, 43(1-2), 115-122.
Querellou, J. (2010). Biotechnologie des archées. Biofutur, 29(310), 45-48.
Khemariya, P., Singh, S., Nath, G., & Gulati, A. K. (2013). Development of a PCR-RFLP assay forthe identification of Lactococcus lactis ssp. lactis and cremoris. Annals of microbiology, 63(1), 109-115.
21
Annexes
Annexe 1 : Milieu TRM
Thermococcales Rich MediumMilieu utilisé pour les Thermococcales
Pour 1 litre :
> NaCl 23,00 g
> MgCl2 x 6 H2O 5,00 g
> KCl 0,70 g
>(NH4) 2SO4 0,50 g
> K2 HPO4 5% 1,00 mL
> KH2 PO4 5% 1,00 mL
> CaCl2 , x 2 H2O 1,00 mL
> NaBr 0,05 g
> SrCl2 0,01 g
> Na2WO4 10 mM 1,00 mL
> FeCl3 25mM 1,00 mL
> PIPES 3,30 g
> Extrait de Levure 1,00 g
> Tryptone 4,00 g
> Resazurine 4% 4 gouttes
Ajuster le pH à 6,8 puis autoclaver
l Na2WO4 10 mM = 0,29338 g dans 100mL d’eau distillée
l FeCl3 25mM = 1,44 mL de la solution à 28,25% qsp 100 mL
(Pas d’autoclavage pour ces deux solutions )
22
Annexe 2 : Milieu Ravot
Pour les soufre-réducteurs Hétérotrophes
Pour 1 litre :
>NH4Cl 0,30 g
> MgCl2 x 6 H2O 0,50 g
> CaCl2 , x 2 H2O 0,10 g
> KCl 0,50 g
> Acetate de sodiumtrihydraté 0,83 g
> Extrait de Levure 2,00 g
> Tryptone 2,00 g
> NaCl 0,50 g
> PIPES 3,30 g
> Resazurine 4% 4 gouttes
> Maltose 2,00 g
+SOUFRE
Après autoclavage ajouter :
> K2 HPO4 7% 1,0 mL
> KH2 PO4 7% 1,0 mL
23
Annexe 3 : Milieu 162 1 %
Milieu utilisé pour les Thermus Bacillus
> Eau 880 mL> Base A 100 mL> Levure 2,5 g> Tryptone 2,5 g> NaCl 10 g> Tampon B 20 mL
Pour les milieux solides> Agar 15 g
Base A :> Eau 1000 mL> Titriplex I (nitrilotriacetic acid) 1,32 g> MgCl2 x 6 H2O 2,00 g> CaSO4 x 2 H2O 0,40 g> Elements traces 5,00 mL> Fe citrate 5,00 mL
Ajuster le pH à 7,2
Eléments traces :> Eau 1000 mL> Titriplex I (nitrilotriacetic acid) 12,80 g> FeCl2 x 4 H2O 1,00 g> MnCl2 x 4 H2O 0,50 g> CoCl2 x 6 H2O 0,30 g> ZnCl2 0,20 g> CuCl2 x 2 H2O 0,05 g> Na2MoO4 x 2 H2O 0,05 g> H3BO4 0,02 g> NiCl2 x 6 H2O 0,02 g
Ajuster le pH à 6,0-6,5
Fe citrate :> Eau 1000 mL> Na3 citrate x 2 H2O 2,94 g> FeCl3 x 6 H2O 2,70 g
Tampon B ou Tampon PO4 :
> Eau 1000 mL> KH2 PO4 5,44 g> Na2HPO4 x 2 H2O 21,40 g
Ajuster le pH à 7,2
24
Annexe 4 : EXTRACTION ADN TOTAL EN GRAND VOLUME POUR DES ARCHAEES
1. Arrêter la culture en phase exponentielle de croissanceTransférer 40mL de la culture dans un Falcon placer dans la glace en prenant soin de ne pas prendre de soufre.Si malgré tout il reste du soufre centrifuger 7 min 1500 rpm à 4°C pour le décanter puis transférer le surnagent dans un nouveau tube.Centrifuger pendant 15 min à 4°C à 7000gEliminer le surnagent.
2. Resuspendre le culot dans 800µL de TNE
3. Ajouter 100µL de SDS 10% et 100µL de N-Lauryl-Sarcosyl 10%.Mixer les tubes en les inversant mais ne pas les vortexer (aspect blanc d’œuf)
4. Ajouter 5µL de Rnase A Incuber au moins 15 minutes à température ambiante
5. Ajouter 20µL de Protéinase KIncuber dans un bain marie à 55°C pendant 1 heure
6. Ajouter 1 Volume de PCI (~1 mL) (phase inférieure du produit)Mélanger vigoureusement mais ne pas vortexer pour obtenir une émulsion jaune laiteuseCentrifuger à vitesse maximale pendant 15 min à 4°C
7 Collecter la phase aqueuse supérieure avec un cône bleu coupé afin de ne pas dénaturer l’ADN et ne pas aspirer la crêpe protéique blanche située à l’interface
8. Ajouter 1 Volume (~1 mL) de chloroforme Mélanger vigoureusement pour obtenir une émulsion Centrifuger à vitesse maximale pendant 5 min à 4°CCollecter la phase aqueuse supérieure avec un cône bleu coupé.
9. Ajouter 0.7 Volume (~700µL) d’Isopropanol à la phase aqueuse Mélanger en retournant le tube plusieurs fois.Laisser au moins 15 min à température ambiante puis à -20°C pour permettre une meilleure précipitation
10. Centrifuger à vitesse maximale pendant 20 min à 4°CEliminer le surnagent à l’aide d’une pipette pasteur effilée avec la pompe à videDécoller le culot
11. Laver le culot avec 500µL d’éthanol à 75%Centrifuger à vitesse maximale pendant 5 min à 4°C
12. Enlever le surnagent comme précédemment en faisant attention de ne pas aspirer le culotFaire sécher le culot au Speed Vac
13. Reprendre le culot dans 50µL de TELaisser dissoudre l’ADN toute la nuit à 4°C puis conserver à-20°C
25
Annexe 5 : Test de différents couples d'amorces pour Thermococcales
La température d’hybridation était de 56°C pour ces produits PCR.
Dilution au 1/1000ème et au 1/5000ème.
T+ : Témoin positif correspondant à une souche déjà amplifiéeS : Souche test E15d21T- : Eau MilliQ
Bandes beaucoup plus nettes avec le couple d’amorces spécifiques aux Archées : A8F/A1498R
Séquence A1492R : GGC TAC CTT GTT ACG ACT T’ ( Teske et al.,2002)Tm : 56°C
26
A8F/U1492F A8F/A1492R
1500 pb
Annexe 6 : Listes des souches de Thermococcales utilisées.
27
Annexe 7 : Liste des souches de Thermus utilisées
28
Origine Milieux Culture Nombre de relance PCR Séquançcage2894 / MB1/2 2% - 1 / /2895 / MB1/2 2% - 1 / /2898 / MB1/2 2% - 1 / /2904 / MB1/2 2% - 1 / /
VM 41 Océan Atlantique 162+1% + 3 ok okVM 55 Océan Atlantique 162+1% + 3 ok okVM 65 Océan Atlantique 162+1% + 0 ok okVM 75 Océan Atlantique 162+1% + 0 ok -VM 82 Océan Atlantique 162+1% + 0 ok okVM 83 Océan Atlantique 162+1% + 3 ok okVM 90 Océan Atlantique 162+1% - 2 / /SP4 / 162+1% + 0 ok ok
SP4(1) / 162+1% + 0 ok okSP4(2) / 162+1% + 0 ok okSP7A / 162+1% + 3 ok -
SP7A(88) / 162+1% + 0 ok okRBS1b / 162+1% + 0 ok okMi 47 / 162+1% + 1 ok okMi 12 / 162+1% + 0 ok okMi 19 / 162+1% + 0 ok okMi 22 / 162+1% + 0 ok ok312 Océan Pacifique 162+1% + 3 - /341' Océan Pacifique 162+1% + 3 - /
Mi 14 / 162+1% + 1 ok okMi 50 / 162+1% + 0 ok ok331 Océan Pacifique 162+1% + 3 ok -
Mi 52 / 162+1% + 3 ok ok311 Océan Pacifique 162+1% + 0 ok okB1 / 162+1% + 0 ok ok332 Océan Pacifique 162+1% + 1 ok ok321' Océan Pacifique 162+1% + 0 ok ok351 Océan Pacifique 162+1% + 3 - /352 Océan Pacifique 162+1% + 3 - /
Mi 67 / 162+1% + 1 ok -Mi 54 / 162+1% + 1 ok okT24 / 162+ 0.1% + 0 ok okT23 / 162+ 0.1% + 0 ok okT22 / 162+ 0.1% + 0 ok okT19 / 162+ 0.1% + 0 ok okSP 4 / 162+1% + 1 - /T21 / + 0 ok okT49 / + 0 ok okT51 / + 2 - /
Nom de la souche
162+ 0,1 %162+ 0,1 %162+ 0,1 %
29
/ + 2 - /RB39A Rallier du baty 160 + 1 ok okRB39C1 Rallier du baty 160 + 0 ok oki2E31²b Océan Pacifique 162 +1% - 0 / /i3E44²2d Océan Pacifique 162+1% + 1 ok oki2E29°b Océan Pacifique 160 + 2 - /i3E44²b Océan Pacifique 162+1% + 1 ok oki1E39²c Océan Pacifique 162 +1% + 1 ok oki2E39²a Océan Pacifique 162+1% + 1 ok oki1E48²b Océan Pacifique 162 +1% + 1 ok oki3E42²e Océan Pacifique 162+1% + 1 - /i5E29°a Océan Pacifique 160 - 1 / /
i5E49²c sol Océan Pacifique 162+1% - 0 / /i5E39°a Océan Pacifique 160 - 1 / /i4E7²b Océan Pacifique 162+1% + 1 ok -
i7E18²a2 Océan Pacifique 162 +1% + 1 ok oki3E15²d Océan Pacifique 162+1% - 0 / /i2E44²c Océan Pacifique 162 +1% + 1 ok oki5E49²d Océan Pacifique 162+1% + 1 ok oki5E48²d Océan Pacifique 162 +1% - 0 / /i6E44²e Océan Pacifique 162+1% - 0 / /i5E39°c Océan Pacifique 160 - 1 / /
i6E48²c sol Océan Pacifique 162+1% - 0 / /i5E18°a Océan Pacifique 160 - 1 / /
B05 / 162+1% + 1 ok ok
Thermus aquaticus 162+ 0,1 %
Résumé
Les environnements marins profonds sont associés à une importante biodiversité dont les micro-organismes en représente une grande partie et participent au maintient. L’étude des ces Bactéries etde ces Archées présent dans ces milieux permet une meilleur compréhension du fonctionnement etdes interactions liées à cet écosystème.
L'UBOCC détient une large collection d'isolats récoltés durant de nombreuses campagnesocéanographiques et dans le cadre du Protocole de Nagoya elle s'engage à fournir le maximumd'informations notamment génétiques sur les souches qu'elle possède.
Pour cela des isolats Bactériens du genre Thermus et des isolats Archéens de l'ordre desThermococcales sont mis en culture, extraits,et amplifiés à partir de leur l'ADNr 16S. L’objectif estde séquencer les gènes amplifiées afin de pouvoir réaliser une analyse des séquences. Les donnéesen résultant serviront de support pour des recherches futurs et permettront d'enrichir les bases dedonnées génétiques.
Abstract
Deep marine environments are associated with hudge biodiversity, including micro-organisms in alarge part and contribute to maintenance . The study of the Bactérias and Archeas present in thisenvironments allows a better understanding of the functioning and the interactions with thisecosystem.
The UBOCC has a large collection of isolates harvested during numerous oceanographic surveysand within the framework of the Nagoya Protocol, it undertakes to provide as much geneticinformations as possible on the strains it possesses.
For this purpose, Bacterial isolates of the genus Thermus and Archeens isolates of the order ofThermococcalles are cultured, extracted and amplified from their 16S DNA. The objective is tosequence the amplified genes in order to be able to carry out the sequence analysis. The data beingdeveloped for future search and will enrich the genetic databases.
30
>AMTc_66
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGGGGT
ACTGGAAGGTCCCCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCACAGCCACGGC
TTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCAAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
GGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGGAGGGAAGCCGTTAAGCCCGCCGC
CTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGG
GTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGGA
TGAAGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCATGGCCGCCGTCAG
CTCGTACCGTTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTG
CCAGTCCTCCCCGCTGGGGAGAAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGA
AGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAA
31
TGGGCGGGACAATGGGAACCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCTCA
GTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTC
ATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAG
CGGGGTCCGGGTGAGGCCTGGTCTCCCTTCGGGGAGGC
>CIR-12A
TGCGAGTCATGGGGTCCCTTCGGGGACACCGGCGGACGGCTCAGTAACACGTCGGTAACC
TACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGGGGTA
CTGGAAGGTCCCCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGATT
AGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGGG
AGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAA
CCTCCGCAATGCGGGAAACCGCGACGGGGGGACCCCCAGTGCCGTGGCACAGCCACGGCT
TTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCGC
GGTAATACCGGCGGCCCAAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCGG
GCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCCGTGGGGCTTGCTGGGGATACTGC
GGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAAGGATGCGGG
CTAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGGAGGGAAGCCGTTAAGCCCGCCG
CCTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTAACAAG
GGGTGGAGCGTGCGGTTTAATTGGGATTCAACGCCGGGAACCCTCACCGGGGGCGACGGC
AGGATGAAGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCATGGCCGCCG
32
TCAGCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAG
TTGCCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGA
GGAAGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTA
CAATGGGCGGGACAATGGGAACCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCC
TCAGTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGT
GTCATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCC
GAGCGGGGTCCGGGTGAGGCCTGGTCTCCCTT
>E10p13
TAGCCATGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTC
GGTAACCTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCC
TGGGGTACTGGAAGGTCCCCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCG
GCCGATTAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGA
GAGTGGGAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGG
CGCGAAACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCACAGC
CACGGCTTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAG
CCGCCGCGGTAATACCGGCGGCCCAAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCG
TAGCCGGGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGA
TACTGCGGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCT
ATAATCCCAGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAG
GGACGAAGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGAT
GCGGGCTAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGGAGGGAAGCCGTTAAGCC
33
CGCCGCCTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTA
CAAGGGGTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACG
GCAGGATGAAGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCATGGCCGC
CGTCAGCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCC
AGTTGCCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCG
GAGGAAGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGC
TACAATGGGCGGGACAATGGGAACCGACTCCGAAAGGGGAAGGGAATCCCCTAAACCCGC
CCTCAGTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGC
GTGTCATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCAC
CCGAGCGGGGTCCGGGTGAGGCCTGGTCTCCCTTCGGGGAGGC
>E15D17
TGCGAGTCATGGGGCGCCTTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAACCT
ACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGTAC
TGGAAGGTCCTCAGGCCGAAAGGGTCTCTGACCGCCCGAGGATGGGCCGGCGGCCGATTA
GGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGGGA
GCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAAC
CTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGCTT
TTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCGCG
GTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCGGG
CCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGCGG
GCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATCCC
34
AGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAGGGACGAAG
GCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGCTA
GGTGTCGGACGAGCTTCGAGCTCGTCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCCGCCT
GGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGGGT
GGAGCGTGCGGTTTAATTGGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGGAT
GAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGTCAGC
TCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTGCC
AGTCCTCCCCGTTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGAAG
GAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAATG
GGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCCCAGT
TCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTCAT
CATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAGCG
GGGTCTGGATGAGGCCTGATCTCCCTTCGGGGAGGT
>E15D18
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGT
ACTGGAAGGTCCTCAGGCCGAAAGGGTCTCTGACCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGC
TTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
35
CGGTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCTGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
AGGCCTTGGGACCGGGAGAGGCGGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCCCCGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCCGC
CTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGG
GTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGGA
TGAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGTCAG
CTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTGC
CAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGAA
GGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAAT
GGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCCCAG
TTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTCA
TCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAGC
GGGGTCTGGGTGAGGCCTGATCTCCCTTCGGGGAGG
>E15d21
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGT
ACTGGAAGGTCCTCAGGCCGAAAGGGTCTCTGACCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
36
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGC
TTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCTGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
AGGCCTTGGGACCGGGAGAGGCGGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCCCCGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCCG
CCTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGG
GGTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGG
ATGAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGTCA
GCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTG
CCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGA
AGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAA
TGGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCCCA
GTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTC
ATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAG
CGGGGTCTGGGTGAGGCCTGATCTCCCTTCGGGGAGGTC
>E15D24
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
37
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGT
ACTGGAAGGTCCTCAGGCCGAAAGGGTCTCTGACCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGC
TTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCTGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
AGGCCCTTGGGACCGGGAGAGGCGGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAAT
CCCAGGGGGACCGCCAGTGGCGAAGGCGCCCCGCTGGAACGGGTCCGACGGTGAGGGACG
AAGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGG
CTAGGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCC
GCCTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAG
GGGTGGAGCGTGCGGTTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCA
GGATGAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGT
CAGCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGT
TGCCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAG
GAAGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTAC
AATGGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCC
CAGTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTG
38
TCATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCG
AGCGGGGTCTGGGTGAGGCCTGATCTCCCTTCGGGGAGGTCGGGTCGA
>E15P5
GCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAACC
TACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGGGGTA
CTGGAAGGTCCCCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGATT
AGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGGG
AGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAA
CCTCCGCAATGCGGGAAACCGCGACGGGGGGACCCCCAGTGCCGTGGCACAGCCACGGCT
TTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCGC
GGTAATACCGGCGGCCCAAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCGG
GCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGCG
GGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATCC
CAGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAGGGACGAA
GGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGCT
AGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGGAGGGAAGCCGTTAAGCCCGCCGCC
TGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGGG
TGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGGAT
GAAGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCATGGCCGCCGTCAGC
TCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTGCC
AGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGAAG
39
GAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAATG
GGCGGGACAATGGGAACCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCTCAGT
TCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTCAT
CATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAGCG
GGGTCCGGGTGAGGCCTGGTCTCCCTTCGGGGAGGCCGGTCG
>EXT-02C
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGGGGT
ACTGGAAGGTCCCCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCACAGCCACGGC
TTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCAAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
GGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGGAGGGAAGCCGTTAAGCCCGCCGC
CTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGG
GTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGGA
40
TGAACGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCATGGCCGCCGTCA
GCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTG
CCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGA
AGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAA
TGGGCGGGACAATGGGAACCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCTCA
GTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTC
ATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAG
CGGGGTCCGGGTGAGGCCTGGTCTCCCTTCGGGGAGGCC
>EXT-03C
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGGGGT
ACTGGAAGGTCCCCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCACAGCCACGGC
TTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCAAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
GGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
41
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGGAGGGAAGCCGTTAAGCCCGCCGC
CTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGG
GTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGGA
TGAAGGGCCAGGCTGAAGGTCTTGCCGGACGCGGCCGAGAGGAGGTGCATGGCCGCCGTC
AGCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTT
GCCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGG
AAGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACA
ATGGGCGGGACAATGGGAACCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCTC
AGTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGT
CATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGA
GCGGGGTCCGGGTGAGGCCTGGTCTCCCTTCGGGGAGGCC
>EXT-04C
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGGGGT
ACTGGAAGGTCCCCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCACAGCCACGGC
TTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCAAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
42
GGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGGAGGGAAGCCGTTAAGCCCGCCGC
CTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGG
GTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGGA
TGAAGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCATGGCCGCCGTCAG
CTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTGC
CAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGAA
GGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAAT
GGGCGGGACAATGGGAACCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCTCAG
TTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTCA
TCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAGC
GGGGTCCGGGTGAGGCCTGGTCTCCCTTCGGGGAGGCCGGGTCG
>EXT-07C
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGGGGT
ACTGGAAGGTCCCCAGGCCGAAAGGGCGTAAGCCGCCCGAGGATGGGCCGGCGGCCGATT
AGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGGG
AGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAA
CCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCACAGCCACGGCT
43
TTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCAAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
GGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCTGGGGTAGGGGTGAAATCCTGTAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCCGC
CTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGG
GTGGTAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGG
ATGAAGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCATGGCCCGCCGTC
AGCTCGTACCGTGAAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGT
TGCCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAG
GAAGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTAC
AATGGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCT
CAGTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTG
TCATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCG
AGCGGGGTCCGGGTGAGGCCTGGTCTCCCTCGGGGAGGCCGGG
>GE-02
TGCGAGTCAAGGGGGCGTCCCTTCTGGGACGCCACCGGCGGACGGCTCAGTAACACGTCG
GTAACCTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCT
GGGGTACTGGAAGGTCCCCAGGCCGAAAGGGAGCCGTAAGGCTCCGCCCGAGGATGGGCC
44
GGCGGCCGATTAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCC
GTGAGAGCGGGAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAG
CAGGCGCGAAACCTCCGCAATGCGGGAAACCGCGACGGGGGGACCCCCAGTGCCGTGCCT
CTGGCACGGCTTTTCCGGAGTGTAAAAAGCTCCGGGAATAAAGGGCTGGGCAAGGCCGGT
GGCAGCCGCCGCGGTAATACCGGCGGCCCGAGTGGTGGCCACTATTATTGGGCCTAAAGC
GGCCGTAGCCGGGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTCGCT
GGGGATACTGCGGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCCGGGGTAGGGGTGAA
ATCCTATAATCCCGGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACG
GTGAGGGCCGAAGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAA
AGGATGCGGGCTAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGTAGGGAAGCCGTT
AAGCCCGCCGCCTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAG
CACTACAAGGGGTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGGAACCTCACCGGGG
GCGACGGCAGGATGAAGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCAT
GGCCCGCCGTCAGCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCG
CGCCCCCAGTTGCCAGTCCCTCCCGCTCGGGAGGGAGGCACTCTGGGGGGACTGCCGGCG
ATAAGCCGGAGGAAGGGGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTAC
ACGCGCGCTACAATGGGCGGGACAATGGGTGCCGACCCCGAAAGGGGGAGGTAATCCCCT
AAACCCGCCCTCAGTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTA
GTACCCGCGCGTCATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGT
CACTCCACCCGAGCGGGGCCTAGGTGAGGCCCGATCTCCTTCGGGAGGTC
>GE-03
45
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGT
ACTGGAAGGTCCTCAGGCCGAAAGGGTCTCTGACCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGCAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGC
TTTTCCGGAGTGTAAAGAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
GGGTCTTGGGACCGGGAGAGGCGGAGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCTCCGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCCGC
CTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGG
GTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCCTCACCGGGGGCGACGGCAGG
ATGAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGTCA
GCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTG
CCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGA
AGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAA
TGGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCCCA
46
GTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTC
ATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAG
CGGGGTCTGGGTGAGGCCTGATCTCCCTTCGGGGAGGTCGGGTCGAG
>GE-09
TGCGAGTCAGGGGGCGTCCCTTCTGGGACGCCACCGGCGGACGGCTCAGTAACACGTCGG
TAACCTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTG
GGGTACTGGAAGGTCCCCAGGCCGAAAGGGAGCCGTAAGGCTCCGCCCGAGGATGGGCCG
GCGGCCGATTAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCG
TGAGAGCGGGAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGC
AGGCGCGAAACCTCCGCAATGCGGGAAACCGCGACGGGGGGACCCCCAGTGCCGTGCCTC
TGGCACGGCTTTTCCGGAGTGTAAAAAGCTCCGGGAATAAGGGCTGGGCAAGGCCCGGTG
GCAGCCGCCGCGGTAATACCGGCGGCCCGAGTGGTGGCCACTATTATTGGGCCTAAAGCG
GCCGTAGCCGGGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTCGCTG
GGGATACTGCGGGCCTTGGGACCGGGAGAGGCCGGGGGTACCCCCGGGGTAGGGGTGAAA
TCCTATAATCCCGGGGGGACCGCCAGTGGCGAAGGCGCCCGGCTGGAACGGGTCCGACGG
TGAGGGCCGAAGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAA
GGATGCGGGCTAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGTAGGGAAGCCGTTA
AGCCCGCCGCCTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGC
ACTACAAGGGGTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGC
GACGGCAGGATGAAGGCCAGGCTGAAGGTCTTGCCGGACGCGCCGAGAGGAGGTGCATGG
CCGCCGTCAGCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGC
47
CCCCAGTTGCCAGTCCCTCCCGCTCGGGAGGGAGGCACTCTGGGGGGACTGCCGGCGATA
AGCCGGAGGAAGGGGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACG
CGCGCTACAATGGGCGGGACAATGGGTGCCGACCCCGAAAGGGGGAGGTAATCCCCTAAA
CCCGCCCTCAGTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTA
CCCGCGCGTCATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCAC
TCCACCCGAGCGGGGCCTAGGTGAGGCCCGATCTCCTTCGGGAGGTCGGGTCGA
>GE-18
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGT
ACTGGAAGGTCCTCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGAAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGC
TTTTCCGGAGTGTAAAGAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
GGGCCTTGGGACCGGGAGAGGCGGAGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCTCCGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCCGCCG
CCTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGG
48
GGTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGG
ATGAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGTCA
GCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTG
CCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGA
AGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAA
TGGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCCCA
GTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTC
ATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAG
CGGGGTCTGGATGAGGCCTGGTCTCCCTTCGGGGAGGCCGG
>GE-21
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGT
ACTGGAAGGTCCTCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGAAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGC
TTTTCCGGAGTGTAAAGAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCCGTGGGGCTTGCTGGGGATACTG
CGGGCCTTGGGACCGGGAGAGGCGGAGGGTACCCCTGGGGTAGGGGTGAAATCCTATAAT
CCCAGGGGGACCGCCAGTGGCGAAGGCGCTCCGCTGGAACGGGTCCGACGGTGAGGGACG
49
AAGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGG
CTAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCCG
CCTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGG
GGTGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGG
ATGAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGTCA
GCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTG
CCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGA
AGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAA
TGGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCCCA
GTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTC
ATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAG
CGGGGTCTGGATGAGGCCTGGTCTCCCTTCGGGGAGGCC
>GE-22
TGCGAGTCATGGGGCGCGCTCTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAAC
CTACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGT
ACTGGAAGGTCCTCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGAT
TAGGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGG
GAGCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAA
ACCTCCGCAATGCGGGAAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGC
TTTTCCGGAGTGTAAAGAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCG
CGGTAATACCGGCGGCCCGAGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCG
50
GGCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGC
GGGCCTTGGGACCGGGAGAGGCGGAGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATC
CCAGGGGGACCGCCAGTGGCGAAGGCGCTCCGCTGGAACGGGTCCGACGGTGAGGGACGA
AGGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGC
TAGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCCGC
CTGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGG
GTGGAGCGTGCGGTTTTAATTGGATTCAACGCCGGGAACCTCACCGGGGGCGACGGCAGG
ATGAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGTCA
GCTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTG
CCAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGA
AGGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAA
TGGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCCCA
GTTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTC
ATCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAG
CGGGGTCTGGATGAGGCCTGGTCTCCCTTCGGGGAG
>GE-25
TGCGAGTCATGGGGCGCCTTGCGCGCACCGGCGGACGGCTCAGTAACACGTCGGTAACCT
ACCCTCGGGAGGGGGATAACCCCGGGAAACTGGGGCTAATCCCCCATAGGCCTGAGGTAC
TGGAAGGTCCTCAGGCCGAAAGGGGCTCTGCCCGCCCGAGGATGGGCCGGCGGCCGATTA
GGTAGTTGGTGGGGTAACGGCCCACCAAGCCGAAGATCGGTACGGGCCATGAGAGTGGGA
GCCCGGAGATGGACACTGAGACACGGGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAAC
51
CTCCGCAATGCGGGAAACCGCGACGGGGGGACCCCCAGTGCCGTGGCATCGCCACGGCTT
TTCCGGAGTGTAAAGAGCTCCGGGAATAAGGGCTGGGCAAGGCCGGTGGCAGCCGCCGCG
GTAATACCGGCGGCCCGAGGTGGTGGCCGCTATTATTGGGCCTAAAGCGTCCGTAGCCGG
GCCCGTAAGTCCCTGGCGAAATCCCACGGCTCAACCGTGGGGCTTGCTGGGGATACTGCG
GGCCTTGGGACCGGGAGAGGCGGAGGGTACCCCTGGGGTAGGGGTGAAATCCTATAATCC
CAGGGGGACCGCCAGTGGCGAAGGCGCTCCGCTGGAACGGGTCCGACGGTGAGGGACGAA
GGCCAGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCTGGCTGTAAAGGATGCGGGCT
AGGTGTCGGGCGAGCTTCGAGCTCGCCCGGTGCCGAAGGGAAGCCGTTAAGCCCGCCGCC
TGGGGAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACTACAAGGGG
TGGAGCGTGCGGTTTAATTGGATTCAACGCCGGGAACCCTCACCGGGGGCGACGGCAGGA
TGAAGGCCAGGCTGAAGGTCTTGCCGGACACGCCGAGAGGAGGTGCATGGCCGCCGTCAG
CTCGTACCGTGAGGCGTCCACTTAAGTGTGGTAACGAGCGAGACCCGCGCCCCCAGTTGC
CAGTCCTCCCCGCTGGGGAGGAGGCACTCTGGGGGGACCGCCGGCGATAAGCCGGAGGAA
GGAGCGGGCGACGGTAGGTCAGTATGCCCCGAAACCCCCGGGCTACACGCGCGCTACAAT
GGGCGGGACAATGGGATCCGACCCCGAAAGGGGAAGGGAATCCCCTAAACCCGCCCCCAG
TTCGGATCGCGGGCTGCAACTCGCCCGCGTGAAGCTGGAATCCCTAGTACCCGCGTGTCA
TCATCGCGCGGCGAATACGTCCCTGCTCCTTGCACACACCGCCCGTCACTCCACCCGAGC
GGGGTCTGGATGAGGCCTGGTCTCCCTCGGGAGGCCGGGTCGA
52