29
BCM-2002 Concepts et méthodes en séquençage génomique et assemblage de séquences B. Franz LANG, Département de Biochimie Bureau: H307-15 Télécopieur: (514) 343-2210 Téléphone: (514) 343-5842 Courrier électronique: [email protected]

BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

  • Upload
    vuphuc

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Page 1: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

BCM-2002

Concepts et méthodes en séquençage génomique et assemblage de séquences

B. Franz LANG, Département de Biochimie Bureau: H307-15Télécopieur: (514) 343-2210Téléphone: (514) 343-5842 Courrier électronique: [email protected]

Page 2: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

Méthodologies biochimiques1. Obtention des organismes et cultures2. Extraction/purification d’ADN intact (haut poids

moléculaire)3. Coupure de l’ADN et purification de morceaux d’ADN

de tailles définies4. Clonage dans plasmides ou autres vecteurs5. Séquençage avec des méthodes différentes:

(Maxam-Gilbert (chimique) ou Sanger: terminaison de synthèse d’ADN avec dideoxi- nucléotides et marquages, soit des amorces, soit des nucléotides intégrées ou des terminateurs)

6. Artefacts de séquençage et assemblage

Page 3: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

• Commande dans les collection de souches d’espèces (ATCC, CCMP …)

• Isolation à partir d’échantillons naturelles• Purification des souches (e.g., mélanges d’eucaryotes et

procaryotes) par séries de dilutions, étalages sur des pétries pour former des colonies séparées, application d’antibiotiques spécifiques

1. Obtention des organismes et cultures

Page 4: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

http://megasun.bch.umontreal.ca/protists/otherprodbs.html

Protist Culture Collections Online

• ACOI: Algoteca de Coimbra (University of Coimbra, Portugal) In English.• Algobank (Université de Caen, France) In French / en français• ATCC: American Type Culture Collection• Brazilian protozoa culture collection• Brazilian algal culture collection• Chlamydomonas Genetics Center strains• CCALA: Culture Collection of Algal Laboratory (Trebon, Czech Republic)• CCAP: Culture Collection of Algae and Protozoa (UK)• CCMP: Provasoli-Guillard Culture Center for Marine Phytoplankton• NEPCC: North East Pacific Culture Collection (University of British Columbia)• SAG: Sammlung von Algenkulturen Göttingen [Collection of algal cultures at the

University of Göttingen] (text in English)• SVCK: Sammlung von Conjugaten-Kulturen (University of Hamburg; list of strains,

text mostly in German)• UTCC: University of Toronto Culture Collection of Algae and Cyanobacteria• UTEX:The Culture Collection of Algae at the University of Texas at Austin

Page 5: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

• Désintégration des cellules– enzymatique (glucanases, cellulases: levures, champignon)– mécanique (billes de verre, compression/décompression,

sonification etc)• Dans le cas des eucaryotes, option d’une séparation des

organites (noyau, mitochondries, chloroplastes, ER …)– centrifugation différentielle– centrifugation cinétique– centrifugation en équilibre (e.g., Percoll)

2. Extraction/purification d’ADN intact(haut poids moléculaires)

Page 6: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

Principes de gradients:

Équilibre: les organites (déposés sur gradient formé de Percoll) et les ADN/ARN (séparés par gradient formé de sels comme CsCl, KI) migrent dans le gradient à la hauteur correspondant àl’égalité des densités: densitéapparente du composé = densitédans le gradient. Avec le Percoll, CsCl ou KI, le gradient se forme pendant la centrifugation à force g élevée.

Cinétique (zonale): les ADN migrent selon la densité du gradient, la force g, et le temps. On peut utiliser des gradients préformés (comme sucrose, glycérol), ou le Percoll.

Page 7: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

2. Extraction/purification d’ADN intact(haut poids moléculaires) cont.

2.1 autres séparations de macromolécules (ADN, ARN, protéines, polysaccharides– digestions avec protéinases, RNase ….– extraction phénol, chloroforme, et autres systèmes de solvants – dialyse – gradient CsCl (équilibre) en présence de substances qui se lient a

l’ADN, dont le fluorochrome bromure d’ étidium (BE), DAPI ou bisbenzimide (BB), qui change la densité apparente de l’ADN selon

• sa conformation (superenroulé/linéaire: BE)• son contenu en A+T/G+C (DAPI, BB)

– électrophorèse par gel d’agarose (grands fragments) ou polyacrylamide (petits fragments)

– chromatographie (affinité ou tamis moléculaires)– électrophorèse en champs pulsés (agarose), pour la séparation de

chromosomes ou fragment d’ADN > 20 kbp

Page 8: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

2. Extraction/purification d’ADN intact(haut poids moléculaires) cont.

gel d’agarose/BE PAGE

Page 9: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

• digestion avec enzymes de restriction, prédiction de la taille moyenne des fragments selon spécificité de l’enzyme et biais de composition de l’ADN – digestions complètes (désavantages: pas de chevauchement de

fragments)– digestions partielle (désavantages: difficile a standardiser, exige

beaucoup d’ADN; avantages: grande taille d’ADN)• mécaniquement par ‘nébulisation’ (i.e., passage de la

solution de l’ADN à travers une capillaire: la viscosité de la solution d’ADN, le pression applique, et le nombre de cycle de passage déterminent la taille moyenne de fragments résultants

• sonification, digestion avec la DNase I (problèmes de biais)

3. Coupure de l’ADN et purification de morceaux d’ADN de tailles définies

Page 10: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

4. Clonage dans plasmides ou autres vecteurs

Ingrédients :• vecteur avec site de coupure

unique• fragments d’ADN génomique

de tailles définies (adéquate pour le vecteur utilisé)

• bouts d’ADN génomique compatible avec vecteur, pour la ligation

• sélection de transformants• sélection d’insertions d’ADN

Page 11: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

4. Clonage dans plasmides ou autres vecteurs

• clonage de bouts francs versus bouts cohésifs

• clonage de fragments PCR/séquençage direct

• vecteurs de clonage alternatifs (M13, phagemides, cosmides, BAC, YAC, phage lambda …)

Page 12: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

4. Clonage dans plasmides ou autres vecteurs

Avantages/désavantages de différents types de vecteurs pour le séquençage génomique

• M13: technologie simple, haute qualité de séquences (produit simples brins), tailles d’insertion très limitées (< 2 kbp)

• Plasmides: technologie simple, tailles d’insertion limitées (< 20 kbp)• Cosmides: tailles d’insertion plus grandes (< 30 kbp), clonage très efficace

mais difficile, plus difficile en séquençage (rendement d’ADN)• BAC (bacterial artificial chromosomes): très populaires, tailles d’insertion

grandes (jusqu’à quelques 100 kbp), mais difficile en séquençage• YAC (yeast artificial chromosomes): peu utilisés, instables, recombinaisions• Phage lambda: tailles d’insertions modeste (< 20 kbp), mais systèmes de

clonage très efficaces (in vitro packaging; sélection positive d’insertions). Souvent utilisé pour le clonage de banque d’ADNc

Page 13: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

Rappel:

• polarité de l’ADN, convention d’écrire les séquences de 5’ à 3’ (ou indiquer la polarité)

• ADN monocaténaire et bicaténaire (M13/phagemidesversus autres vecteurs de clonage)

5. Séquençage avec des méthodes différentes(Maxam Gilbert et Sanger)

Page 14: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Maxam Gilbert et Sanger)

Principes de séquençage (définition selon Maniatis):The two rapid sequencing techniques in current use are the enzymatic method of Sanger et al. (1977) and the chemical degradation method of Maxam and Gilbert (1977). Although very different in principle, these two methods both generate separate populations of (radio- or fluorochrome-) labeled oligonucleotidesthat begin from a fixed residue or combination of residues. …These populations of oligonucleotides are then resolved by electrophoresis under conditions that can discriminate between individual DNAs that differ in length by as little as one nucleotide(PAGE). When the populations are loaded into adjacent lanes of asequencing gel, the order of nucleotides along the DNA can be read directly from an image (radioactive or optical) of the gel.

Page 15: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Maxam Gilbert et Sanger)

5.1 Maxam Gilbert (procédures, les points spécifiques M&G en rouge)• clonage de fragments, purification de l’ADN (plasmides, M13 …)• coupure avec enzymes de restriction• marquages de bouts de fragments d’ADN (radioactif, fluorescent) • séparations de fragments, et purification sur gel

[les deux opérations suivantes servent à générer des molécules d’ADN, dont seulement un brin est marqué]

• deuxièmes clivages avec des enzymes de restriction, et re-purification• alternativement, séparation des deux brins d’ADN après dénaturation,

migration dans gels PAGE semi-dénaturants, et purification d’ADN simple brins

• modifications chimiques partielles (!), spécifiques pour une ou plusieurs nucléotides (voir tableau précèdent)

• clivage par la pipéridine• dissociation des brins d’ADN (!; formamide, chauffage) et séparation sur gel

d’acrylamide haute résolution• autoradiographie ou lecture du signal fluorescent

Page 16: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Maxam Gilbert et Sanger)

Principes de séquençage M&G :

Marquages de fragments d’ADN purifiés:

Page 17: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Maxam Gilbert)

L’ADN est marqué

3-5 réactions de modificationschimiques (partielles)

suivie par le clivage des sites modifiés

Page 18: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Maxam Gilbert)

Les mêmes molécules d’ADN marquées, après clivage des sites modifiés

Page 19: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Maxam Gilbert et Sanger)

Principes de séquençage M&G (figures alternatives):

Page 20: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Maxam Gilbert et Sanger)

5.1 Maxam GilbertPrincipe: coupures chimiques d’ADN (90oC pipéridine, 1M) après diverses

modifications chimiques spécifiques, partielles (!!!)

Page 21: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes (Maxam Gilbert et Sanger)

Devoir pour la prochaine session:Essayez de lire ces trois séquences, et de les identifier et analyser avec les outils que vous connaissez. L’ordre des réactions montrées (Sanger) et G,A,T,C, de gauche a droite

Principe de décodage:Séparation sur gel d’acrylamide haute résolution; concentration de gels entre 3%-20%, selon les positions de nucléotides à lire (dans l’exemple: 3.5 %)

Page 22: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Maxam Gilbert et Sanger)

5.1 Maxam Gilbert, avantages/désavantagés

• Exige beaucoup d’ADN, et la purification de fragments a plusieurs reprises• Lectures relativement courtes sur systèmes de gels manuels• Automatisation n’est pas disponible (séquenceurs)• Utilisation de M&G pour ‘footprinting’ (parties de l’ADN protégées par des

protéines liées ne seront pas modifiées et clivées)

• La méthodologie de séquençage Sanger n’exige peu ou pas de purification de matrices d’ADN, aucune coupure avec des enzymes de restriction, et aucun marquage de l’ADN a séquencer.

Page 23: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes

5.2 Sanger, terminaison d’une polymerisation avec des ADN polymérases, en présence de déoxi- et dideoxinucléotides(procédures, les points spécifiques en rouge)

• Clonage de fragments, purification de l’ADN (plasmides, M13 …), ou purification de n’importe quel ADN génomique, produit PCR … en bonne concentration

• Dissociation de l’ADN et hybridation avec amorce(s) synthétiques (qui pourraient être marquées,e.g., pour séquençage sur LiCOR)

• Deux amorces peuvent être utilisées (par example, ‘forward’ et ‘reverse’) si le système de détection est capable de distinguer des marquages avec des fluorescent différent (LiCOR)

• Élongation de l’amorce avec ADN polymérase (T7, Taq, Thermosequenase…), en présence d’un mélange bien balancé de déoxi- et dideoxinucléotides(les nucléotides ou les terminateurs dideoxi pourraient être marqués; technologie terminateurs sur séquenceurs MJ, ABI)

• dissociation des brins d’ADN (!; formamide, chauffage) et séparation sur gel d’acrylamide haute résolution (gel horizontaux ou verticaux; capillaires)

• autoradiographie, ou lecture du signal fluorescent par séquenceurs

Page 24: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Sanger)

Principes de séquençage SangerPolymérisation avec ADN polymérase, en presence des 4 dNTP, et d’une quantité limitée de ddNTP, a partir d’une amorce synthétique.Ici: la réaction avec ddTTP.

Page 25: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Sanger)

Principes de séquençage SangerSchéma des réactions avec 4 ddNTP.

Page 26: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Sanger)

Page 27: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

5. Séquençage avec des méthodes différentes(Sanger)

Page 28: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

• L’ADN dénaturé se replie sur elle-même, après avoir chargé le gel de séquençage

– raison: structures secondaires, surtout dans les régions d’ADN hautement structuré et riche en G+C)

– effet: zones de ‘compressions’ dans l’échelle de séquençage – mesures a prendre: (i) séquencer l’ADN sur les deux brins, donc dans

les deux directions; alors les artefacts ne se trouve pas exactement aux même positions de la séquence (asymétrie dans le repliement des deux brins); (ii) dans le cas de Sanger, utiliser des nucléotides dans le séquençage, qui minimisent la formation de structure secondaire (i.e., leur énergie de formation), dont les déazaNTP, déazadITP, ou ITP (les derniers, au lieu de dGTP)

6. Artefacts de séquençage et assemblage

Page 29: BCM-2002-SEPT2004 -  · (Maxam Gilbert et Sanger) Principes de séquençage (définition selon Maniatis): The two rapid sequencing techniques in current use are the enzymatic method

• L’échelle de séquençage fini prématurément ou contient des ‘trous’

– raisons: (i) réactions de séquençage avec trop de modifications chimiques (M&G) ou trop de terminateurs (Sanger); (ii) zone d’ADN avec biais de nucléotides, surtout, longues séries de A ou T qui cause que certaines polymérases décrochent de leurs matrice de synthèse (Sanger)

– mesures a prendre: (i) adapter les réactions; (ii) utiliser d’autre polymérases comme la T7 DNA polymérase, qui ne permet pas un cyclage de réactions comme dans le PCR (ce qui est couramment utilisépour les réactions de séquençage Sanger); la méthode Maxam Gilbert n’est pas affectée par cet artefact

6. Artefacts de séquençage et assemblage