Upload
doque
View
217
Download
0
Embed Size (px)
Citation preview
Clonage de fragments d’ADN
• Qu’est-ce que le clonage ? Quel objectif dans le cas
d’une séquence d’ADN ?
• La technique de l’ADN recombinant
30
Polycopié p.2
Polycopié p.2
Principe de l’établissement d’une carte de restriction
Polycopié p.2
Polycopié p.3
Clonage par fabrication d’un adn recombinant
VECTEURS DE CLONAGE ET CELLULES HÔTES
Type de ve cteur Taille de l'ADN exogène insérable Cellule-hôte
Plasmide 8 à 9 kb bactérie ou levure (selon le plasmide)
Bactériophage :
- insertion simple
- insertion par délétion/remplacement
1 à 12 kb
8 à 22 kb
bactérie
bactérie
Cosmide 45 kb bactérie et/ou levure (selon le cosmide)
Chromosome artificiel de bactéries BAC 50 à 300 kb (en moyennne : 150 kb) bactérie
Chromosome artificiel dér ivé du phage P1 PAC 50 à 300 kb (en moyennne : 150 kb) bactérie
Chromosome artificiel de levure YAC 150 à 1 000 kb levure
Plan du premier Chapitre
I-Organisation des génomes et structure des gènes
A-Définition et organisation générale des génomes eucaryotes et procaryotes
B- Les différents types de séquences présentes dans les génomes
C-Principes de quelques techniques de manipulation des génomes
1. Amplification de l'ADN: PCR et clonage
2. Banque d'ADN génomique et banque d'ADNc
3. Utilisation de l'hybridation moléculaire pour identifier une séquence
particulière
4. Principales méthodes de séquençage des génomes
5. Annotation des génomes
D- Etat des lieux des projets de séquençage
E- Notion de gène et structure des gènes
35
CONSTRUCTION D’UNE BANQUE GENOMIQUE …
Découpage de l'ADN en fragments (digestion enzymatique ménagée
ou fragmentation mécanique)
Gène b-lactamase résistance à l’ampicilline
Gène lacZ
Site de clonage (polylinker)
Origine de réplication
Promoteur-opérateur lacZ
Plasmide pUC18 (2 686 pdb)
Ì Ouverture du vecteur de clonage (ici un plasmide) au niveau d'un site uniquedu polylinker
(flèche noire)
Isolement et purification de l'ADN génomique (très grand nombre de cellules)
3 gènes différents
Insertion de chaque fragment dans un vecteur = LIGATION obtention de vecteurs recombinés et non recombinés
Polycopié p. 4
… CONSTRUCTION D’UNE BANQUE GENOMIQUE
Î Intégration de chaque vecteur dans une cellule-hôte adaptée = TRANSFORMATION
obtention de cellules transformées et non transformées
Ï Sélection des cellules transformées avec un vecteur par un crible adapté
ici, résistance à l’ampicilline
Ñ Culture des cellules sélectionnées : formation de clones cellulaires
l'ensemble des clones forme une banque d'ADN génomique, représentative de toutes les séquences de ce génome
…
Clone A
…
Clone D
…
Clone C
…
Clone B
…
Clone E
Sélection des cellules transformées avec un vecteur recombiné par un crible adapté
ici, crible "blanc-bleu »
b-galactosidase
X-gal produit bleu
Polycopié p. 4
Plan du premier Chapitre
I-Organisation des génomes et structure des gènes
A-Définition et organisation générale des génomes eucaryotes et procaryotes
B- Les différents types de séquences présentes dans les génomes
C-Principes de quelques techniques de manipulation des génomes
1. Amplification de l'ADN: PCR et clonage
2. Banque d'ADN génomique et banque d'ADNc
3. Utilisation de l'hybridation moléculaire pour identifier une séquence
particulière
4. Principales méthodes de séquençage des génomes
5. Annotation des génomes
D- Etat des lieux des projets de séquençage
E- Notion de gène et structure des gènes
Détection d’un ARNm
particulier dans des
méristèmes axillaires chez le
maÏs (sonde ADN dénaturée)
40
Polycopié p. 5
I-Organisation des génomes et structure des gènes
A-Définition et organisation générale des génomes eucaryotes et procaryotes
B-Principes de quelques techniques de manipulation des génomes
1. Amplification de l'ADN: PCR et clonage
2. Banque d'ADN génomique et banque d'ADNc
3. Utilisation de l'hybridation moléculaire pour identifier une séquence particulière
4. Principales méthodes de séquençage des génomes
5. Annotation des génomes
C- Etat des lieux des projets de séquençage
D- Les différents types de séquences présentes dans les génomes
E- Notion de gène et structure des gènes
Mélange réactionnel:
- le fragment qui doit être séquencé
- un petit morceau d'ADN dont la séquence est complémentaire à
l'extrémité 3' du fragment à séquencer = amorce
- les 4 dNTP's (dCTP, dATP, dGTP, dTTP)
- Une ADN polymérase
PROTOCOLE INITIAL
(ce peut être le vecteur)
Méthode de
Sanger
5’P 3’OH
ADN
Didésoxynucléotides
(1%)
45
SEQUENÇAGE DES GENOMES : METHODE DE SANGER
5'P
C T C G A G T A C C A G A C G C G………………………… 5'P 3'OH
Amorce marquée (32P ou fluorochrome) 5'P
+ ADN polymérase
+ 4 dNTP, dont dTTP
+ 1 ddNTP (ici, ddTTP)
C T C G A G T A C C A G A C G C G………………………… 5'P
3'OH
G A G C T3‘H
Séquence complémentaire à celle de l’amorce (primer)
sur le brin matrice
permettra la
détection
visuelle ou
par détection
de la
fluorescence,
de chaque
fragment
d’ADN
synthétisé)
didésoxynucléotide
SEQUENÇAGE DES GENOMES : METHODE DE SANGER
G A G C T C A T3'H 5'P
C T C G A G T A C C A G A C G C G………………………… 5'P 3'OH
Amorce marquée (32P ou fluorochrome) 5'P
+ ADN polymérase
+ 4 dNTP, dont dTTP
+ 1 ddNTP (ici, ddTTP)
C T C G A G T A C C A G A C G C G………………………… 5'P
3'OH
G A G C T3'H 5'P
ou
SEQUENÇAGE DES GENOMES : METHODE DE SANGER
C T C G A G T A C C A G A C G C G………………………… 5'P 3'OH
G A G C T C A T G G T3'H
Amorce marquée (32P ou fluorochrome) 5'P
+ ADN polymérase
+ 4 dNTP, dont dTTP
+ 1 ddNTP (ici, ddTTP)
C T C G A G T A C C A G A C G C G………………………… 5'P
3'OH
5'P
G A G C T C A T3'H 5'P
G A G C T3'H 5'P
ou
ou
SEQUENÇAGE DES GENOMES OU DE RÉGIONS
PARTICULIÈRES : METHODE DE SANGER
C T C G A G T A C C A G A C G C G………………………… 5'P 3'OH
Amorce marquée (32P ou fluorochrome) 5'P
+ ADN polymérase
+ 4 dNTP, dont dTTP
+ 1 ddNTP (ici, ddTTP)
C T C G A G T A C C A G A C G C G………………………… 5'P
3'OH
5'P G A G C T C A T G G T C T3'H
G A G C T C A T G G T3'H 5'P
G A G C T C A T3'H 5'P
G A G C T3'H 5'P
ou
ou
ou
SEQUENÇAGE DES GENOMES OU DE RÉGIONS
PARTICULIÈRES : METHODE DE SANGER
C T C G A G T A C C A G A C G C G………………………… 5'P 3'OH
Amorce marquée (32P ou fluorochrome) 5'P
+ ADN polymérase
+ 4 dNTP, dont dTTP
+ 1 ddNTP (ici, ddTTP)
C T C G A G T A C C A G A C G C G………………………… 5'P
3'OH
5'P G A G C T C A T G G T C T3'H
G A G C T C A T G G T3'H 5'P
G A G C T C A T3'H 5'P
G A G C T3'H 5'P
ou
ou
ou
Electrophorèse sur gel d‘acrylamide (pour la photo ci-dessous) mais sur tubes capillaires dans gel polymère maintenant
C G C G T C T G G T A C T C G A G
3’OH
+ ddATP
+ ddCTP
+ ddGTP
+ ddTTP
5’P
Polycopié p. 6
METHODE AUTOMATIQUE DE SEQUENÇAGE permettra la
détection
visuelle ou
par détection
de la
fluorescence,
de chaque
fragment
d’ADN
synthétisé)
5’ 3’
A C
T
A
G
? ?
Polycopié p. 6
50
STRATEGIE DE SEQUENÇAGE GENOMIQUE ALEATOIRE
("SHOT-GUN")
d’après Klug W. et al. "Génétique" (Eds. Pearson Education, 8eme édition, 2006)
Fragmentation ménagée mécanique ou enzymatique
Obtention de fragments d’ADN partiellement chevauchants
Construction d’une banque génomique
Extraction de l’ADN (très grande nombre de copies)
Séquençage de clones pris au hasard dans la banque
Assemblage des séquences par bio-informatique
(algorithmes d’assemblage)
d’où l’importance d’obtenir des fragments d’ADN
chevauchants lors de la construction de la banque génomique.
Séquences
réellément
Obtenues
(parmi des
millions) de
séquences
Séquence
reconstituée par
assemblage
= contig
Pour en savoir plus : cf.
Précis de génomique,
Gibson et Muse, De
Boek Editions
I-Organisation des génomes et structure des gènes
A-Définition et organisation générale des génomes eucaryotes et procaryotes
B-Principes de quelques techniques de manipulation des génomes
1. Amplification de l'ADN: PCR et clonage
2. Banque d'ADN génomique et banque d'ADNc
3. Utilisation de l'hybridation moléculaire pour identifier une séquence particulière
4. Principales méthodes de séquençage des génomes
5. Annotation des génomes
C- Etat des lieux des projets de séquençage
D- Les différents types de séquences présentes dans les génomes
E- Notion de gène et structure des gènes
ET UNE FOIS QU’ON A LA SEQUENCE?
5'...GCAACAGCGATCTTTCCGTCGCACAAGTTAAAAGAAATTGTTGAAAAATACAAATAATCGCGAACAATACGTTGTTGCTATTTAACGCTTTTGGTCTGACA
GTAAGTGTGCCTTTCCCAATCACCGAAAAGTGTTGAACGATTCACTGCGACAATAATCAGAGATTACAGTCGGCATTTTGGCATTTTTGGCATACTTTTTATCGAT
TGAACCATCTTCTCCAAACACTTTTCCTTTTTCCTTCTATTCTGCAGGACCAACTAAAACTGGGTATATATATCATTATCTATATATATAAACGGCTTTCAACAAA
GTTATAGGGGAAAACTAAAAATATAAGAAAAAAAAAGGTATTGATTGATAAGGAAAAAGAACCAAGGGAAAAATATAAAAAAGTACATTGGGCCTTTTCATACTTG
TTATCACTTACATTACAAAGAAGAACAAACAACTTTTTTAAACGAATTTTCTTTCTTCCTTTTTCAATTTATTAATTCTTTTTTTCCATACAATTCAAGGTCAAAT
ATATTCTTATATGCTCTTTGAATATTTCTGAAAAATATATAAAGAAAAGAAACTACAAGAACATCATCCGGAAAATCAGATTATAGACTAGGATTCCGCTCTTTTT
AGTATATTTATTCGCCACACCTAACTGCTCTATTATTCGCTCATTATGGACGCTTACTCCACAAGACCATTAACCCTATCTCACGGTTCTTTAGAGCACGTGCTTC
TGGTACCAACCGCTTCATTTTTCATTGCTTCGCAATTACAAGAACAATTTAATAAAATTTTGCCCGAACCCACTGAAGGGTTTGCTGCAGATGACGAGCCTACCAC
ACCTGCTGAACTAGTGGGGAAATTCCTTGGCTACGTATCTTCTCTAGTCGAACCTTCCAAGGTCGGTCAATTCGATCAGGTCTTGAACCTTTGCTTAACAGAATTT
GAAAACTGTTATTTAGAAGGCAATGACATTCACGCCTTGGCTGCTAAACTATTACAGGAAAACGACACAACTTTAGTGAAGACTAAAGAACTAATTAAAAATTATA
TTACCGCCAGAATAATGGCTAAGAGACCATTTGACAAAAAATCCAACTCTGCTCTTTTTAGGGCCGTCGGCGAGGGTAACGCACAATTGGTAGCCATTTTCGGTGG
TCAAGGTAACACCGACGACTACTTTGAAGAATTGCGTGATCTATATCAAACTTATCATGTCTTAGTGGGAGATTTAATCAAGTTCTCCGCTGAAACTTTAAGTGAA
CTGATTAGAACTACTTTAGATGCTGAAAAAGTCTTTACTCAAGGTTTAAACATATTGGAATGGTTGGAGAACCCTTCAAATACCCCAGACAAGGACTATTTACTTT
CCATTCCAATTTCATGCCCCTTAATTGGTGTCATTCAATTGGCTCACTACGTAGTTACTGCCAAGCTTTTGGGTTTCACTCCAGGTGAGTTAAGATCTTACTTAAA
AGGTGCTACAGGTCACTCTCAAGGTTTGGTTACTGCTGTCGCCATAGCTGAGACGGATTCCTGGGAATCCTTCTTCGTCTCCGTAAGAAAAGCAATTACTGTATTA
TTCTTCATCGGTGTTCGTTGTTACGAAGCATACCCAAACACTTCCCTACCACCATCCATCTTGGAAGATTCCTTGGAAAACAATGAAGGTGTTCCATCTCCAATGT
TGTCCATTTCCAATCTAACTCAAGAACAAGTTCAAGACTATGTAAATAAGACTAACTCTCATTTGCCAGCTGGTAAACAAGTTGAAATTTCTCTAGTCAATGGTGC
GAAGAATCTAGTCGTATCGGGCCCACCACAATCATTATATGGTTTAAACTTGACTTTAAGAAAGGCCAAGGCCCCATCTGGACTGGATCAATCAAGAATCCCATTC
AGCGAAAGAAAATTGAAGTTCTCCAATAGGTTCTTACCTGTTGCATCACCATTCCATTCCCATCTATTGGTTCCAGCTTCAGATTTGATTAACAAAGACTTAGTCA
AAAACAATGTCAGCTTTAACGCTAAAGATATTCAAATCCCCGTTTACGACACTTTTGATGGTTCAGATCTAAGAGTCCTTTCAGGTTCCATTTCCGAGAGAATCGT
CGACTGCATCATTAGATTACCTGTCAAATGGGAAACTACTACACAATTCAAAGCCACCCACATATTAGACTTTGGTCCAGGTGGAGCTTCCGGTTTAGGTGTTTTA
ACCCATCGTAATAAAGATGGTACTGGTGTTCGTGTTATCGTTGCCGGTACTCTCGACATTAACCCAGATGATGATTACGGATTCAAGCAAGAAATCTTTGATGTTA
CTAGTAATGGTTTGAAGAAAAATCCAAACTGGTTGGAAGAATACCATCCAAAATTAATTAAGAACAAATCAGGCAAAATTTTTGTCGAAACAAAATTTTCTAAATT
AATCGGTAGACCACCTTTATTGGTTCCTGGTATGACACCATGTACTGTTTCTCCAGATTTCGTAGCTGCTACCACAAATGCTGGTTATACCATTGAGTTGGCCGGT
GGTGGTTACTTTTCCGCAGCAGGTATGACCGCCGCTATTGATTCTGTGGTTTCTCAGATAGAAAAGGGTAGTACCTTCGGTATCAACTTGATCTACGTCAATCCAT
TTATGTTACAATGGGGTATTCCATTAATCAAGGAACTAAGAAGCAAAGGTTATCCAATTCAATTCTTGACCATTGGTGCTGGTGTCCCATCATTGGAAGTTGCTAG
TGAATACATAGAGACATTAGGTTTGAAGTACTTGGGTTTGAAACCAGGTTCCATTGATGCTATTTCGCAAGTTATAAACATTGCTAAAGCACATCCAAACTTCCCA
ATAGCTTTACAATGGACCGGTGGTAGAGGTGGTGGTCATCATTCTTTCGAAGATGCCCACACTCCAATGTTACAAATGTACTCCAAGATTAGAAGACATCCAAACA
TTATGTTGATATTCGGTTCTGGTTTCGGTTCTGCTGATGACACTTACCCATACTTAACCGGTGAATGGTCCACAAAATTCGATTATCCACCAATGCCATTC...3'
Séquence très partielle (environ 3 000 nucléotides) du chromosome XI (longueur totale 666 454 pdb)
de la levure Saccharomyces cerevisiae
(Par convention, la séquence d’un seul brin est indiquée en orientation 5’-3’)
L’ANNOTATION DES GENOMES
L’annotation des génomes est l’identification des séquences qui composent un génome :
• gènes codant des protéines et leurs séquences de régulation
• gènes permettant la synthèse d’ARN (ARNr, ARNt, ARNmi, …)
• séquences répétées (éléments mobiles, minisatellites, microsatellites, …)
Pour cela, il faut disposer d’outils adaptés.
EXEMPLE : IDENTIFICATION DE SEQUENCES CODANTES (CDS)
PAR LE LOGICIEL DNA STRIDER (il existe d’autres logiciels, tel que ORF-Finder
http://www.ncbi.nlm.nih.gov/…..)
Taille du fragment analysé en nombre de nucléotides
Les petits traits verticaux correspondent au codon AUG et les grands traits verticaux aux codons de terminaison de la traduction.
500
500
1000
1000
1500
1500
2000
2000
2500
2500
3000
3000
3> 3>
2> 2>
1> 1>
<1 <1
<2 <2
<3 <3
5' 3'
cf. TD2 55
Tiré de : Biologie Moléculaire de la Cellule, Alberts
I-Organisation des génomes et structure des gènes
A-Définition et organisation générale des génomes eucaryotes et procaryotes
B- Les différents types de séquences présentes dans les génomes
C-Principes de quelques techniques de manipulation des génomes
1. Amplification de l'ADN: PCR et clonage
2. Banque d'ADN génomique et banque d'ADNc
3. Principales méthodes de séquençage des génomes
4. Annotation des génomes
5. Utilisation de l'hybridation moléculaire pour identifier une séquence particulière
D- Etat des lieux des projets de séquençage
E- Notion de gène et structure des gènes
Polycopié p. 7
Tiré de Biologie
Moléculaire de la
cellule, Alberts
4,6.106 pdb
Mais peut aller jusqu’à 5,7 Mpb pour certaines souches. D’autres ont un génome < 3 Mpb
Certaines souches d’E.Coli possèdent moins 50% de gènes en commun;
“Sixty-one publically available E. coli and Shigella spp. sequenced genomes are
compared to identify the pan- and core genomes of this set of sequenced strains.
The predicted pan-genome comprises 15,741 gene families, and only 993 (6%) of the
families are represented in every genome (entre 4000 et 6000 gènes environ par
souche), comprising the core genome. The variable or ‘accessory’ genes thus make
up more than 90% of the pan-genome and about 80% of a typical genome; some of
these variable genes tend to be co-localized on genomic islands.
The diversity within the species E. coli, and the overlap in gene content between this
and related species, suggests a continuum rather than sharp species borders in this
group of Enterobacteriaceae”.
Lukjancenko, O., Wassenaar, T. M., & Ussery, D. W. (2010). Comparison of 61 sequenced Escherichia coli
genomes. Microbial ecology, 60(4), 708-720.
GENOMIQUE COMPARATIVE ET EVOLUTIVE
chez les procaryotes
Lukjancenko, O., Wassenaar, T. M., & Ussery, D. W. (2010). Comparison of 61 sequenced Escherichia coli
genomes. Microbial ecology, 60(4), 708-720.
60
GENOMIQUE COMPARATIVE ET EVOLUTIVE
Quel est le pourcentage d’identité de séquences de votre génome avec celui de :
La mouche du vinaigre
(Drosophila melanogaster)
36%
L’arabette des dames
(Arabidopsis thaliana)
26%
Une levure
(Saccharomyces cerevisiae)
23%
Une bactérie
(Escherichia coli)
7%
Un ver rond
(Caenorhabditis elegans)
21%
Georges Clooney
(Homo sapiens)
99,9% (et 99,5% avec
Neanderthal*)
La souris
(Mus musculus)
90%
Le poisson zèbre
(Danio rerio)
85%
Le chimpanzé
(Pan troglodytes)
99%
* : Noonan, et al., (2006). Sequencing and analysis of Neanderthal genomic DNA. science,
314 : 1113-1118
Plan du premier Chapitre
I-Organisation des génomes et structure des gènes
A-Définition et organisation générale des génomes eucaryotes et procaryotes
B- Les différents types de séquences présentes dans les génomes
C-Principes de quelques techniques de manipulation des génomes
1. Amplification de l'ADN: PCR et clonage
2. Banque d'ADN génomique et banque d'ADNc
3. Utilisation de l'hybridation moléculaire pour identifier une séquence
particulière
4. Principales méthodes de séquençage des génomes
5. Annotation des génomes
D- Etat des lieux des projets de séquençage
E- Notion de gène et structure des gènes
Genes X, Lewin
G. Mendel, mais le terme « gène » est crée
par W. Johannsen en 1909
T. Morgan (premières cartes génétiques)
Sharp et Roberts
W. Sutton
Avery, Mc Leod et Mc Carty
Watson, Crick et Wilkins
Beadle et Tatum : un gène, une enzyme
Meselson et Stahl
Crick , Barnett , Brenner S et Watts-Tobin
2
LE CODE GENETIQUE
U C A G
U
Phe F
Phe F
Leu L
Leu L
Ser S
Ser S
Ser S
Ser S
Tyr Y
Tyr Y
STOP
STOP
Cys C
Cys C
STOP
Trp W
U
C
A
G
C
Leu L
Leu L
Leu L
Leu L
Pro P
Pro P
Pro P
Pro P
His H
His H
Gln Q
Gln Q
Arg R
Arg R
Arg R
Arg R
U
C
A
G
A
Ile I
Ile I
Ile I
Met M
Thr T
Thr T
Thr T
Thr T
Asn N
Asn N
Lys K
Lys K
Ser S
Ser S
Arg R
Arg R
U
C
A
G
G
Val V
Val V
Val V
Val V
Ala A
Ala A
Ala A
Ala A
Asp D
Asp D
Glu E
Glu E
Gly G
Gly G
Gly G
Gly G
U
C
A
G
1ere base du codon
(5')
2eme base du codon
3eme base du codon
(3')
Propriétés du code génétique
• redondant (ou dégénéré)
• non ambigü
• universel (ou quasi)
• un codon initiateur de la
traduction
5’AUG3’
• trois codons STOP
5’UAG3’, 5’UAA3’, 5’UGA3’
Séquence codante de l’ARNm (celle qui est traduite)
QU’EST-CE QU’UN GENE?
Genome Research, septembre 2007
Polycopié p. 8
Brin ADN codant = brin sens
= brin non transcript = brin (+)
Brin ADN anti-sens = brin
négatif = brin transcript en
ARN = brin (-)
Sens de transcription
From genes to genomes, Dale
Séquence consensus = version de la séquence considérée qui
présente à chaque position dans la séquence le nucléotide (ou
l’a.a) qui est le plus fréquemment trouvé à ce site
REGULATION DE L’EXPRESSION DES GENES
d’après Klug W. et al. "Génétique" (Eds. Pearson Education, 8eme édition, 2006)
• chez les Eucaryotes : gène régulé codant une protéine
• chez les Procaryotes : opéron lactose d’Escherichia coli
Chez Eucaryotes:
Les ARN polymérases sont incapables
de se fixer par elles mêmes aux
promoteurs. Elles doivent être recrutés
par des facteurs de transcription
Biologie Moléculaire du gène, Watson
STRUCTURE ET EXPRESSION D’UN GENE EUCARYOTE
3’OH
5’P
Promoteur
CAAT TATA
Séquences de
régulation
ATG STOP
Exon 1 Exon 2 Exon 3 Intron 1 Intron 2
T
Signal de
polyAdénylation
TSS Sens de transcription
Région transcrite du gène
C
5’P 3’OH Exon 1 Exon 2 Exon 3 Intron 1 Intron 2
Ct Nt
Nt Ct
3’ UTR
AAAAAAAAA... 3’OH Exon 3 OHGP Exon 1 Exon 2
5’ UTR CDS
AUG STOP
Brin codant (sens)
Brin matrice de la
transcriptio, (antisens)
5’P
3’OH
Précurseur protéique
Protéine mature
ARN messager mature
Excision/épissage nucléaires
Transcription nucléaire
Traduction cytoplasmique
Maturation cytoplasmique
ARN pré-messager
avec coiffe et queue poly A
GENE
(ADN chromosomique)
OHGP Exon 1 Intron 1 Intron 2 AAAAAAAAA... 3’OH Exon 3 Exon 2
AUG STOP
SD SA PB SD SA PB
Polycopié p. 9
Maturation des ARNm chez les Eucaryotes :
- Ajout de la coiffe en 5’
- Polyadénylation en 3’ (un des signaux = AAUAAA entre
10 et 30 nt en amont du site de coupure du pré-messager)
-Epissage (pour les gènes avec introns (pour
« intervening sequences »)
La coiffe joue trois fonctions :
-Protection de l’ARN pré-mature (puis de
l’ARNm) vis-à-vis des exonucléases
-Exportation de l’ARNm vers le cytoplasme
- Reconnaissance par le ribosome
Biologie Moléculaire du gène, Watson
Tiré de : Genes X,
Lewin
MAIS TOUT N’EST PAS SI SIMPLE....! 1
L’intron 26 (40 kb) du gène de la neurofibromateuse humaine de type I (NF1) contient 3
gènes internes composés chacun de 2 exons et d’1 intron. Ces gènes sont :
• OGMP : oligodendrocyte myelin glycoprotein
• EV12A et EV12B : homologues de gènes murins impliqués dans la leucémogenèse
Il faut noter que ces 3 gènes internes sont transcrits sur le brin complémentaire à celui qui
est utilisé pour la transcription du gène NF1.
MAIS TOUT N’EST PAS SI SIMPLE....! 2
AAAAAAAAA... 3’OH
Ct Nt
Nt Ct
3’ UTR
AAAAAAAAA... 3’OH Exon 3 OHGP Exon 1 Exon 2
5’ UTR CDS
AUG STOP
Précurseur protéique 1
Protéine mature 1
ARN messager mature 1
Excision/épissage nucléaires
Traduction cytoplasmique
Maturation cytoplasmique
ARN pré-messager
avec coiffe et queue poly A OHGP Exon 1 Intron 1 Intron 2 Exon 3 Exon 2
AUG STOP
SD SA PB SD SA PB
MAIS TOUT N’EST PAS SI SIMPLE....! 2
AAAAAAAAA... 3’OH
Ct Nt
Nt Ct
3’ UTR
AAAAAAAAA... 3’OH Exon 3 OHGP Exon 1 Exon 2
5’ UTR CDS
AUG STOP
Précurseur protéique 1
Protéine mature 1
ARN messager mature 1
Excision/épissage nucléaires
Traduction cytoplasmique
Maturation cytoplasmique
ARN pré-messager
avec coiffe et queue poly A OHGP Exon 1 Intron 1 Intron 2 Exon 3 Exon 2
AUG STOP
SD SA PB SD SA PB
Protéine mature 2
ARN messager mature 2
Excision/épissage nucléaires
Traduction cytoplasmique
ARN pré-messager
avec coiffe et queue poly A AAAAAAAAA... 3’OH
Ct Nt
OHGP Exon 1
5’ UTR
AUG
3’ UTR
AAAAAAAAA... 3’OH Exon 3
CDS
STOP
OHGP Exon 1 Intron 1 Intron 2 Exon 3 Exon 2
AUG STOP
SD SA PB
Et aussi, par épissage alternatif :
QU’EST-CE QU’UN GENE?
Genome Research, septembre 2007
Une définition possible...
Un gène est une séquence nucléotidique permettant la synthèse d’un (ou plusieurs)
produits diffusibles (ARN ou protéine), ayant une fonction précise dans la cellule. Un gène
est constitué d’une région transcrite, associée à des séquences permettant la régulation
de sa transcription.