Roberto GambariBiochimica applicataLezione 10
Sequenziamento del DNA
2. PRODUZIONE DEL DNA RICOMBI NANTE E INGEGNERIA GENETICA A. Il fenomeno restrizio ne: cenni sul ciclo litico del batteriofago lambda. B. Gli enzimi di restrizione: nome nclatura, purificazione, saggio di funzionalità, siti di riconoscimento (sequenze palindromiche), enzimi che tagliano il DNA generando estremità "coesive" (EcoRI, BamHI); enzimi che tagliano il DNA generando estremità "piatte" (HaeIII); efficienza della reazione tra enzima di restrizione e DNA: concentrazione salina, qualità del DNA substrato, temperatura, mappe di restrizione; digestione completa e digestione parziale del DNA. C. Riassociazione intramolecolare e intermolecolare; la DNA ligasi; clonaggio utilizzando DNA con estremità coesive; clonaggio utilizzando code omopolimeriche: meccanismo d'azione della trasferasi terminale, uso della lambda-esonucleasi, ricostituzione del sito PstI; clonaggio utilizzando molecole linker. D. Vettori del DNA ricombinan te: plasmidi, siti singoli per enzimi di restrizione, trasformazione del batterio e inattivazione inserzionale, selezione dei plasmidi ricombinanti con antibiotici, pBR322; vettori del DNA ricombinante: il DNA del ba tteriofago lambda: i geni del batteriofago lambda, regioni indispensabili per il ciclo litico e il ciclo lisogenico, vettori a rimpiazzo (lambda gtWES) e v ettori ad inserzione (Charon). E. Produzione di genoteche e cDNA teche. F. Screening di genot eche o cDNA teche: ibridazione con sonde specifiche di DNA, HART (hybrid arrested tr anslation), selezione positiva di mRNA e traduzione in vitro, utilizzo di anticorpi monoclonali, utilizzo di oligonucleotidi a doppia elica per identificare sequenze codificanti per fattori di trascrizione, utilizzo della sequenza aminoacidica codificata dal gene da identificare. G. Sequenziamento del DNA ricombinante clonato: M13, sequenziamento secondo Sanger, sequenziamento progressivo.
• Doppia elica formata da due filamenti di ac. nucleico uniti da ponti ad idrogeno• Acido nucleico: catena di nucleotidi• Nucleotide: nucleoside + ac. fosforico• Nucleoside: desossiribosio + base azotata • Basi azotate: adenina, citosina, guanina e timina
Sequenziamento: individuazione della
successione delle basi azotate nel filamento di acido nucleico
Struttura del DNA
Le basi azotate
• Complementarità fra i due filamenti:
A-TA-TG-CG-C
Struttura del DNA
La sequenza del DNA contiene tutte le informazioni genetiche ereditarie che sono la base per lo sviluppo di tutti gli organismi
viventi.
All’interno di questa sequenza sono codificati i geni, nonché le istruzioni per esprimerli nel tempo e nello spazio
Determinarne l’esatta sequenza è dunque utile nella ricerca del perché e del come gli organismi vivono
Sequenziamento genicoSequenziamento genico
Date storiche della sequenza del DNA
1869
Miescher osservaper la prima volta il DNA
1953 Watson e Crick determinano lastruttura della doppia elica
1944Avery propone il DNA come materiale genetico
1965Holley sequenza il tRNAdi lievito
1970
Vengono sviluppate le tecnicheper la sintesi degli oligonucleotidi e perla degradazione chimica del DNA. Viene introdotta l’elettroforesi su gel per la Separazione di frammenti di DNA
1980 Il DNA genomico viene clonato nel fago M13 o in vettori plasmidici, nascono i primi programmi informatici di analisi dei dati, vengono sviluppate nuove tecnologie per il sequenziamento
1977
METODO SANGER(terminazione di catena)METODO MAXAM-GILBERT(degradazione chimica)
1986KARY MULLISIntroduce la PCR 1989
AUTOMAZIONE PARZIALEVengono sviluppate le prime apparecchiatureper il sequenziamento che impiegano sistemi per la rilevazione della fluorescenza.
2000Automazione completaSequenziamento completodel genoma umano
-Metodo di Maxam e Gilbert(della degradazione chimica del DNA)
-Metodo di Sanger(a terminazione di catena)
-Pyrosequencing(sequenziamento ad elevato parallelismo)
Tecniche di sequenziamento del DNA
Il metodo Sanger (o metodo a terminazione di catena)
Il sequenziamento secondo il metodo di Sanger, nella variante chiamata “a ciclo termico”, consisteva nella sintesi di nuovi filamenti di DNA, complementari al DNA stampo
• La sintesi del DNA si eseguiva in 4 provette diverse e ciascuna richiedeva :
- -Una piccola quantità di DNA stampo a doppio filamento;
-Un innesco specifico (un solo primer) complementare al filamento da sequenziare;
-L’enzima Taq DNA polimerasi
-Una miscela dei 4 dNTP di cui uno marcato (con 35S o 32P) per la visualizzazione finale dei filamenti di nuova sintesi dopo elettroforesi
- 1 terminatore di catena: ddNTP , diverso per ciascuna delle 4 reazioni
ddNTPs :dideossinucleotidetifosfatoNucleotide, detto terminatore, che blocca l’allungamento del
filamento di acido nucleico poiché la mancanza del gruppo ossidrilico in 3’ impedisce l’attacco all’acido fosforico del nucleotide successivo
ddNTPddNTP
dNTPdNTP
I nuovi frammenti di DNA prodotti, chiamati anche “frammenti di Sanger”, sono prodotti mediante amplificazione lineare di una piccola quantità di DNA stampo, utilizzando i cicli termici della PCR
•La reazione incomincia con la denaturazione del DNA stampo
• l’annealing del primer
•La Taq polimerasi incomincia la sintesi del filamento complementare
•Se viene inserito uno dei 4 dNTPs l’allungamento prosegue
•Se invece viene inserito il ddNTP terminatore l’allungamento si blocca
principio del sequenziamento (Sanger, metodo manuale, a ciclo termico)
principio del sequenziamento (Sanger, metodo manuale, a ciclo termico)
In ciascuna delle 4 provette contenente nucleotidi terminatori con una diversa base
azotata si formano soltanto filamenti che terminano con tale base. Tali filamenti avranno
tutte le lunghezze possibili a seconda che il nucleotide terminatore si sia legato alla 1°, 2°, . . ,
ennesima, posizione possibile.
Al termine della reazione, ogni miscelacontiene una popolazione di filamenti di
nuova sintesi, che hanno in comune l’estremità 5’ ma che differiscono in
lunghezza perché la loro sintesi è statabloccata in diverse posizioni al 3’.
I filamenti marcati sono separati medianteelettroforesi su gel di poliacrilammide-urea
ad elevato voltaggio.
principio del sequenziamento (Sanger, metodo manuale, a ciclo termico)
Si esegue una elettroforesi disponendo i prodotti di amplificazione delle 4 provette in 4 corsie parallele così che in ognuna di esse siano presenti filamenti che terminano con una diversa base.Si usa un gel ad altissima risoluzione, capace di separare frammenti di DNA che differiscono fra loro per un solo nucleotide. Il gel (0,3-0,4 mm di spessore) è interposto fra due lastre di vetro di notevole lunghezza (40 cm circa ).
La migrazione è inversamente proporzionale alla lunghezza del filamentoLa posizione della banda indica la posizione occupata all’interno della sequenza, mentre il tipo di base è indicato dalla corsia in cui tale banda si trova
principio del sequenziamento (Sanger, metodo manuale, a ciclo termico)
A T A C A G C T G T T . . . . . . SEQUENZA OTTENUTA :
ATA
C
AG
T
C
TGT
Evoluzione del sequenziamento Sanger:metodo automatizzato, con marcatori fluorescenti
I nucleotidi terminator i (ddNTPs) sono marcati con un fluorocromo. Si usa un fluorocromo diverso per ciascuno dei quattro tipi di terminatori
Coniugando a ciascun ddNTP un diverso marcatore fluorescente, è possibile effettuare le quattro reazioni di sequenziamento in un unico
tubo da saggio e caricare il tutto in un solo pozzetto di gel
I nucleotidi terminatori (ddNTPs) sono marcati con un fluorocromo. Si usa un fluorocromo diverso per ciascuno dei quattro tipi di
terminatori
Nucleotidi terminatori (ddNTPs) marcati con un fluorocromo
ddATP ddGTP
ddTTPddCTP
I quattro fluorocromi hanno differenti propietà di emissione
Nucleotidi terminatori (ddNTPs) marcati con un fluorocromo
Metodo automatizzato, con marcatori fluorescenti:Immagine virtuale del gel
ddA
ddC
ddT
ddG
Metodo automatizzato, con marcatori fluorescenti:Il sequenziatore automatico
IL GEL
“slab” gel di poliacrilammide (dal 4% al 6%) molto sottili in condizioni
denaturanti (Urea)
L’APPARATO PER IL GEL
Apparati verticali di lunghezza variabile a seconda del numero di
basi da leggere (22 cm-1 m)
LO STRUMENTO
Composto da un unità in grado di alloggiare il gel e far avvenire
l’elettroforesi in campo elettrico, e l’acquisizione dei dati di
fluorescenza, connesso ad un computer contenente il software
Metodo automatizzato, con marcatori fluorescenti:Il sequenziatore automatico
L’intensità e la lunghezza d’onda delle emissioni fluorescenti vengono captate durante l’elettroforesi quando i frammenti del DNA, eccitati dalla luce laser, passano davanti ad un rilevatore
L’elettroferogramma Le emissioni fluorescenti vengono captate da un rilevatore e le
informazioni vengono integrate e trasformate in picchi di colorediverso, con aree proporzionali all’intensità di emissione.
Normalmente il sistema interpreta automaticamente l’elettroferogramma. Quando l’interpretazione non è ovvia, il sistema inserisce una N al posto
della base azotata mancante, questa può essere corretta manualmente, dopo aver letto ad occhio l’elettroferogramma, o in base alla sequenza del filamento reverse
L’elettroferogramma
Sequenziamento automatico
Sequenziatore a elettroforesi capillareLa separazione elettroforetica dei frammenti fluorescenti avviene in un capillare del diametro di 50 µm, contenente un polimero di corsa.
Il sistema carica automaticamente il capillare prelevando direttamente da una provetta o da una micropiastra i campioni ottenuti dalla PCR di sequenziamento,
I frammenti marcati di DNA vengono rilevati man mano che correndo lungo il capillare, raggiungono la “detection window”.
1-4-16-96 capillari
• Durante l’attraversamento del capillare i vari frammenti di DNA vengono colpiti da un raggio laser
• Il raggio laser eccita i vari fluorocromi che marcano i singoli frammenti
• Ciascuno dei quattro fluorocromi emette una diversa lunghezza d’onda
• Una cellula fotoelettrica rileva sequenza, tipo ed intensità delle varie emissioni luminose ed il tutto viene registrato in forma grafica
• La sequenza dei picchi corrisponde alla sequenza dei nucleotidi; il tipo (colore del picco) corrisponde al tipo di base azotata.
Sequenziamento automatico
Sequenziatore a capillare
A cosa serve quindi il sequenziamento:
La comprensione dell’esatta sequenza del genoma degli organismi viventi è importante per:
In biologia: per capire il perché e come gli organismi viventi si sono evoluti (es: filogenesi)
Per comprendere meglio i meccanismi che sono alla base della vita e della sopravvivenza
In medicina: per diagnosticare malattie ereditarie e sviluppare nuovi trattamenti (es: mutazioni nucleotidiche)
La conoscenza del genoma degli agenti patogeni può portare allo sviluppo di medicine contro malattie contagiose (es: antibiogramma)
La determinazione di sequenze del DNA è utile anche nelle scienze forensi ed in quelle alimentari
ES: Individuazione di una mutazione di un singolo nucleotide
Il progetto “Genoma Umano”HGP: Human Genome Project
Il Progetto Genoma Umano è stato un progetto di ricerca scientifica internazionale il cui obiettivo principale era quello di determinare la sequenza delle coppie di basi azotate che formano il DNA e di identificare e mappare i circa 30 mila geni del genoma umano dal punto di vista sia fisico che funzionale.
Il progetto, originariamente della durata di 15 anni, ha avuto inizio nel 1990 presso i National Institutes of Health degli Stati Uniti. La prima bozza del genoma è stata rilasciata nel 2000 mentre quella completa si è avuta nel 2003, quindi con 2 anni di anticipo dalla fine del progetto, e ulteriori analisi sono ancora in corso di pubblicazione (in realtà una piccola % del genoma non è ancora stata sequenziata).
Il progetto “Genoma Umano”HGP: Human Genome Project
Per portare a termine la ricerca si è lavorato sul DNA offerto da un certo numero di donatori selezionati con criteri di rappresentatività statistica.
Il "genoma" di qualsiasi individuo (tranne quello dei gemelli monozigoti e degli organismi clonati) è unico; mappare quindi il "genoma umano" significa fare il sequenziamento delle variazioni multiple di ciascun gene.
Il progetto “Genoma Umano”HGP: Human Genome Project
COME E’ STATO EFFETTUATO
Le sequenze dei cromosomi interi vengono ricostruite a partire dalle sequenze di centinaia di migliaia di frammenti di DNA, normalmente di lunghezza compresa fra 500 e 800 pb
Si usano 2 strategie generali per la frammentazione e laricostruzione:
Il sequenziamento gerarchicoIl sequenziamento a rosa di pallini (shotgun)
Le due strategie sono reciprocamente complementari
Differenze:
Nel sequenziamento gerarchico il prmo passaggio è quello di costruire un sentiero principale (tiling path) che serva ad assicurarsi che la sequenza sia ottenuta in grandi pezzi ordinati tra di loro Mentre nel metodo shotgun frammenta semplicemente il genoma in piccole unità sequenziabili e si affida ad algoritmi del computer per ricostruire l’ordine dei frammenti
Il progetto “Genoma Umano”HGP: Human Genome Project
ALCUNE SCOPERTE DEL PROGETTO GENOMA1.Nell’uomo, sequenziare l’intero genoma ha voluto dire esattamente identificare ed ordinare ciascuna delle 3 * 109 (3 miliardi) paia di basi di cui è costituito
1.Gli esseri umani hanno circa 30.000 geni, più o meno lo stesso numero di quelli dei topi e il doppio di quelli di alcune specie di vermi. La comprensione dell'espressione di questi geni potrà fornire degli indizi sulle cause di alcune malattie.
2.Tutte le razze umane sono uguali al 99,99%, quindi le differenze razziali sono geneticamente insignificanti. Questo potrebbe significare una discendenza da un'unica madre.
3.La maggior parte delle mutazioni genetiche avviene nel maschio della specie, il quale è quindi da considerare un agente del cambiamento. I maschi hanno quindi una responsabilità maggiore nella trasmissione delle anomalie genetiche.
4.La genomica ha portato a progressi nel campo dell'archeologia genetica e ha migliorato la nostra comprensione di come ci siamo evoluti in quanto esseri umani e di come ci siamo separati dai primati 25 milioni di anni fa.
Il progetto “Genoma Umano”HGP: Human Genome Project
Adesso che il genoma umano è stato sequenziato il prossimo obiettivo, è quello di associare ad ogni sequenza genica una funzione, considerando che buona parte del DNA non ha probabilmente una funzione ma rappresenta solo un fossile genetico. Questo lavoro richiederà molto tempo anche perché alcuni geni possono dar luogo a più proteine diverse o ad una proteina unica che però può avere una funzione diversa a seconda del tessuto o dello stadio embrionale in cui viene espressa.
Elenco dei siti che contengono
informazioni sul Progetto Genoma
Umano e sui frammenti di DNA
sequenziati.
The Human Genome Project http://w ww.nhgri.nih.gov
un sito dedicato al Progetto GenomaUmano gestito dal NHGRI ( TheNational Human Genome ResearchI nstitute)
GenBank http://w ww.ncbi.nlm.nih.govun sito in cui si possono trovaresequenze di DNA e di proteine.
EMBL http://w ww.ebi.ac.uk un sito dove sono raccolte lesequenze del genoma umano.
GDB (genome database): http://w ww.gdb.org/il più importante databaseconcernente la mappatura delgenoma.
dbESThttp://w ww.ncbi.nlm.nih.gov/dbEST/ index.html
raccoglie le sequenze parzialiottenute dai cDNA
OMI M (on-line MendelianI nheritance in Man)
accesso attraverso GDBcatalogo elett ronico di MendelianI nheritance in Man di VictoMcKusick, un elenco delle malattieumane ereditarie.
MGD (Mouse Genome Database) http://w ww.informatics.jax.orgdatabase del genoma murino,
Généthon http://w ww.genethon.fr/ mappa genetica basata sui marcatoricon ripetizioni (CA)n
CHLC (Co-operative Human LinkageCenter)
http://lp g.nci.nih.gov/CHCL/
database contenente una mappagenetica e dati riguardanti ilgenotipo e i marcatori genetici,contenente un programma perl’analisi di linkage
CEPHhttp://w ww.cephb.fr/ bio/ ceph-genethon-map.html
mappa f isica del genoma umanobasato sugli YAC.
CELERAhttp://w ww.celera.com/ il sito internet della società privata
americana diretta da Greg Venter
bibliografia sul progetto genomaumano
www.nature.com/genomics/0
Whitehead I nstitutehttp://w ww-genome.wi.mit.edu/
mappa f isica del genoma umanobasata sugli YAC
GenBank
• Banca dati pubblica (in Internet) contenente circa 50 milioni di sequenze geniche delle più varie regioni di, praticamente, tutti gli organismi viventi
• Chiunque può depositare (ovviamente non in maniera anonima) sequenze in GenBank
• E’ possibile confrontare la propria sequenza con tutte quelle presenti in GenBank
• Un motore di ricerca individua e restituisce le sequenze presenti in GenBank che hanno il più elevato grado di somiglianza con la sequenza in esame