Upload
aristotle-mcpherson
View
41
Download
1
Embed Size (px)
DESCRIPTION
Università degli studi di Roma “Tor Vergata ” Facoltà di Scienze Matematiche, Fisiche e Naturali. Tesi di Laurea Triennale in Fisica. “ Frequenza di occorrenza del tetrapeptide HGGG e sue possibili implicazioni biologiche”. Candidato Stefania Alleva. Relatore Prof.ssa Silvia Morante. - PowerPoint PPT Presentation
Citation preview
“Frequenza di occorrenza del tetrapeptide HGGG e sue possibili implicazioni
biologiche”
Relatore
Prof.ssa Silvia Morante
Candidato
Stefania Alleva
Anno Accademico 2005/2006
Tesi di Laurea Triennale in Fisica
Università degli studi di Roma
“Tor Vergata”Facoltà di Scienze Matematiche, Fisiche e
Naturali
SOMMARIO Introduzione: le malattie neurodegenerative;
La Proteina Prionica: i motivi ripetuti e il legame con il Cu+2;
Tecniche utilizzate per studiare il sito di legame PrP- Cu+2: Diffrazione a raggi X; Spettroscopia XAS; Spettroscopia EPR; Simulazioni numeriche;
Analisi statistica sulla frequenza di occorrenza del tetrapeptide HGGG: verifica della rarità;
Ricerca di omologie, affinità, relazioni tra le proteine umane dotate del peptide studiando: struttura primaria, struttura secondaria, struttura terziaria, idropaticità, sito di legame per i metalli;
Conclusioni e sviluppi futuri.
MALATTIE NEURODEGENERATIVE
Agente infettivo:
PROTEINA
MALATTIE NEURODEGENERATIVE
Morbo di Parkinson
Morbo di Alzheimer
Encefalopatie Spongiformi Trasmissibili (TSE)
CJD
nvCJD
MISFOLDING
AGGREGAZIONE
LA PROTEINA PRIONICA (PrPc) Glicoproteina di membrana (cellule presinaptiche)
Numero di a.a. variabile da specie a specie
Dominio globulare (strutturato e intramembrana) e dominio non strutturato extramembrana nella
regione N-terminale
Presenza nel dominio N-terminale di vari octarepeats (PHGGGWGQ), potenziali siti di legame per il Cu+2
Funzione esatta ignotaIPOTESI PIU’ ACCREDITATE
1. Traduzione di segnali cellulari
2. Adesione molecolare
3. Trasporto e chelazione del rame
4. Antiossidante
LA PROTEINA PRIONICA SCRAPIE (PrPsc) L’agente patogeno della TSE è la PrPsc, forma anomala della PrPc, in cui tratti di α elica
sono sostituiti da β-sheet all’estremità C-terminale
Misfolding probabilmente legato all’interazione con Cu+2
La PrPsc si accumula nel CNS portando, dopo anni, alla rottura della barriera ematoencefalica
Modello diffusione intracellulare cerebrale “domino-stone”
Contagio avviene in genere per progressivo misfolding e aggregazione di PrP adiacenti ma la malattia può essere trasmessa per iniezione di PrPsc intraoculare, intravenosa e intracerebrale. La PrPsc raggiunge, trasportata dalle cellule B, le terminazioni nervose senza danneggiare organi e
tessuti attraversati
DETERMINARE LA COORDINAZIONE OCTAREPEAT-Cu+2
Diffrazione a raggi X
Spettroscopia XAS
Spettroscopia EPR
Simulazioni numeriche
DIFFRAZIONE A RAGGI XPermette di determinare la disposizione degli atomi in strutture ordinate (cristalli)
Un fascio di fotoni (raggi X) è inviato sul campione
Le nubi elettroniche degli atomi diffrangono tali onde che
interferiscono
Dai pattern di diffrazione si elaborano modelli strutturali del
sistema analizzato
Confronto pattern di diffrazione simulati e
sperimentali
STRUTTURA CRISTALLOGRAFICA AI RAGGI X DEL COMPLESSO HGGGW-Cu+2
Legame peculiare HGGGW/Cu+2
Nε dell’H1
N deprotonati di G2 e G3
O di G3
O di una molecola H2O
La catena laterale del W è parallela al piano equatoriale
Probabilmente tiene in sito l’H2O
Il metallo è legato alla catena
principale
Burns C.S., Aronoff-Spencer E., Dunham C.M., Lario P., Avdievich N.I., Antholine W.E., Olmsteam M.M., Vrielink A., Gerfen G.J., Peisach J., Scott W.G., Millhauser G.L..
Biochemistry
dE0eI)E(I
SPETTROSCOPIA XAS (X-ray Absorption Spectroscopy)
Legge di Lambert-Beer
Campione in qualsiasi stato di aggregazione;
Non esistono regole di selezione;
Acquisizione rapida dello spettro.
Vantaggi
SPETTRO XAS
Energia di soglia
• Energia di ionizzazione elettrone interno
• Molteplici per ogni specie atomica
• Distinguibili per atomi con Z diversi ed elevati
ATOMO ISOLATO SISTEMA MULTIATOMICO
K-edge =>1s
Spettro XAS analizzato in termini della quantità χ(k)
k
kkk
0
0
2
0Em2k
)k(kR2sinee),k(AkR
NS)k( ii
)k(R2
i
k2i2
i
i20
i2i
2
k è il vettore d’onda del fotoelettrone emesso
Per energie sufficientemente elevate è adottabile l’approssimazione di singolo scattering (regione EXAFS)
Fase e ampiezza onde di back scattering sono caratteristiche
per ogni specie atomica.
Ma per atomi leggeri (C, O, N)
NON sono DISTINGUIBLI
È necessario introdurre i termini di scattering multiplo per distinguere i vari a.a. (regione XANES)
132
,,12,11
,,2,1; S
C
S
CCSiiSiiSiS
SA
χ(k) è approssimato da una sommatorie di un numero finito di termini irriducibili
A
ii;Aii;A
0
n1nI
n1)1n(
DATI XAS IN COMPOSTI OCTAREPEATS-Cu+2
Morante S., González-Iglesias R., Potrich C., Meneghini C., Meyer-Klaucke W., Minestrina G., Gasset M. (2004). J. Biol. Chem..
Dati XAS alla soglia K del Cu+2 in composti con numero vario di octarepeats e diversi
rapporti di concentrazione peptide /Cu+2 (R)
Sequenza peptidi utilizzati Numero siti R
legame Cu+2
KKRPKPWGQPHGGGWGQ 1 0,5
KKRPKPWGQ(PHGGGWGQ)2 2 1,5
KKRPKPWGQ(PHGGGWGQ)4 4 2
BoPrP-(24-242) 6 3
REGIONE XANES
Stesso stato di ossidazione
REGIONE EXAFSSi osservano delle differenze
GEOMETRIA INTRA-REPEAT
(1 o 2 octarepeats)
GEOMETRIA INTER-REPEAT
(4 o 6 octarepeats)
GEOMETRIA DI COORDINAZIONE INTRA-REPEAT
Il fit è compatibile con una struttura identica a quella cristallografica in cui il legame è completamente nel singolo octarepeat
Ciascun atomo di rame è legato a tre atomi di azoto e uno di ossigeno posti su un piano
Il fit è compatibile con la presenza di un atomo di ossigeno a distanza maggiore e su un piano ortogonale
GEOMETRIA DI COORDINAZIONE INTER-REPEAT
Il Cu+2 è legato agli anelli imidazolici di due His di octarepeats diversi
NB: Se la concentrazione di Cu+2 non satura tutti gli octarepeats
Il legame avviene tra diversi octarepeats
Se appartengono a diverse PrP potrebbe
favorire l’aggregazione
SPETTROSCOPIA EPR (Electron Paramagnetic Resonance)
Basata sull’assorbimento di energia da parte di un sistema dotato di un elettrone spaiato immerso in un campo magnetico statico (H)
L’Hamiltoniana del sistema
H=He+Hiperfine= βS·g·H + S·A·I
Interazione col campo magnetico
Interazione iperfine
Campo magnetico efficace
Rapporto giromagnetico considera lo splitting Zeeman
Energia di contatto di Fermi
Termine dipolare
ATOMO DI IDROGENO
Sono permesse (per l’idrogeno S=1/2 e I=1/2) solo le transizioni
h2
AgHE
Risultati
Cu+2 lega preferibilmente l’octarepeat
La geometria di coordinazione dipende dalla concentrazione relativa peptide/Cu+2
Diverso ruolo delle His e delle Gly nel legare il metallo
Sono stati simulati spettri EPR implementando la precedente Hamiltoniana in sistemi contenenti uno o due ioni Cu+2 , in approssimazione di geometria rigida e usando sequenze peptidiche diverse per numero di octarepeats e composizione in a.a.
SIMULAZIONI EPR IN COMPOSTO OCTAREPEAT-Cu+2
Chattopadhyay, M.; Walter, E. D.; Newell, D. J.; Jackson, P. J.; Aronoff-Spencer, E.; Peisach, J.; Gerfen, G. J.; Bennett, B.; Antholine, W. E.; Millhauser, G. L. (2005).
J. Am. Chem. Soc.
Componenti dello spettro EPRCOMPONENTE 1
Cu+2 satura tutti gli octarepeats
Stessa struttura della cristallografia
COMPONENTE 2
Concentrazione intermedia Cu+2
Riduzione distanza tra atomi
Cu+2 si lega a Nε e N dell’His e agli O di due H2O
Stabilizzato da più octarepeats
COMPONENTE 3
Bassa concentrazione Cu+2
Un singolo Cu+2 è legato a tre Nε delle His
Peptidi con 3 o 4 octarepeats
Lo spettro mostra tutte le componenti ma la forma varia con la concentrazione
SEQUENZE UTILIZZATE E COMPONENTI DELLO SPETTRO EPR
SEQUENZA PEPTIDICACOMP
N. 1COMP
N. 2COMP
N. 3
KKRPKPWGQ(PHGGGWGQ)4 X X X
(PHGGGWGQ)3 X X X
HGGGWGQPHGGGW X X
PHGGGWGQ X
HGGGW X
KKRPKPWGQ(PHGXGWGQ)4 X X
HGXGWGQPHGXGW X
HGXGW X
HXGGW X
HGGGWGQPYGGGW X
YGGGWGQPHGGGW X
HGGGWGQPYGGGWGQPHGGGW X
La sostituzione di una G con X comporta una modifica del sito di legame
HGGGWGQPYGGGW X
YGGGWGQPHGGGW X
HGGGWGQPYGGGWGQPHGGGW X
Sostituendo l’His con Tyr cambia il sito di legame
KKRPKPWGQ(PHGXGWGQ)4 X X
HGXGWGQPHGXGW X
HGXGW X
HXGGW X
SIMULAZIONI NUMERICHE
Simulazioni di dinamica molecolare del tipo Car-Parrinello per studiare la coordinazione del Cu+2
RISULTATI
Il legame tra il Cu+2 e gli azoti deprotonati delle G2 e G3 è
estremamente stabile
La presenza del triptofano W5 sembra non avere
influenza sulla stabilità del legame
Usando dipeptidi [Cu(HGGG)]2 è stata
messa in evidenza una struttura “entangled”
I due ioni nei diversi peptidi si
scambiano dinamicamente i
leganti
Furlan S., Guerrieri F., La Penna G., Morante S., Rossi G.C.
Journal of Biological Inorganic Chemistry; European Biophysics Journal
FREQUENZA DEL TETRAPEPTIDE TRA LE SEQUENZE UMANE
IPOTESIIPOTESI: HGGG nocivo in tutte le proteine
TESITESI: La selezione naturale ha eliminato il motivo dalle sequenze proteiche
HGGG frequenza significativamente minore dell’aspettato
Analisi statistica usando “l’algoritmo delle parole rare”
Una sequenza oligopeptidica (r) in una sequenza proteica è detta parola (b1b2…br)
BIAS: parole rare in parole più lunghe: si ipotizza un processo Markoviano di ordine (r-2)
Sfruttando iterativamente il teorema della probabilità condizionata
)b...bb(P
)b...bb(P)b|bbb(P
1r211r
r21rr1-r21
Identificando la probabilità con la frequenza di occorrenza
Colosimo A., Morante S, Parisi V. and Rossi G. C.
J. theor. Biol.
Frequenza sperimentale Frequenza teorica attesa
)b...bb(E
)bb...b(E)b...bb(E)b...bb(T
1r322r
r1r21r1r211rr21r
r
r21rr21r N
)b...bb(K)b...bb(E
Questi valori vanno confrontati
)b...bb(T
)b...bb(E)b...bb(D
r21r
r21rr21r
D>>1; D<<1 parola significativamente abbondante o rara a opera della selezione naturale
D ≈ 1 parola compare con frequenza non significativamente diversa dal valore teorico aspettato
si introduce la variabile
MISURA DI T4(HGXY) e E4(HGXY)
Algoritmo delle parole rare utilizzato per determinare la frequenza delle quadruplette
HGXY
Programma “cicle.pl” legge tutte le sequenze proteiche umane depositate e misura, restituendoli in output, il numero di volte e in quante proteine compaiono i peptidi HGX,
GXY, GX e HGXY
Programma “ratio.pl”, dopo aver calcolato i valori delle variabili E r(b1b2…br) per ogni parola scelta e quello di T4(HGXY) , calcola D4(HGXY) e lo restituisce in output
RisultatiD4(HGGG)≈0,75
HGGG risulta raro
63 peptidi hanno D4(HGXY)<D4(HGGG)
157 proteine su oltre 29760 analizzate
hanno HGGG
)GX(E
)GXY(E)HGX(E)HGXY(T
2
334
)HGXY(T
)HGXY(E)HGXY(D
4
44
CORREZIONI SUL CAMPIONE
eliminare dal campione le sequenze ipotetiche
controllare gli aggiornamenti delle informazioni depositate
in banca dati
eliminare le ripetizioni
controllare i siti di taglio
Campione iniziale costituito da 157 proteine umane contenenti il peptide HGGG e identificate con codici diversi
ALLINEAMENTO MULTIPLO(ClustalW)
Raggruppato proteine con definizione simile
Allineate con “gap open penality” massima, “gap extension penality”
minima e matrice di identità
Se le sequenze erano allineate e le funzioni molecolari identiche una sola proteina è stata considerata
Campione finale costituito da 99 proteine umane diverse e contenenti il peptide HGGG
CORREZIONI
RICERCA DI OMOLOGIESe HGGG ha un ruolo
simile in tutte le proteine in cui si trova
Potrebbe trovarsi in una regione scarsamente
interagente con l’ambiente circostante
Esiste il PDB SOLO di un’altra proteina
oltre la PrP
PrP oltre a legare Cu+2 è una proteina di membrana Classificato le proteine
Proteine che legano metalli
Proteine di membrana
Funzione esatta PrP ignota
Ricercato funzione molecolare svolta e processo biologico in cui
interviene per ogni proteina
Analisi struttura primaria
Informazioni sugli altri livelli strutturali
Lunghezza proteine
Localizzazione peptide
Profili idropaticità
Struttura secondaria Il peptide è in una regione di random-coil nella PrP
PROTEINE CHE LEGANO METALLI
20 proteine legano metalli
15 Zn
3 Cu
1 Fe
1 Zn-Fe-Co-Mn
Ricerca del sito di legame
Solo di 10 proteine che legano Zn
In due “zinc-finger protein” l’HGGG è parte dello “zinc-finger domain”
(C2H2)
“Zinc-finger domain”
Dominio costituito da 25-30 a.a. che lega Zn
Presente in molte proteine
Esistono vari classi
Più comune (C2H2)
“Zinc-finger protein”
Sono dotate dello zinc-finger domain
Proprietà specifiche (legano DNA con il dominio)
Allineamento multiplo
PrP con altre leganti Cu+2
PrP con le tre zinc-finger protein dell’elenco (lett.)
PrP con le due zinc-finger protein precedenti
PrP con ognuna delle due zinc-finger protein precedenti
ClustalW con opportuni punteggi di penalità e varie
matrici di simiglianza
Nessun risultato soddisfacente
BUON ALLINEAMENTO
ALLINEAMENTO PrP-Zinc Finger Protein
HGGG compare due volte nella zinc
finger protein
PROTEINE DI MEMBRANA
27 proteine di membrana
4 legano metalli
3 Cu
1 Fe
Stimato le regioni transmembrana
PrP ha il dominio N-terminale (comprende HGGG)nella regione
non citosolica, il dominio C-terminale all’interno della cellula
e due regioni transmembrana
TMHMM2
RISULTATI
HGGG non è mai in una regione transmembrana
In 3 casi l’HGGG è nella regione citosolica
In 24 casi l’HGGG è nella regione non citosolica
In 13 casi le proteine non hanno regioni transmembrana
Verifica validità del programma con dati noti della PrP
PROCESSO BIOLOGICO A B C
Metabolismo 23 6 4
Regolazione Metabolismo Acidi Nucleici 23 0 9
Comunicazione Cellulare E Trasduzione Dei Segnali 14 9 1
Crescita & Mantenimento Cellulare 11 5 2
Risposta Immunitaria 1 1 0
Trasporto 4 4 1
Apoptosi 1 0 0
Sconosciuto 20 2 3
PROCESSO BIOLOGICO
La maggior parte delle proteine prende parte a
processi metabolici (13 C)
FUNZIONE MOLECOLAREFUNZIONE MOLECOLARE A B C
Enzima 21 6 6
Regolatore 9 1 2
Recettore 5 5 0
Strutturali 9 3 1
Ligandi 7 4 3
Trasporto 5 5 1
Chaperone 1 0 0
Fattori Di Trascrizione 11 0 2
Sconosciuta 29 3 5
Recenti studi sostengono che la PrP potrebbe essere un fattore di
trascrizione
L’allineamento non ha mostrato risultati interessanti
LUNGHEZZA PROTEINELunghezza di una
proteinaStruttura e
funzioni svolte
Confrontare il nostro campione con tutte le sequenze proteiche
depositate in banca dati
0
5000
10000
15000
20000
25000
30000
1\50
51\10
010
1\150
151\2
0020
1\250
251\3
0030
1\350
351\4
0040
1\450
451\5
0050
1\550
551\6
0060
1\650
651\7
0070
1\750
751\8
0080
1\850
851\9
0090
1\950
951\1
000
1001
\1100
1101
\1200
1201
\1300
1301
\1400
1401
\1500
1501
\1600
1601
\1700
1701
\1800
1801
\1900
1901
\2000
2001
\2100
2101
\2200
2201
\2300
2301
\2400
2401
\2500 >250
0
Intervallo lunghezza
Num
ero
prot
eine
Sequenze banca dati
0
1
2
3
4
5
6
7
8
9
1\50
51\10
010
1\150
151\2
0020
1\250
251\3
0030
1\350
351\4
0040
1\450
451\5
0050
1\550
551\6
0060
1\650
651\7
0070
1\750
751\8
0080
1\850
851\9
0090
1\950
951\1
000
1001
\1100
1101
\1200
1201
\1300
1301
\1400
1401
\1500
1501
\1600
1601
\1700
1701
\1800
1801
\1900
1901
\2000
2001
\2100
2101
\2200
2201
\2300
2301
\2400
2401
\2500 >2
500
Intervallo lunghezza
Nume
ro pr
oteine
Sequenze nostro campione
Numero diverso di proteine con cui è stata realizzata la distribuzione;
Banca dati non solo sequenze proteiche umane
Picco della distribuzione è a lunghezza maggiore nel nostro campione
SEQUENZE SEGNALE & LOCALIZZAZIONE DEL PEPTIDE
SIGNAL PEPTIDE = breve sequenza (3-60 a.a.) utilizzata per il
trasporto della proteina
Regione Iniziale (N-terminale) primi 60 a.a.
Regione Finale (C-terminale) ultimi 60 a.a.
HGGG nella regione N-terminale 21
HGGG nella regione C-terminale 9
HGGG tende preferibilmente a trovarsi in una regione centrale della sequenza
(69/99)
Nella PrP i primi due octarepeats sono nella
regione iniziale
PROFILI DI IDROPATICITA’
IDROPATICITA’
Misura del ΔG di trasferimento di un soluto da un solvente apolare a uno polare
ΔG =ΔH-T ΔS
Misura la propensità di un a.a. a collocarsi in una regione polare (ΔG < 0 a.a.idrofilico) o
apolare(ΔG >0 a.a. idrofobico)
Si realizzano delle scale di idropaticità in base ai valori di ΔG
Sequenza => stringa di numeri
Profili di idropaticità
Profilo della PrPProfilo della PrP
Realizzato con ProtScale
L’HP del singolo a.a. è mediata sui primi vicini
Valore di riferimento -0,4 (HP Gly)
RISULTATI Tutte le proteine sono caratterizzate da zone anfifiliche
La maggior parte delle proteine che legano metalli sono anfifiliche
Proteine sono di membrana sono prevalentemente anfifiliche
ANALISI DELLA REGIONE ATTORNO IL TETRAPEPTIDE
Nella metà dei casi il peptide è in una regione anfifilica
Nel 40% dei casi è in una regione idrofilica
In 7 peptidi è localizzato in una regione idrofobica
Nella PrP e nelle due “zinc-finger protein” in cui l’H partecipa al sito di legame il peptide è in una regione idrofilica compresa tra due regione
idrofobiche
STRUTTURA SECONDARIAα ELICA β sheet Random-coil
Ciascun a.a. ha una propensità a trovarsi in
una struttura
Predire la struttura
secondaria
HNN (corrispondenza con la realtà superiore al 60%)
Abbiamo rilevato che:
Il peptide HGGG si colloca preferibilmente in una regione di random coil
Solo in 6 proteine l’His è in una regione strutturata ;
La maggior parte delle proteine ha una struttura prevalentemente random-coilSTRUTTURA SECONDARIA
58
20
4
8 9
0
10
20
30
40
50
60
70
>50%random coil
>random coil
elica=random coil
> elica >50% elica
CONCLUSIONI & FUTURI SVILUPPI Il motivo HGGG è risultato significativamente raro nelle sequenze proteiche umane depositate
Non è stata individuata una caratteristica comune alle proteine che lo contengono che possa chiaramente indicare le ragioni della rarità
Ripetizione dell’intera procedura di analisi sul peptide GGGH
Utilizzare simulazioni numeriche ed esperimenti in vitro per misurare l’affinità per il Cu+2 delle proteine del campione simili alla PrP
Raffinamento delle tecniche di allineamento con l’uso di altre matrici di proprietà
Raffinamento dell’analisi dei profili di idropaticità
Verifica del dato relativo alla quasi totale assenza nel campione (2/100 contro un valore medio di 40/100) di proteine di cui è nota la struttura