24
Docking

Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Embed Size (px)

Citation preview

Page 1: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Docking

Page 2: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Il problema del docking molecolareIl problema del docking molecolare

Date due molecole di cui sono note le geometrie Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a:3D il docking si pone di rispondere a:

• Le due molecole si legano tra di loro? Le due molecole si legano tra di loro? • Quanto vale l’energia di interazione? (binding energy)Quanto vale l’energia di interazione? (binding energy)• Qual’è la geometria del complesso fra le due molecole?Qual’è la geometria del complesso fra le due molecole?

Problemi di docking in biochimica:Problemi di docking in biochimica:• Docking proteina-molecolaDocking proteina-molecola• Docking DNA-molecolaDocking DNA-molecola• Docking proteina-proteinaDocking proteina-proteina• Docking proteina-DNA Docking proteina-DNA

Page 3: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Importanza del dockingImportanza del docking

Il riconoscimento molecolare è un fenomeno di enorme Il riconoscimento molecolare è un fenomeno di enorme importanza in biologiaimportanza in biologia

• Enzima Enzima substrato, inibitore substrato, inibitore• Anticorpo Anticorpo antigene antigene• Recettore Recettore ligando (agonista, antagonista) ligando (agonista, antagonista)

Strutture di complessi proteina-ligandoStrutture di complessi proteina-ligando• raggi X raggi X • NMRNMR

Importanza in chimica farmaceuticaImportanza in chimica farmaceutica• Ligando = Molecola con azione farmacologica?Ligando = Molecola con azione farmacologica?

IIl docking permette di studiare come una molecola si lega l docking permette di studiare come una molecola si lega ad una macromolecola biologica (enzima, proteina, DNA, ad una macromolecola biologica (enzima, proteina, DNA, recettore) processo alla base del riconoscimento molecolarerecettore) processo alla base del riconoscimento molecolare

Page 4: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Generalità sul dockingGeneralità sul docking

L’associazione fra le due molecole è basata su interazioni:L’associazione fra le due molecole è basata su interazioni:• Van der WaalsVan der Waals• ElettrostaticheElettrostatiche• Legami idrogenoLegami idrogeno

Le interazioni corrispondenti sono deboli e a corto raggioLe interazioni corrispondenti sono deboli e a corto raggio• Complementarietà geometricaComplementarietà geometrica• Complementarietà chimicaComplementarietà chimica

Nel docking si cerca di determinare la geometria del Nel docking si cerca di determinare la geometria del complesso intermolecolare formato fra le due molecolecomplesso intermolecolare formato fra le due molecole

L’energia di binding è la differenza di energia fra il L’energia di binding è la differenza di energia fra il complesso e le due molecole separate complesso e le due molecole separate

• Il solvente (acqua) gioca un ruolo importanteIl solvente (acqua) gioca un ruolo importante• L’entropia ha un impatto significativo sul binding.L’entropia ha un impatto significativo sul binding.

Page 5: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Aspetti EnergeticiAspetti Energetici

Interazioni a corto raggio implicano elevata complementarietà Interazioni a corto raggio implicano elevata complementarietà geometrica fra le superfici a contatto: “docking geometrici”geometrica fra le superfici a contatto: “docking geometrici”Ligando e proteina sono conformazionalmente flessibiliLigando e proteina sono conformazionalmente flessibiliLa stima dell’energia è difficoltosa (energie conformazionali, La stima dell’energia è difficoltosa (energie conformazionali, effetto del solvente, effetto entropico, energia elettrostatica,..)effetto del solvente, effetto entropico, energia elettrostatica,..)

Page 6: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

R(aq) L(aq) R*L*(aq)

R*(aq) L*

(aq)

ERLbind

ERLint

ERfit+EL

fit

R*(g) L*

(g)

ERLbind = ERfit ELfit ERLint

R*L*(g)

ERsolv+EL

solv)

ERLsolv

Esolv

Esolv = ERLsolv ER

solv+ELsolv)

Energia di bindingEnergia di binding

Page 7: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

ApplicazioniApplicazioni

Stima dell’energia di binding target-ligando Stima dell’energia di binding target-ligando

Predizione della geometria del complesso target-ligandoPredizione della geometria del complesso target-ligando

Principale campo di applicazione delle tecniche di docking è Principale campo di applicazione delle tecniche di docking è lo studio delle proprietà (energia e geometria) di binding lo studio delle proprietà (energia e geometria) di binding di potenziali nuovi farmaci:di potenziali nuovi farmaci:

- Modalità di binding di farmaci già noti Modalità di binding di farmaci già noti - Ricerca di molecole potenzialmente attive su nuovi target Ricerca di molecole potenzialmente attive su nuovi target

recettoriali (virtual screening)recettoriali (virtual screening)- Previsione “in silico” della potenziale attività Previsione “in silico” della potenziale attività

farmacologica di nuove molecole farmacologica di nuove molecole

Page 8: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Peculiarità del dockingPeculiarità del docking

La ricerca farmaceutica richiede elevate prestazioni La ricerca farmaceutica richiede elevate prestazioni (arrivare a risultati plausibili in poco tempo), per cui tutte (arrivare a risultati plausibili in poco tempo), per cui tutte le tecniche di docking impiegate in questo ambito puntano le tecniche di docking impiegate in questo ambito puntano a:a:

- Sfruttare al meglio tutte quello che si conosce del sistema Sfruttare al meglio tutte quello che si conosce del sistema target-ligando in oggettotarget-ligando in oggetto

- Impiegare algoritmi specializzati per la ricerca della Impiegare algoritmi specializzati per la ricerca della geometria di bindinggeometria di binding

- Impiegare funzioni parametrizzate per la stima Impiegare funzioni parametrizzate per la stima dell’affinità target-ligando e per la previsione della dell’affinità target-ligando e per la previsione della geometria di binding geometria di binding

Page 9: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Condizioni inizialiCondizioni iniziali

Lo studio di docking può essere effettuato quando:Lo studio di docking può essere effettuato quando:

- È nota la struttura 3D del target recettorialeÈ nota la struttura 3D del target recettoriale

- Sono note le principali interazioni target-ligandoSono note le principali interazioni target-ligando

- La struttura di target e ligando sono compatibili con la La struttura di target e ligando sono compatibili con la parametrizzazione dei modelli impiegatiparametrizzazione dei modelli impiegati

- Le dimensioni e la complessità del sistema possono essere Le dimensioni e la complessità del sistema possono essere trattati dai modelli impiegatitrattati dai modelli impiegati

Quasi tutte le condizioni citate sono soddisfatte quando è Quasi tutte le condizioni citate sono soddisfatte quando è possibile trovare la struttura di complessi co-cristallizzati possibile trovare la struttura di complessi co-cristallizzati del target con molecole simili al ligando in oggetto.del target con molecole simili al ligando in oggetto.

Page 10: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Protein Data Bank (PDB)Protein Data Bank (PDB)

Un organismo che si occupa di raccogliere, catalogare, Un organismo che si occupa di raccogliere, catalogare, classificare e rendere disponibile a chiunque i dati classificare e rendere disponibile a chiunque i dati cristallografici relativi ad enzimi, recettori, acidi nucleici e, cristallografici relativi ad enzimi, recettori, acidi nucleici e, in generale, macromolecole biologiche.in generale, macromolecole biologiche.

Tutti possono accedere, consultare e scaricare strutture Xray Tutti possono accedere, consultare e scaricare strutture Xray dall’archivio PDB, www.pdb.orgdall’archivio PDB, www.pdb.org

Esistono anche siti o applicazioni specifiche per la Esistono anche siti o applicazioni specifiche per la consultazione guidata del dati presenti sul PDB.consultazione guidata del dati presenti sul PDB.

Tutti i programmi di modelling sono in grado di leggere i Tutti i programmi di modelling sono in grado di leggere i files depositati nell’archivio PDB. files depositati nell’archivio PDB.

Page 11: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si
Page 12: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Funzioni di scoreFunzioni di score

L’ enorme mole di dati strutturali disponibili tramite L’ enorme mole di dati strutturali disponibili tramite l’archivio PDB, è stata ed è fondamentale per lo sviluppo di l’archivio PDB, è stata ed è fondamentale per lo sviluppo di metodi di docking validi.metodi di docking validi.

L’obiettivo più importante è sviluppare metodi di docking in L’obiettivo più importante è sviluppare metodi di docking in grado di prevedere la geometria di binding tramite una grado di prevedere la geometria di binding tramite una funzione che stima l’affinità tra target e ligando.funzione che stima l’affinità tra target e ligando.

Questa funzione viene generalmente indicata con il nome di Questa funzione viene generalmente indicata con il nome di funzione di scorefunzione di score. .

Effettivamente, i diversi programmi di docking finora Effettivamente, i diversi programmi di docking finora sviluppati si differenziano proprio in base alla funzione di sviluppati si differenziano proprio in base alla funzione di score e all’algoritmo di ricerca. score e all’algoritmo di ricerca.

Page 13: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Finora sono state implementate diversi tipi di funzioni di Finora sono state implementate diversi tipi di funzioni di score e, quasi certamente, negli anni la lista è destinata ad score e, quasi certamente, negli anni la lista è destinata ad aumentare. aumentare.

Attualmente, possiamo distiguere tra classi principali:Attualmente, possiamo distiguere tra classi principali:

• Force field basedForce field based: la stima dell’affinità target-ligando : la stima dell’affinità target-ligando viene effettuata tramite la meccanica molecolare. viene effettuata tramite la meccanica molecolare.

• Knowledge basedKnowledge based: funzioni che stimano la probabilità di : funzioni che stimano la probabilità di “avvicinamento” tra atomi del ligando ed atomi del target.“avvicinamento” tra atomi del ligando ed atomi del target.

• Consensus scoringConsensus scoring: lo scoring complessivo è dato dalla : lo scoring complessivo è dato dalla combinazione di più funzioni di score.combinazione di più funzioni di score.

Page 14: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Approcci al dockingApprocci al docking

TargetTarget• Rigido: gli atomi del target sono fissi durante la ricerca della Rigido: gli atomi del target sono fissi durante la ricerca della

geometria di binding (geometria di binding ( cruciale la scelta della struttura cruciale la scelta della struttura inziale del target)inziale del target)

• Semi-rigido: alcuni atomi del sito di binding possono Semi-rigido: alcuni atomi del sito di binding possono adattarsi al binding del ligandoadattarsi al binding del ligando

• Flessibile: le conformazioni di target e ligando si adattano Flessibile: le conformazioni di target e ligando si adattano reciprocamente(reciprocamente( attualmente si può fare solo con la attualmente si può fare solo con la dinamica molecolare, non con il docking)dinamica molecolare, non con il docking)

LigandoLigando• Rigido: nel docking sono ricercate la posizione e Rigido: nel docking sono ricercate la posizione e

l’orientamento di una conformazione fissa del ligando nel l’orientamento di una conformazione fissa del ligando nel sito recettoriale.sito recettoriale.

• Flessibile: nel docking sono ricercate la posizione, Flessibile: nel docking sono ricercate la posizione, l’orientamento e la conformazione del ligando nel sito l’orientamento e la conformazione del ligando nel sito recettoriale. recettoriale.

Page 15: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Variabili del dockingVariabili del docking

R CHX

C HY

R'

z

x

y

Proteina

xxcmcm, y, ycmcm, z, zcmcm

, , , ,

11, , 22

Una combinazione delle Una combinazione delle 6+n6+n variabili definisce la variabili definisce la posaposa di un ligando. di un ligando.

Page 16: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Algoritmi Genetici (GA)Algoritmi Genetici (GA)

• Sono algoritmi di ricerca del minimo globale basati sull’analogia con la Sono algoritmi di ricerca del minimo globale basati sull’analogia con la genetica e l’evoluzione genetica e l’evoluzione

• Genotipo: ogni posa è individuata da un Genotipo: ogni posa è individuata da un cromosomacromosoma, a sua volta formato , a sua volta formato da da 6+n6+n geni:geni:

- 3 - 3 coordinate del centro di massa coordinate del centro di massa - 3 - 3 angoli di Eulero angoli di Eulero - n - n angoli di torsione dei legami rotabili angoli di torsione dei legami rotabili • Fenotipo: l’affinità con il target (score) è l’unico fattore che viene Fenotipo: l’affinità con il target (score) è l’unico fattore che viene

considerato nell’evoluzione e si identifica con la considerato nell’evoluzione e si identifica con la fitnessfitness..• Questi algoritmi di ricerca creano popolazioni di pose che di generazione Questi algoritmi di ricerca creano popolazioni di pose che di generazione

in generazione evolvono trasmettendosi i caratteri ereditari sotto una in generazione evolvono trasmettendosi i caratteri ereditari sotto una costante pressione selettiva.costante pressione selettiva.

• Il meccanismo di trasmissione dei caratteri avviene in base a processi che Il meccanismo di trasmissione dei caratteri avviene in base a processi che mimano il rimescolamento dell’informazione genica che si osservano in mimano il rimescolamento dell’informazione genica che si osservano in natura: mutazioni puntiformi e crossing-over.natura: mutazioni puntiformi e crossing-over.

• I parametri di controllo di questi algoritmi sono tipicamente il numero di I parametri di controllo di questi algoritmi sono tipicamente il numero di generazioni, la pressione selettiva, il tasso di mutazione e crossing-over, il generazioni, la pressione selettiva, il tasso di mutazione e crossing-over, il numero di nicchie evolutive, etc. numero di nicchie evolutive, etc.

Page 17: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Popolazione initiale di Popolazione initiale di conformazioni: conformazioni:Ciascuna conformazione è rappresentata da un cromosomaCiascuna conformazione è rappresentata da un cromosoma

11 00 11 00 11 11 00 11 00 00 00 11 00 11 00 00 1100 00 0011 22 33 44

O

OH

Si calcola la funzione di fitness ( l’energia) per ciascun Si calcola la funzione di fitness ( l’energia) per ciascun cromosomacromosoma

Nel cromosoma, ciascuna torsione può essere rappresentata da Nel cromosoma, ciascuna torsione può essere rappresentata da uno dei uno dei 2255=32 valori corrispondenti a numeri binari a 5 cifre=32 valori corrispondenti a numeri binari a 5 cifre

Page 18: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Nuova popolazione ottenuta tramite gli operatori genetici:Nuova popolazione ottenuta tramite gli operatori genetici:

Selezione: solo gli individui con miglior fitness si riproducono Selezione: solo gli individui con miglior fitness si riproducono

Crossover:Crossover:

Mutazione puntuale:Mutazione puntuale:

00100011001000111100011100011100001111000011001100001100

00100011001000110011000011001100001111000011110001110001

0010001001000111110001110001 0010001001000100110001110001

Page 19: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

GoldGold

Fitness evaluation of individual with chromosome Fitness evaluation of individual with chromosome cc::• Build conformation according to Build conformation according to cc..• Superimpose matching interacting groups.Superimpose matching interacting groups.• Calculate docking score: -ECalculate docking score: -Ehydrogenhydrogen bondbond – (E – (Einternalinternal + E + EVdW-complexVdW-complex))

Genetic operatorsGenetic operators• Cross overCross over• MutationMutation• MigrationMigration

Operators randomly selected.Operators randomly selected.

20-50 runs, each with up to 100000 genetic operations.20-50 runs, each with up to 100000 genetic operations.

Page 20: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Gold Validation: Good

4PHV - A peptide-like ligand docked into HIV protease

Page 21: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Gold Validation: Close

1GLQ - A nitrophenyl-substituted peptide ligand docked into glutathione-S-transferase

Page 22: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Algoritmi a ricerca gerarchicaAlgoritmi a ricerca gerarchica

• L’algoritmo effettua un search conformazionale L’algoritmo effettua un search conformazionale preliminare allo scopo di generare un numero elevato preliminare allo scopo di generare un numero elevato di conformeri del ligando.di conformeri del ligando.

• La popolazione di conformeri viene sottoposta ad una La popolazione di conformeri viene sottoposta ad una serie di test, via via più restrittivi, per individuare un serie di test, via via più restrittivi, per individuare un numero ristretto di candidati.numero ristretto di candidati.

• Viene effettuato lo scoring dei conformeri così ottenuti; Viene effettuato lo scoring dei conformeri così ottenuti; quelli corrispondenti alle pose migliori vengono quelli corrispondenti alle pose migliori vengono considerati per una fase successiva di rescoring, in cui considerati per una fase successiva di rescoring, in cui viene stimata in maniera più accurata l’interazione tra viene stimata in maniera più accurata l’interazione tra target e ligando.target e ligando.

Page 23: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si
Page 24: Docking. Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si

Docking con GlideDocking con Glide

• Preparazione della proteina ed del ligandoPreparazione della proteina ed del ligando: la funzione : la funzione di score implementata in Glide usa il campo di forze di score implementata in Glide usa il campo di forze OPLS OPLS il programma deve assegnare i parametri del il programma deve assegnare i parametri del FF agli atomi del target e del ligando.FF agli atomi del target e del ligando.

• Calcolo dei campi molecolari di interazioneCalcolo dei campi molecolari di interazione: il sito di : il sito di binding del target viene mappato con griglie binding del target viene mappato con griglie tridimensionali (Grid Generation). Il mapping renderà tridimensionali (Grid Generation). Il mapping renderà lo scoring (eseguito nella succesiva fase di docking) lo scoring (eseguito nella succesiva fase di docking) molto più rapido ed efficiente.molto più rapido ed efficiente.

• DockingDocking: le pose del ligando vengono calcolate, filtrate : le pose del ligando vengono calcolate, filtrate ed i risultati vengono elaborati per renderli disponibili ed i risultati vengono elaborati per renderli disponibili all’utente. all’utente.