Download ppt - Drug Design Etienne Thoreau. Généralités sur le drug discovery, contexte industriel Petites molécules / macromolécules Types atomiques, types d'interaction

Drug Design

Etienne Thoreau

• Généralités sur le drug discovery, •contexte industriel• Petites molécules / macromolécules• Types atomiques, types d'interaction• Acides aminés• Energie et molécules• Analyse conformationnelle• Énergie libre• Structure(s) 3D de la cible : Docking, SBDD

•Rigide•Flexible

•molécules actives : Pharmacophores, QSAR•pas de structure 3D de la cible, pas de molécules actives : diversité

Modélisation moléculaire et recherchePharmaceutique (RDD,CADD, SBDD…)

Target SélectionStructure 3D de la cible connue, faisabilité ?ligands connus, pharmacophore ?

Hit findingVirtual screening, database filtering

Hit to leaddocking, sélectivité

Lead Optimisationvirtual ADMET, chemogenomics

Développement

Recherche

70s– Leads = produits naturels, hazard– Optimisation tributaire de la chimie, fondée sur hypothèses– Limitations : expérimentation animale

90s– Modélisation moléculaire– Tests in-vitro ( inhibition d'enzymes, liaison au récepteur)– Limitations : synthèse chimique

2000– Genie génétique (production de proteines)– Structure-based drug design– Chimie conbinatoire (mélanges)– High-throughput screening (HTS)– Limitations : propriété ADMET des leads

• 2000 – Genomique, proteomique, pharmacogenomique, bioinformatique– Animaux transgéniques proof of concept (POC)– Chimie combinatoire (1 composé par puit, librairies focalisées ou diverses)– Structure-based drug design– Data mining (screening virtuel de très grande librairie)– ADMET profiling (HTS et virtual ADMET, chemo-génomique) – data pipelining– Limitations : validation de cible, déluge de données

Evolution de la recherche en Drug discoveryNouvelles technologies et nouvelles limitations

Causes des échecs en Drug DiscoveryCauses des échecs en Drug Discovery

• mauvaise pharmacocinetique (mauvais profile ADME chez l'homme, métabolites problématiques)

• Faibles activités cliniques

• Effets secondaires, toxicité (métabolites, sélectivité)

• Stratégie marketing

• Plus l'échec est tardif plus il coûteux !

Nouvelles Stratégies en Drug DesignNouvelles Stratégies en Drug Design

• Conception d'inhibiteurs à partir de la structure du substrat

• Identification de Pharmacophores

• peptidomimétiques

• Structure-based drug design Meilleure prise en compte de l'Affinité, de la sélectivité

• Computer-aided drug design

• Combinatorial drug design

• caratère drug-like, biodisponibilité (e.g., Lipinski’s Rule of Five)

Petites molécules / Macro-molécules

N

O

N

N

N

O

N

N

NN

O

N

N

O

S

O

COOH

OO

O

•Distinction en fonction de la chimie et de la complexité de la molécule, cible ligand

•Distinction en terme d’accessibilité de la structure 3D par le calcul

•Similarité pour les interactions

O

O

H

H

H

Progestérone

PGF2a

HRWM

12,5


N

O

N

N

N

O

N

N

NN

O

N

N

O

S

O

D’un point de vue computationnel, une petite molécule est une moléculepour laquelle on peut énumérer toutes ses conformations :

Pour une petite molécule, par analyse conformationnelle on peut calculer lesconformations d’énergies minimales (énumération)(la conformation active implique l’énergie du complexe proteine-ligand !)

20 liaisons sp3-sp3 incrémént 120°Nconformations = 320 = 3.5 109

O

O

H

H

H

Cycles saturés fusionnés


Les différentes conformations des macromolécules protéiques ne peuvent êtrerecherchées exhaustivement.

On ne peut déduire la structure 3D d’une protéine à partir de sa seule séquence (protein folding).

L’information structurale fiable est principalement expérimentalepar cristallographie ou RMN .

En revanche, ces polymères sont simples au niveau de leur séquence primaire (analyse de séquences et obtention de modéles approximatifs par homologie au sein de protéines de la même famille)

RFGENHAIMGVAFTWVMALACAAPPLVARVSVARARLALAAVAAVALAVALLPLAVASQRRAWATVGLVWAAALALGLLPLTKITSKHVKMMLSGVCLFAVFIALLPILG

Interactions moléculaires

Les interactions inter et intra-moléculaires sont de plusieurs types

Interactions polairesliaisons hydrogènesinteractions électrostatiques, pont salinsdipoles-dipoles

Interactions hydrophobesaromatiques aliphatiques

Interactions moléculaires

Les interactions polaires proviennent de la distribution inégales des charges dues auxassociations chimiques entre atomes d'électronégativités différentes fonctions chimiques

Liaison-H :"Partage" un H

D - A -

H +

R

R

Energie ~ 5Kcal/mol

Liaisons H

Interactions électrostatiques

Interactions électrostatiques

Des molécules, (fragments) apolaires ont tendance à s'associer avec des parties Également apolaire entropie

LogP = Log du coefficient de partition entre le 1-octanol et l'eau (logKO/W)

Biodisponibilité et LogPBiodisponibilité et LogP

• Le logP mesuré ou calculé (clogP) est un descripteur fondamental pour estimer la biodisponibilité des molécules.

– Bonne balance hydrophobe/hydrophile

– Suffisamment hydrophile pour être soluble dans les milieux aqueux (sang, liquide intersticiel, cytoplasme ...)

– Suffisamment hydrophobe pour traverser les membranes

–

• Valeurs typiques varient de -3 (très hydrophile) à +7 (très hydrophobe)

• La plupart des molécules Drug like ont des logP dans la gamme 2-5.

• Importance du LogP pour modéliser des résultats in Vivo

Interactions hydrophobes

Morphine (clog P = 0.24) Cocaine (clog P = 2.72)

Indinavir (clog P = 2.78) Imipramine (clog P = 4.49)

OH

O

NCH3

O

OCH3

N NN

ONH

OH H

O

NOH

N NCH3

CH3

N

O

OH

CH3

OH

H

Lipinski “Rule of Five” (1)

MW 500 (opt = ~350) # accepteurs de liaison-H 10 (opt = ~5) # donneurs de liaison-H 5 (opt = ~2) -2 < cLog P < 5 (opt = ~3.0) # Flexibilité : rotules 5

1: C. Lipinski et al, Adv. Drug. Del. Rev, 23, 3-25 (1997)

CARACTERE DRUG-LIKE

Acides aminés

NH3+

CH

C

O

O-

R

NH2

CH

C

O

R1

N

CH

C

O

OH

R2

H

A PH 7 : le groupe amino est ionisé NH3+Et le groupe ac. Carboxylique aussi COO-

Les acides aminés s'associentPar liaison peptidique(fonction amide polaire)

Chaine latérale

Ac carboxyliqueamine

Carbonne alpha

NH2

CH

C

O

OH

R

Les chaines latérales, R, déterminent les differences dans les propriétées structurales et chimiques des 20 acides aminés naturels .

classifications

•Aliphatiques/hydrophobes Ala, Leu, Ile, Val

•Polaires Asn, Gln

•Fonction Alcool Ser, Thr, (Tyr)

•Souffrés Met, Cys

•Aromatique Phe, Tyr, Trp, (His)

•Chargés Arg, Lys, Asp, Glu, (His)

•Speciaux

Gly (pas de R)

Pro (cyclic, imino-acid)

Les 20 acides aminés naturels

A Ala Alanine

Petit, hydrophobeHélice alpha

peu chargé, hydrophobe

Ponts SSchélate les métaux

SH très réactif

C Cys Cysteine

G Gly Glycine

Pas de R Très flexibleHydrophobicité indéterminée

S Ser Serine

Petit, polaireFonction AlcoolHBD, HBA

Petit, hydrophobeFonction AlcoolHBD, HBA

T Thr Threonine

P Pro Proline

Imino acidRigiditéhydrophobe

Petits Acides aminés

K Lys Lysine R Arg ArginineH His

Histidine

Neutre ou chargé +Aromatique, HBD, HBA

Long, flexibleHydrophile Chargé +, HBD

Gros, guanidine rigideChargé +, HBD

E Glu Glutamic acidD Asp Aspartic acid

Hydrophile,Chargé – , HBA

Hydrophile,Chargé – , HBA

N Asn Asparagine

Polaire, neutreHBD, HBA

Q Gln Glutamine

Polaire, neutreHBD, HBA

Acides aminés Polaires ou chargésTaille moyenne

M Met MethionineV Val Valine

L Leu Leucine I Ile Isoleucine

Beta branché

Beta branché

Hydrophobes aliphatiques

souffré

Hydrophobes aromatiques

F Phe Phenylalanine

Y Tyr Tyrosine

Hydrophobe, Phenol, HBD et HBA

F Phe Phenylalanine

Grand, hydrophobe

W Trp Tryptophan

Grand, hydrophobe,HBD

Energie et molécules

Les structures moléculaires et les interactions moléculaires sont gouvernées Par des considérations énergétiques.

Les calculs d’énergies peuvent être effectués avec différents modèles

Au niveau de la mécanique quantique l’énergie de la molécule est calculée À partir des interactions explicites entre les électrons et les noyaux.

méthodes ab-initiométhodes semi-empiriques

Intérêt : précision Problèmes : temps de calcul 10-100s atomes

La mécanique moléculaire est une méthode empirique permettant de reproduireraisonnablement des résultats expérimentaux à partir de modèles mathématiquessimples des interactions. Ces modèles sont paramétrés pour les principaux typesatomiques qui servent à décrire les molécules d’intérêt. L’ensemble fonction mathématique + paramètres est appelé champ de force.

Intérêt : rapidité, taille Problèmes : paramétrisation, précision.

différences chimie quantique / mécanique moléculaire

Méthodes quantiques On distingue les noyaux et les électronsLes interactions électrons-électrons et électrons-noyaux sont explicites.Les interactions sont régies par les charges électroniques et nucléaires (énergie potentielle) et les mouvements électroniques.Les interactions déterminent la distribution spatiale des électrons et des noyaux Ainsi que leurs énergies

Mécanique moléculaire Noyaux et électrons sont modélisés en une seule particuleParticules sont sphériques (rayons atomiques expérimentaux ou théoriques) et possède une charge nette (théorique)Les interactions sont modélisées par des ressorts et des potentiels classiquesLes interactions doivent être préassignées à un jeu spécifique de type d’atomesLes interactions déterminent la distribution spatiale des particules atomique et leurs énergies

Energie et molécules

Energy = Stretching Energy + Bending Energy + Torsion Energy + Non-Bonded Interaction Energy

"K " contrôle la pente de la parabole

"K " contrôle la pente de la parabole

"A" contrôle l'amplitude et "n" la périodicité "phi" est la phase

"A" et "B" controlent la profondeur et la position du puit pour i et j

# Code Definition # Code Definition

1 C.3 carbon sp3 12 P.3 phosphorous sp3

2 C.2 carbon sp2 13 H hydrogen

4 C.1 carbon sp 13 H.spc hydrogen in Single Point Charge (SPC) water model

3 C.ar carbon aromatic 13 H.t3p

hydrogen in Transferable intermolecular Potential (TIP3P) water model

33 C.cat carbocation (C+) used only in a guadinium group

16 F fluorine

5 N.3 nitrogen sp3 15 Cl chlorine

6 N.2 nitrogen sp2 14 Br bromine

7 N.1 nitrogen sp 17 I iodine

11 N.ar nitrogen aromatic 27 Si silicon

28 N.am nitrogen amide 20 LP lone pair

19 N.pl3 nitrogen trigonal planar

26 Du dummy

31 N.4 nitrogen sp3 positively charged

21 Na sodium

8 O.3 oxygen sp3 22 K potassium

9 O.2 oxygen sp2 23 Ca calcium

32 O.co2 oxygen in carboxylate and phosphate groups

24 Li lithium

8 O.spc oxygen in Single Point Charge (SPC) water model

25 Al aluminum

8 O.t3p

oxygen in Transferable Intermolecular Potential (TIP3P) water model

- Any any atom (QSPR)

10 S.3 sulfur sp3 - Hal halogen (QSPR)

18 S.2 sulfur sp2 - Het heteroatom = N, O, S, P (QSPR)

29 S.O sulfoxide sulfur - Hev heavy (non hydrogen) atom (QSPR)

30 S.O2 sulfone sulfur

ji ij

ji

ji ij

ij

ij

ijij

impropersdihedrals

N

n

n

anglesbondsb

Dr

qq

rr

KnK

kbbkV

,,

612

20

1

20

20

4

cos1

Importance de la consistance du champ de force.Cohérence des paramêtres avec les charges partielles

MINIMISATION d’ENERGIE et DYNAMIQUE MOLECULAIRE

Notion de Surface d’énergie potentielle

Trajectoire

Initial

final

Notion de surface d’énergie potentielle

Minimisation

Les algorithmes de minimisation d’énergie mesurent l’énergie le long de la surface de façon incrémentale pour déterminer des directions qui mènent a un minimum.

Algorithmes incapables de changer de vallée.Minima locaux

Steepest Descent

Suit le gradient de la fonction énergie à chaque pas.Peut conduire à des oscillationsMauvaise convergence à l’approche du minimum.

Conjugate Gradients Tient compte des gradients calculés aux étapes précedentesPour éviter les oscillations.Peut rencontrer des problèmes quand conformations initiales sont très distordues

Newton-Raphson Prédit la position du minimum

Dynamique moléculaire, simulation

Comme pour la minimisation d’énergie, la dynamique moléculaire change les degrés de liberté du système pas à pas.Mais les pas en dynamique moléculaire, représentent les changement des positions atomiques, ri, en fonction du temps (i.e. vitesses).

La force exercée sur un atome peut être calculée à partir de la variation d’énergie entre deux positions.

L’énergie E est obtenue par mécanique moléculaire

La dynamique moléculaire utilise l’équation du mouvement de Newtonpour simuler les mouvements atomiques

On assigne des vitesses initiales aux atomes en fonction de l’énergie cinétique totale elle-même fonction de la température de simulation.

Le pas de calcul limite la durée des trajectoires calculables de l’ordre deQuelques picosecondes (10-12 secondes)

Connaissant les forces et les masses on peut ensuite résoudre les positions de chaque atome le long d’une série de pas de temps de l‘ordre de la femtoseconde (10-15 secondes).La série de positions instantanés obtenue constitue une trajectoire.

En pratique les accélérations atomiques sont calculéesÀ partir des forces et des masses

Les vitesses sont calculées à partir des accélérations

Les positions sont calculées à partir des vitesses

Analyse conformationnelle

Passage de 1D ou 2D à 3D

Programmes : Corina, Concord, Converter …

Problèmes :stéréochimie non définieformes tautomèresétat d’ionisation (représentation différente)aromaticitémacro-cycles, cycles branchés

multiplicité des formats de fichier texte (sdf, mol, mol2, smile) ou binaire

Solution : data pipelining

AdenineAmino form

Imino form

Keto form

Enol form

Thymine

Format smile du benzène C1:C:C:C:C:C1

Tautomérie

Format mol21 # Name: benzene

2 # Creating user name: tom 3 # Creation time: Wed Dec 28 00:18:30 1988 4 5 # Modifying user name: tom 6 # Modification time: Wed Dec 28 00:18:30 1988 7 8 @<TRIPOS>MOLECULE 9 benzene 10 12 12 1 0 0 11 SMALL 12 NO_CHARGES 13 14 15 @<TRIPOS>ATOM 16 1 C1 1.207 2.091 0.000 C.ar 1 BENZENE 0.000 17 2 C2 2.414 1.394 0.000 C.ar 1 BENZENE 0.000 18 3 C3 2.414 0.000 0.000 C.ar 1 BENZENE 0.000 19 4 C4 1.207 -0.697 0.000 C.ar 1 BENZENE 0.000 20 5 C5 0.000 0.000 0.000 C.ar 1 BENZENE 0.000 21 6 C6 0.000 1.394 0.000 C.ar 1 BENZENE 0.000 22 7 H1 1.207 3.175 0.000 H 1 BENZENE 0.000 23 8 H2 3.353 1.936 0.000 H 1 BENZENE 0.000 24 9 H3 3.353 -0.542 0.000 H 1 BENZENE 0.000 25 10 H4 1.207 -1.781 0.000 H 1 BENZENE 0.000 26 11 H5 -0.939 -0.542 0.000 H 1 BENZENE 0.000 27 12 H6 -0.939 1.936 0.000 H 1 BENZENE 0.000 28 @<TRIPOS>BOND 29 1 1 2 ar 30 2 1 6 ar 31 3 2 3 ar 32 4 3 4 ar 33 5 4 5 ar 34 6 5 6 ar 35 7 1 7 1 36 8 2 8 1 37 9 3 9 1 38 10 4 10 1 39 11 5 11 1 40 12 6 12 1 41 @<TRIPOS>SUBSTRUCTURE 42 1 BENZENE 1 PERM 0 **** **** 0 ROOT

Analyse conformationnelle

Génération des conformères et évaluation des énergies

- énumération exhaustive- Algorithme + élaboré : arborescence élagage de l'arbre- Procédure d'échantillonnage suivi de minimisation- dynamique a haute température + minimisation

Différent programmes : ClusteringDiversité des conformèresContraintes (pharmacophores, données expérimentales, statistiques (CCDC, PDB)

Echantillonnage systématique et surface D’énergie potentielle

Arborescence de l’échantillonnageélagage

Minimisation de l’énergie

Analyse statistique de la CSD



Des informations sur la structure 3D de la cible sont disponibles

Expérimentale 3D Cristallographie, RMN, Microscopie électronique.Précision atomique (résolution !)Les structures expérimentales ne sont pas forcémentdans la conformation recherchée !

Apo proteine, complexe avec agoniste alors qu’on cherche un antagoniste

Expérimentale 1D mutation + effet biologique … mutagénèse dirigée

Modèles par homologie la séquence de la cible est connue etLa structure 3D d’au moins une protéine homologue (template) est connue.Construction de la structure 3D de la cible calquée et adaptée à partir Des templates expérimentales homologues.

Modélisation par homologie : modeller

1 Les templates 3D sont alignées avec la séquence cible2 Des caractéristiques spatiales (distances Ca-Ca, dihèdres du squelette et des chaines latérales …) sont transférées sous forme de contraintes spatiales sur la cible.La forme des contraintes sont dérivées de l’analyse statistique de proteines homologues. 3 Ces contraintes sont combinées avec le champ de force CHARMM pour donner une fonction objectif à minimiser par dynamique moléculaire et minimisation.

La qualité de l’alignement initial est le paramêtre principal de la méthode sur lequelOn peut jouer. Alignement de familles + ajustement manuel.Le degré d’homologie détermine la qualité de la structure 3D que l’on peut obtenir.La distribution de la similarité sur les séquences a aussi son importance.

MODELLER implemente une automatisation de la modélisation par homologieEn incorporant des contraintes dérivées empiriquement d’une analyse statistique des relations entre un grand nombre de paires de structures homologues.Cette analyse repose sur une base de données de 105 familles d’alignement incluant 416 proteines de structures 3D connues. En pratique, des contraintes plus compliquées (probabilités conditionnelles) sont utilisées qui dépendent d’informations comme l’accessibilité au solvent et les distances par rapport aux gaps.

Modélisation par homologie modeller

Par analogie avec la RMN, modeller proposes différentes solutions avec des énergies voisines qui satisfont plus ou moins les contraintes.L’analyse et la validation des modèles générées sont essentielles.

distribution des violations de contraintes sur la séquence.Validation empirique par satisfaction de contraintes expérimentalesSélection des modèles qui rendent le mieux compte des relationsstructures activités …

La modélisation par homologie reste une science approximative !On reste à proximité de la structure 3D template.Problèmes spécifiques avec les boucles, gaps

Autres programmes d’intérêt : Composer, FugueIl existe de nombreux serveurs qui combinent l’étape d’analyse de séquenceEt de construction des modèles ex : http://swissmodel.expasy.org

Modélisation par homologie modeller

http://swissmodel.expasy.org/

Différents types de cibles Acides nucléiques triples hélices , ARN antisens

Protéines Canaux ioniquestransporteursEnzymes : protéases, kinases, caspases … Récepteurs : nucléaires, trans-membranaires GPCR Récepteurs de petites molécules ou interactions protéines-protéines

Différents types d’interactions

Enzymes : inhibiteurs compétitifs, non compétitifs, allostériquesRécepteurs : agonistes, antagonistes, agonistes inverses

Les modèles moléculaires doivent rendre compte des mécanismes d’interaction !

Energie libre de liaison

]][[

][

1

1

LP

C

k

kKbind

bindbind KRTΔG ln

ligand

protéine

complexe

eau

Interactions polaires avec le solvant

Interactions non-polaires avec le solvant

Interactions polaires avec le ligand

interactions

protein-ligand non-polaires

effets entropiques

k1 k-1

Thermodynamique de la liaison récepteur-ligand Thermodynamique de la liaison récepteur-ligand

4 scénarios sont possibles

H S G négatif? Pronostic1) (-) (+) toujours toujours spontané2) (+) (-) jamais jamais spontané3) (+) (+) si T(S) > H favorable si T élevée4) (-) (-) si T(S) < H favorable si T basse

G = H – T(S)

Pour un processus spontané, G doit être négatif

Ligand (aq) + Recepteur (aq) Ligand-Recepteur (aq)

etapes H S

Desolvatation du ligand défavorable favorable

Desolvatation du récepteur défavorable favorable

Ligand conformation active en général défavorable défavorable

Récepteur conformation de liaison défavorable défavorable

Liaison ligand récepteur doit être favorable ! défavorable

Maximiser les étapes favorables et minimiser les étapes défavorables

Thermodynamique de la liaison récepteur-ligand Thermodynamique de la liaison récepteur-ligand

Décomposition du processus en plusieurs étapes

• Minimiser l'enthalpy de désolvatation Le Ligand ne doit pas être trop hydrophile Pas trop de groupes pour faire des liaisons Hydrogène (Rêgles de Lipinski)

• Maximiser l'entropie de désolvatation Le ligand doit remplir toue la cavité déplacer toutes les molécules d'eau

• Minimiser le coût enthalpique pour adopter une conformation active La conformation active doit être de basse énergie

• Minimiser le coût entropique pour adopter une conformation active Le ligand doit être assez rigide (pas trop, la plupart de drogues sont semi-rigides)

• Maximiser l'enthalpie de liaison ligand-récepteur surfaces Hydrophobes du ligand en regard des surfaces hydrophobes du récepteur surfaces Hydrophiles du ligand en regard des surfaces hydrophiles du récepteur Complémentarité des liaisons H entre récepteur et ligand

Thermodynamique de la liaison récepteur-ligand comment ?

Thermodynamique de la liaison récepteur-ligand comment ?