Drug Design
Etienne Thoreau
• Généralités sur le drug discovery, •contexte industriel• Petites molécules / macromolécules• Types atomiques, types d'interaction• Acides aminés• Energie et molécules• Analyse conformationnelle• Énergie libre• Structure(s) 3D de la cible : Docking, SBDD
•Rigide•Flexible
•molécules actives : Pharmacophores, QSAR•pas de structure 3D de la cible, pas de molécules actives : diversité
Modélisation moléculaire et recherchePharmaceutique (RDD,CADD, SBDD…)
Target SélectionStructure 3D de la cible connue, faisabilité ?ligands connus, pharmacophore ?
Hit findingVirtual screening, database filtering
Hit to leaddocking, sélectivité
Lead Optimisationvirtual ADMET, chemogenomics
Développement
Recherche
70s– Leads = produits naturels, hazard– Optimisation tributaire de la chimie, fondée sur hypothèses– Limitations : expérimentation animale
90s– Modélisation moléculaire– Tests in-vitro ( inhibition d'enzymes, liaison au récepteur)– Limitations : synthèse chimique
2000– Genie génétique (production de proteines)– Structure-based drug design– Chimie conbinatoire (mélanges)– High-throughput screening (HTS)– Limitations : propriété ADMET des leads
• 2000 – Genomique, proteomique, pharmacogenomique, bioinformatique– Animaux transgéniques proof of concept (POC)– Chimie combinatoire (1 composé par puit, librairies focalisées ou diverses)– Structure-based drug design– Data mining (screening virtuel de très grande librairie)– ADMET profiling (HTS et virtual ADMET, chemo-génomique) – data pipelining– Limitations : validation de cible, déluge de données
Evolution de la recherche en Drug discoveryNouvelles technologies et nouvelles limitations
Causes des échecs en Drug DiscoveryCauses des échecs en Drug Discovery
• mauvaise pharmacocinetique (mauvais profile ADME chez l'homme, métabolites problématiques)
• Faibles activités cliniques
• Effets secondaires, toxicité (métabolites, sélectivité)
• Stratégie marketing
• Plus l'échec est tardif plus il coûteux !
Nouvelles Stratégies en Drug DesignNouvelles Stratégies en Drug Design
• Conception d'inhibiteurs à partir de la structure du substrat
• Identification de Pharmacophores
• peptidomimétiques
• Structure-based drug design Meilleure prise en compte de l'Affinité, de la sélectivité
• Computer-aided drug design
• Combinatorial drug design
• caratère drug-like, biodisponibilité (e.g., Lipinski’s Rule of Five)
Petites molécules / Macro-molécules
N
O
N
N
N
O
N
N
NN
O
N
N
O
S
O
COOH
OO
O
•Distinction en fonction de la chimie et de la complexité de la molécule, cible ligand
•Distinction en terme d’accessibilité de la structure 3D par le calcul
•Similarité pour les interactions
O
O
H
H
H
Progestérone
PGF2a
HRWM
12,5
Petites molécules / Macro-molécules
N
O
N
N
N
O
N
N
NN
O
N
N
O
S
O
D’un point de vue computationnel, une petite molécule est une moléculepour laquelle on peut énumérer toutes ses conformations :
Pour une petite molécule, par analyse conformationnelle on peut calculer lesconformations d’énergies minimales (énumération)(la conformation active implique l’énergie du complexe proteine-ligand !)
20 liaisons sp3-sp3 incrémént 120°Nconformations = 320 = 3.5 109
O
O
H
H
H
Cycles saturés fusionnés
Petites molécules / Macro-molécules
Les différentes conformations des macromolécules protéiques ne peuvent êtrerecherchées exhaustivement.
On ne peut déduire la structure 3D d’une protéine à partir de sa seule séquence (protein folding).
L’information structurale fiable est principalement expérimentalepar cristallographie ou RMN .
En revanche, ces polymères sont simples au niveau de leur séquence primaire (analyse de séquences et obtention de modéles approximatifs par homologie au sein de protéines de la même famille)
RFGENHAIMGVAFTWVMALACAAPPLVARVSVARARLALAAVAAVALAVALLPLAVASQRRAWATVGLVWAAALALGLLPLTKITSKHVKMMLSGVCLFAVFIALLPILG
Interactions moléculaires
Les interactions inter et intra-moléculaires sont de plusieurs types
Interactions polairesliaisons hydrogènesinteractions électrostatiques, pont salinsdipoles-dipoles
Interactions hydrophobesaromatiques aliphatiques
Interactions moléculaires
Les interactions polaires proviennent de la distribution inégales des charges dues auxassociations chimiques entre atomes d'électronégativités différentes fonctions chimiques
Liaison-H :"Partage" un H
D - A -
H +
R
R
Energie ~ 5Kcal/mol
Liaisons H
Interactions électrostatiques
Interactions électrostatiques
Des molécules, (fragments) apolaires ont tendance à s'associer avec des parties Également apolaire entropie
LogP = Log du coefficient de partition entre le 1-octanol et l'eau (logKO/W)
Biodisponibilité et LogPBiodisponibilité et LogP
• Le logP mesuré ou calculé (clogP) est un descripteur fondamental pour estimer la biodisponibilité des molécules.
– Bonne balance hydrophobe/hydrophile
– Suffisamment hydrophile pour être soluble dans les milieux aqueux (sang, liquide intersticiel, cytoplasme ...)
– Suffisamment hydrophobe pour traverser les membranes
–
• Valeurs typiques varient de -3 (très hydrophile) à +7 (très hydrophobe)
• La plupart des molécules Drug like ont des logP dans la gamme 2-5.
• Importance du LogP pour modéliser des résultats in Vivo
Interactions hydrophobes
Morphine (clog P = 0.24) Cocaine (clog P = 2.72)
Indinavir (clog P = 2.78) Imipramine (clog P = 4.49)
OH
O
NCH3
O
OCH3
N NN
ONH
OH H
O
NOH
N NCH3
CH3
N
O
OH
CH3
OH
H
Lipinski “Rule of Five” (1)
MW 500 (opt = ~350) # accepteurs de liaison-H 10 (opt = ~5) # donneurs de liaison-H 5 (opt = ~2) -2 < cLog P < 5 (opt = ~3.0) # Flexibilité : rotules 5
1: C. Lipinski et al, Adv. Drug. Del. Rev, 23, 3-25 (1997)
CARACTERE DRUG-LIKE
Acides aminés
NH3+
CH
C
O
O-
R
NH2
CH
C
O
R1
N
CH
C
O
OH
R2
H
A PH 7 : le groupe amino est ionisé NH3+Et le groupe ac. Carboxylique aussi COO-
Les acides aminés s'associentPar liaison peptidique(fonction amide polaire)
Chaine latérale
Ac carboxyliqueamine
Carbonne alpha
NH2
CH
C
O
OH
R
Les chaines latérales, R, déterminent les differences dans les propriétées structurales et chimiques des 20 acides aminés naturels .
classifications
•Aliphatiques/hydrophobes Ala, Leu, Ile, Val
•Polaires Asn, Gln
•Fonction Alcool Ser, Thr, (Tyr)
•Souffrés Met, Cys
•Aromatique Phe, Tyr, Trp, (His)
•Chargés Arg, Lys, Asp, Glu, (His)
•Speciaux
Gly (pas de R)
Pro (cyclic, imino-acid)
Les 20 acides aminés naturels
A Ala Alanine
Petit, hydrophobeHélice alpha
peu chargé, hydrophobe
Ponts SSchélate les métaux
SH très réactif
C Cys Cysteine
G Gly Glycine
Pas de R Très flexibleHydrophobicité indéterminée
S Ser Serine
Petit, polaireFonction AlcoolHBD, HBA
Petit, hydrophobeFonction AlcoolHBD, HBA
T Thr Threonine
P Pro Proline
Imino acidRigiditéhydrophobe
Petits Acides aminés
K Lys Lysine R Arg ArginineH His
Histidine
Neutre ou chargé +Aromatique, HBD, HBA
Long, flexibleHydrophile Chargé +, HBD
Gros, guanidine rigideChargé +, HBD
E Glu Glutamic acidD Asp Aspartic acid
Hydrophile,Chargé – , HBA
Hydrophile,Chargé – , HBA
N Asn Asparagine
Polaire, neutreHBD, HBA
Q Gln Glutamine
Polaire, neutreHBD, HBA
Acides aminés Polaires ou chargésTaille moyenne
M Met MethionineV Val Valine
L Leu Leucine I Ile Isoleucine
Beta branché
Beta branché
Hydrophobes aliphatiques
souffré
Hydrophobes aromatiques
F Phe Phenylalanine
Y Tyr Tyrosine
Hydrophobe, Phenol, HBD et HBA
F Phe Phenylalanine
Grand, hydrophobe
W Trp Tryptophan
Grand, hydrophobe,HBD
Energie et molécules
Les structures moléculaires et les interactions moléculaires sont gouvernées Par des considérations énergétiques.
Les calculs d’énergies peuvent être effectués avec différents modèles
Au niveau de la mécanique quantique l’énergie de la molécule est calculée À partir des interactions explicites entre les électrons et les noyaux.
méthodes ab-initiométhodes semi-empiriques
Intérêt : précision Problèmes : temps de calcul 10-100s atomes
La mécanique moléculaire est une méthode empirique permettant de reproduireraisonnablement des résultats expérimentaux à partir de modèles mathématiquessimples des interactions. Ces modèles sont paramétrés pour les principaux typesatomiques qui servent à décrire les molécules d’intérêt. L’ensemble fonction mathématique + paramètres est appelé champ de force.
Intérêt : rapidité, taille Problèmes : paramétrisation, précision.
différences chimie quantique / mécanique moléculaire
Méthodes quantiques On distingue les noyaux et les électronsLes interactions électrons-électrons et électrons-noyaux sont explicites.Les interactions sont régies par les charges électroniques et nucléaires (énergie potentielle) et les mouvements électroniques.Les interactions déterminent la distribution spatiale des électrons et des noyaux Ainsi que leurs énergies
Mécanique moléculaire Noyaux et électrons sont modélisés en une seule particuleParticules sont sphériques (rayons atomiques expérimentaux ou théoriques) et possède une charge nette (théorique)Les interactions sont modélisées par des ressorts et des potentiels classiquesLes interactions doivent être préassignées à un jeu spécifique de type d’atomesLes interactions déterminent la distribution spatiale des particules atomique et leurs énergies
Energie et molécules
Energy = Stretching Energy + Bending Energy + Torsion Energy + Non-Bonded Interaction Energy
"K " contrôle la pente de la parabole
"K " contrôle la pente de la parabole
"A" contrôle l'amplitude et "n" la périodicité "phi" est la phase
"A" et "B" controlent la profondeur et la position du puit pour i et j
# Code Definition # Code Definition
1 C.3 carbon sp3 12 P.3 phosphorous sp3
2 C.2 carbon sp2 13 H hydrogen
4 C.1 carbon sp 13 H.spc hydrogen in Single Point Charge (SPC) water model
3 C.ar carbon aromatic 13 H.t3p
hydrogen in Transferable intermolecular Potential (TIP3P) water model
33 C.cat carbocation (C+) used only in a guadinium group
16 F fluorine
5 N.3 nitrogen sp3 15 Cl chlorine
6 N.2 nitrogen sp2 14 Br bromine
7 N.1 nitrogen sp 17 I iodine
11 N.ar nitrogen aromatic 27 Si silicon
28 N.am nitrogen amide 20 LP lone pair
19 N.pl3 nitrogen trigonal planar
26 Du dummy
31 N.4 nitrogen sp3 positively charged
21 Na sodium
8 O.3 oxygen sp3 22 K potassium
9 O.2 oxygen sp2 23 Ca calcium
32 O.co2 oxygen in carboxylate and phosphate groups
24 Li lithium
8 O.spc oxygen in Single Point Charge (SPC) water model
25 Al aluminum
8 O.t3p
oxygen in Transferable Intermolecular Potential (TIP3P) water model
- Any any atom (QSPR)
10 S.3 sulfur sp3 - Hal halogen (QSPR)
18 S.2 sulfur sp2 - Het heteroatom = N, O, S, P (QSPR)
29 S.O sulfoxide sulfur - Hev heavy (non hydrogen) atom (QSPR)
30 S.O2 sulfone sulfur
ji ij
ji
ji ij
ij
ij
ijij
impropersdihedrals
N
n
n
anglesbondsb
Dr
rr
KnK
kbbkV
,,
612
20
1
20
20
4
cos1
Importance de la consistance du champ de force.Cohérence des paramêtres avec les charges partielles
MINIMISATION d’ENERGIE et DYNAMIQUE MOLECULAIRE
Notion de Surface d’énergie potentielle
Trajectoire
Initial
final
Notion de surface d’énergie potentielle
Minimisation
Les algorithmes de minimisation d’énergie mesurent l’énergie le long de la surface de façon incrémentale pour déterminer des directions qui mènent a un minimum.
Algorithmes incapables de changer de vallée.Minima locaux
Steepest Descent
Suit le gradient de la fonction énergie à chaque pas.Peut conduire à des oscillationsMauvaise convergence à l’approche du minimum.
Conjugate Gradients Tient compte des gradients calculés aux étapes précedentesPour éviter les oscillations.Peut rencontrer des problèmes quand conformations initiales sont très distordues
Newton-Raphson Prédit la position du minimum
Dynamique moléculaire, simulation
Comme pour la minimisation d’énergie, la dynamique moléculaire change les degrés de liberté du système pas à pas.Mais les pas en dynamique moléculaire, représentent les changement des positions atomiques, ri, en fonction du temps (i.e. vitesses).
La force exercée sur un atome peut être calculée à partir de la variation d’énergie entre deux positions.
L’énergie E est obtenue par mécanique moléculaire
La dynamique moléculaire utilise l’équation du mouvement de Newtonpour simuler les mouvements atomiques
On assigne des vitesses initiales aux atomes en fonction de l’énergie cinétique totale elle-même fonction de la température de simulation.
Le pas de calcul limite la durée des trajectoires calculables de l’ordre deQuelques picosecondes (10-12 secondes)
Connaissant les forces et les masses on peut ensuite résoudre les positions de chaque atome le long d’une série de pas de temps de l‘ordre de la femtoseconde (10-15 secondes).La série de positions instantanés obtenue constitue une trajectoire.
En pratique les accélérations atomiques sont calculéesÀ partir des forces et des masses
Les vitesses sont calculées à partir des accélérations
Les positions sont calculées à partir des vitesses
Analyse conformationnelle
Passage de 1D ou 2D à 3D
Programmes : Corina, Concord, Converter …
Problèmes :stéréochimie non définieformes tautomèresétat d’ionisation (représentation différente)aromaticitémacro-cycles, cycles branchés
multiplicité des formats de fichier texte (sdf, mol, mol2, smile) ou binaire
Solution : data pipelining
AdenineAmino form
Imino form
Keto form
Enol form
Thymine
Format smile du benzène C1:C:C:C:C:C1
Tautomérie
Format mol21 # Name: benzene
2 # Creating user name: tom 3 # Creation time: Wed Dec 28 00:18:30 1988 4 5 # Modifying user name: tom 6 # Modification time: Wed Dec 28 00:18:30 1988 7 8 @<TRIPOS>MOLECULE 9 benzene 10 12 12 1 0 0 11 SMALL 12 NO_CHARGES 13 14 15 @<TRIPOS>ATOM 16 1 C1 1.207 2.091 0.000 C.ar 1 BENZENE 0.000 17 2 C2 2.414 1.394 0.000 C.ar 1 BENZENE 0.000 18 3 C3 2.414 0.000 0.000 C.ar 1 BENZENE 0.000 19 4 C4 1.207 -0.697 0.000 C.ar 1 BENZENE 0.000 20 5 C5 0.000 0.000 0.000 C.ar 1 BENZENE 0.000 21 6 C6 0.000 1.394 0.000 C.ar 1 BENZENE 0.000 22 7 H1 1.207 3.175 0.000 H 1 BENZENE 0.000 23 8 H2 3.353 1.936 0.000 H 1 BENZENE 0.000 24 9 H3 3.353 -0.542 0.000 H 1 BENZENE 0.000 25 10 H4 1.207 -1.781 0.000 H 1 BENZENE 0.000 26 11 H5 -0.939 -0.542 0.000 H 1 BENZENE 0.000 27 12 H6 -0.939 1.936 0.000 H 1 BENZENE 0.000 28 @<TRIPOS>BOND 29 1 1 2 ar 30 2 1 6 ar 31 3 2 3 ar 32 4 3 4 ar 33 5 4 5 ar 34 6 5 6 ar 35 7 1 7 1 36 8 2 8 1 37 9 3 9 1 38 10 4 10 1 39 11 5 11 1 40 12 6 12 1 41 @<TRIPOS>SUBSTRUCTURE 42 1 BENZENE 1 PERM 0 **** **** 0 ROOT
Analyse conformationnelle
Génération des conformères et évaluation des énergies
- énumération exhaustive- Algorithme + élaboré : arborescence élagage de l'arbre- Procédure d'échantillonnage suivi de minimisation- dynamique a haute température + minimisation
Différent programmes : ClusteringDiversité des conformèresContraintes (pharmacophores, données expérimentales, statistiques (CCDC, PDB)
Echantillonnage systématique et surface D’énergie potentielle
Arborescence de l’échantillonnageélagage
Minimisation de l’énergie
Analyse statistique de la CSD
Analyse statistique de la CSD
Analyse statistique de la CSD
Des informations sur la structure 3D de la cible sont disponibles
Expérimentale 3D Cristallographie, RMN, Microscopie électronique.Précision atomique (résolution !)Les structures expérimentales ne sont pas forcémentdans la conformation recherchée !
Apo proteine, complexe avec agoniste alors qu’on cherche un antagoniste
Expérimentale 1D mutation + effet biologique … mutagénèse dirigée
Modèles par homologie la séquence de la cible est connue etLa structure 3D d’au moins une protéine homologue (template) est connue.Construction de la structure 3D de la cible calquée et adaptée à partir Des templates expérimentales homologues.
Modélisation par homologie : modeller
1 Les templates 3D sont alignées avec la séquence cible2 Des caractéristiques spatiales (distances Ca-Ca, dihèdres du squelette et des chaines latérales …) sont transférées sous forme de contraintes spatiales sur la cible.La forme des contraintes sont dérivées de l’analyse statistique de proteines homologues. 3 Ces contraintes sont combinées avec le champ de force CHARMM pour donner une fonction objectif à minimiser par dynamique moléculaire et minimisation.
La qualité de l’alignement initial est le paramêtre principal de la méthode sur lequelOn peut jouer. Alignement de familles + ajustement manuel.Le degré d’homologie détermine la qualité de la structure 3D que l’on peut obtenir.La distribution de la similarité sur les séquences a aussi son importance.
MODELLER implemente une automatisation de la modélisation par homologieEn incorporant des contraintes dérivées empiriquement d’une analyse statistique des relations entre un grand nombre de paires de structures homologues.Cette analyse repose sur une base de données de 105 familles d’alignement incluant 416 proteines de structures 3D connues. En pratique, des contraintes plus compliquées (probabilités conditionnelles) sont utilisées qui dépendent d’informations comme l’accessibilité au solvent et les distances par rapport aux gaps.
Modélisation par homologie modeller
Par analogie avec la RMN, modeller proposes différentes solutions avec des énergies voisines qui satisfont plus ou moins les contraintes.L’analyse et la validation des modèles générées sont essentielles.
distribution des violations de contraintes sur la séquence.Validation empirique par satisfaction de contraintes expérimentalesSélection des modèles qui rendent le mieux compte des relationsstructures activités …
La modélisation par homologie reste une science approximative !On reste à proximité de la structure 3D template.Problèmes spécifiques avec les boucles, gaps
Autres programmes d’intérêt : Composer, FugueIl existe de nombreux serveurs qui combinent l’étape d’analyse de séquenceEt de construction des modèles ex : http://swissmodel.expasy.org
Modélisation par homologie modeller
Différents types de cibles Acides nucléiques triples hélices , ARN antisens
Protéines Canaux ioniquestransporteursEnzymes : protéases, kinases, caspases … Récepteurs : nucléaires, trans-membranaires GPCR Récepteurs de petites molécules ou interactions protéines-protéines
Différents types d’interactions
Enzymes : inhibiteurs compétitifs, non compétitifs, allostériquesRécepteurs : agonistes, antagonistes, agonistes inverses
Les modèles moléculaires doivent rendre compte des mécanismes d’interaction !
Energie libre de liaison
]][[
][
1
1
LP
C
k
kKbind
bindbind KRTΔG ln
ligand
protéine
complexe
eau
Interactions polaires avec le solvant
Interactions non-polaires avec le solvant
Interactions polaires avec le ligand
interactions
protein-ligand non-polaires
effets entropiques
k1 k-1
Thermodynamique de la liaison récepteur-ligand Thermodynamique de la liaison récepteur-ligand
4 scénarios sont possibles
H S G négatif? Pronostic1) (-) (+) toujours toujours spontané2) (+) (-) jamais jamais spontané3) (+) (+) si T(S) > H favorable si T élevée4) (-) (-) si T(S) < H favorable si T basse
G = H – T(S)
Pour un processus spontané, G doit être négatif
Ligand (aq) + Recepteur (aq) Ligand-Recepteur (aq)
etapes H S
Desolvatation du ligand défavorable favorable
Desolvatation du récepteur défavorable favorable
Ligand conformation active en général défavorable défavorable
Récepteur conformation de liaison défavorable défavorable
Liaison ligand récepteur doit être favorable ! défavorable
Maximiser les étapes favorables et minimiser les étapes défavorables
Thermodynamique de la liaison récepteur-ligand Thermodynamique de la liaison récepteur-ligand
Décomposition du processus en plusieurs étapes
• Minimiser l'enthalpy de désolvatation Le Ligand ne doit pas être trop hydrophile Pas trop de groupes pour faire des liaisons Hydrogène (Rêgles de Lipinski)
• Maximiser l'entropie de désolvatation Le ligand doit remplir toue la cavité déplacer toutes les molécules d'eau
• Minimiser le coût enthalpique pour adopter une conformation active La conformation active doit être de basse énergie
• Minimiser le coût entropique pour adopter une conformation active Le ligand doit être assez rigide (pas trop, la plupart de drogues sont semi-rigides)
• Maximiser l'enthalpie de liaison ligand-récepteur surfaces Hydrophobes du ligand en regard des surfaces hydrophobes du récepteur surfaces Hydrophiles du ligand en regard des surfaces hydrophiles du récepteur Complémentarité des liaisons H entre récepteur et ligand
Thermodynamique de la liaison récepteur-ligand comment ?
Thermodynamique de la liaison récepteur-ligand comment ?