Upload
vutuyen
View
213
Download
0
Embed Size (px)
Citation preview
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
Plan1. Introduction2. Historique3. Activité biologique4. Descripteurs moléculaires
4.1. Besoin de descripteurs4.2. Descripteurs 1D4.3. Descripteurs 2D
4.2.1. Topologiques4.2.2. De charges4.2.3. Fragmentaux
4.4. Descripteurs 3D4.4.1. Structuraux4.4.2. Energétiques4.4.3. Electroniques4.4.4. Thermodynamiques
5. Sélection des descripteurs6. Exemples7. Conclusions
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
1. Introduction
QSARQuantitative Structure Activity Relationships 2D et 3D
Contexte :
- Il y a environ 1.500 structures 3D expérimentales pour 150.000 à élucider
- Le nombre des structures 3D des cibles thérapeutiques est limité
- Les cibles les plus intéressantes sont les récepteurs membranaires
- Que faire si l'on n'a pas la structure?
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
1. Introduction
Caféine(stimule le rythme cardiaque)
Théophyline(ralentit le rythme cardiaque)Théobromine
(ralentit le rythme cardiaque)
Il existe une relation forte entre la structure et l'activitéIl existe une relation forte entre la structure et l'activité
1868 : Crum-Brown et Fraser, ''Il existe un lien entre la propriété pharmacologique d'un alkaloide et l'alkylation de l'azote – l'activité physiologique doit être une fonction de la structure chimique''
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
2. Historique
Bichet (1893) :"La toxicité des molécules organiques est inversement proportionnelle à leur solubilité aqueuse"
Meyer (1899) et Overton (1901) :"Il y a une relation linéaire entre l'activité des narcotiques et leur coefficient de partage huile-eau"
Hammett-Burkhardt (1937) : "mise en place d'une équation sur les effets des substituants en série aromatique"
Hansch (1964) : "Première méthode pour corréler l'activité biologique et la structure chimique"
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
1. Introduction
Activité biologique = f(structure)
Le but du QSAR est de générer une équation de type:
Problèmes:- Définir l'activité biologique- Mathématiser une structure chimique- Trouver une fonction qui permette la corrélation- Valider et interpréter le modèle généré
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
3. Activité biologique
EC50?EC90?IC50?IC90?K
i?
KD?
Problème de la qualité de la mesure biologique!II faut impérativement que le mécanisme d'action soit identique (biochimie)
On veut établir la relation suivante:
Activité biologique = f(structure)
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
3. Activité biologique
+
KD=[A ] [B ][AB ]
et Gbind=RTlnKD
Ce qui nous intéresse c'est la force de l'interaction donc ∆G
Il faut prendre le logarithme des concentrations!
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
3. Activité biologique
Pour déterminer si les molécules ont un mécanisme identique on se base surLa similarité moléculaire:
Exemple:
SO2
N
NH2
A
B
SO
N
NH2
A
B
S
N
NH2
A
B
IC50 anti HIV: 0,01µM 0,34 µM 0,43µM
Structure RX : NNRTI
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
3. Activité biologique
Il faut:
- Au minimum 20 composés (plus mieux)
- Un mécanisme d'action identique
- Une détermination chiffrée pour chaque composé
- Une idée de l'incertitude de la mesure
- Compréhension de la mesure et son impact (in vitro vs in vivo)
- Une variation d'activité sur au moins deux unités de log
- Une similarité structurale
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire4.1. Besoin de descripteurs
On veut une équation de type y = f(structure)
On va utiliser des données physico-chimiques pour décrire les molécules. Le type de données donne la dimensionnalité du QSAR:
Dimension Méthode
QSAR-1D Activité corrélée avec des données globales (MW, pKa...)
QSAR-2D 1D + activité corrélée avec données strucutrales sans 3D direct
QSAR-3D 2D + activité corrélée avec données 3D des ligands
QSAR-4D 3D + prise en compte de différentes conformations des ligands
QSAR-5D 4D + représentation de l'adaptation structurale de la cible
QSAR-6D 5D + représentation des effets de solvant
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaires
Définition : Un descripteur moléculaire est une valeur qui sert à caractériser numériquement des molécules dans un calcul QSAR/QSPR.
Nombre infini de descripteurs??!!
2D 3D
4.1. Besoin de descripteurs
1D
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire
4.2. Descripteurs 1D
Ils tiennent compte de la nature des atomes et des propriétés physicochimiques de chaque molécules.
Exemples:
- Masse molaire- nombre d'atome de chlore, d'iode, d'oxygène...- nombre de cycles à 6- nombre d'atomes aromatiques- nombre de liaisons...- pKa- logP
Ils sont faciles à calculer.Leurs valeurs sont précises et avec peu d'ambiguïté (sauf logP). ils sont essentiels et interviennent régulièrement dans les modèles.
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire
4.3. Descripteurs 2D4.3.1 Descripteurs topologiques
Ils sont liés à la connectivité des molécules. Connectivité?
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire
4.3. Descripteurs 2D4.3.1 Descripteurs topologiques
On représente usuellement les connectivités sous forme de matrice. Dès lors on peut faire de nombreuse opérations pour comparer celles-ci. Exemple de l'algorithme d'Ullman.
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire
4.3. Descripteurs 2D4.3.1 Descripteurs topologiques
algorithme d'Ullman: On cherche la matrice A tel que
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire
4.3. Descripteurs 2D4.3.1 Descripteurs topologiques
Descripteurs plus "sophistiqués" ils n'ont pas forcément un sens chimique évident.Calcul rapideImportant, ils interviennent souvent dans les modèles.
Exemple:
- Kier index- Wiener index- Balaban index- Kier index- Indice de chiralité- ...
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire
4.3. Descripteurs 2D4.3.2 Descripteurs de charges
Charge globale (avec les ions)
Charge partielle d'un atome donné sur une structure
Ils sont moins importants qu'il n'y paraît mais essentiels si on a un mélange de molécules chargées ou non.
Ce sont des descripteurs qui peuvent être calculés plus finement avec des descripteurs 3D.
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire
4.3. Descripteurs 2D4.3.3 Descripteurs fragmentaux
Descripteurs les plus emblématiques du QSAR.
Exemple: sigma de Hammett et pi de Hansch
On va prendre en compte des propriétés physicochimique de partie de la molécule.
Globalement cela revient à analyser les différences de groupes fonctionnels
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire
σ de Hammett
AX
4.3. Descripteurs 2D4.3.3 Descripteurs fragmentaux
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4.Descripteurs moléculaire
π de Hansch
logPΦ−COOH
=logPΦΠCOOHΠcorrection
Avec plusieurs mesures expérimentales on a les Πi
4.3. Descripteurs 2D4.3.3 Descripteurs fragmentaux
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire4.4. Descripteurs 3D
4.4.3. Descripteurs électroniques
Charges partielles (avec méthodes quantiques)Moment dipolaire, HOMO et LUMO.
4. Descripteurs moléculaire4.4. Descripteurs 3D
4.4.1. Descripteurs structuraux
volume de VDW (exact cette fois-ci), surface de VDW, surface de solvatation....
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire4.4. Descripteurs 3D
4.4.1. Descripteurs structuraux
On peut avoir des descripteurs plus difficile à appréhender.
Exemple des Shadow indices: Les molécules sont alignés selon leur axes d'inerties (x: principal puis y et z). Puis la molécule est projeté sur chacun des plans du repère orthonormé (Sxy). Enfin, le descripteur est exprimé en ratio par rapport à la dimension la plus importante de la projection.
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire4.4. Descripteurs 3D
4.4.1. Descripteurs structuraux
L'ensemble des descripteurs structuraux permettent une description détaillée des ligands.
Mais leurs difficultés d'obtentions et leurs précisions sont quelques fois des obstacles à l'élaboration de modèles précis.
Avec un peu d'imagination on peut en inventer autant que l'on veut suivant les variations géométriques que l'on veut faire apparaître.
4.4.2. Descripteurs énergétiques
Energie globale, Evdw, Ehbond,.....
Souvent peu intéressant
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire4.4. Descripteurs 3D
4.4.3. Descripteurs électroniques
Attention: pour rendre compte les électrons il faut simulation QM (semi-empirique ou DFT)
Exemples:- moment dipolaire- E
HOMO et E
LUMO
- ...
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
4. Descripteurs moléculaire4.4. Descripteurs 3D
4.4.3. Descripteurs électroniques
Ils permettent une interprétation physicochimique. Mais, ils sont difficiles à calculer et posent des problèmes de précisions.
4.4.4. Descripteurs thermodynamiques
Ils sont calculés sur la base de la fonction de partition. Ils nécessitent un calcul des fréquences de vibration. Ils sont peu utilisés sauf en QSPR
Exemples:- Enthalpie vibrationnelle- entropie translationnelle, vibrationnelle...- ...
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
5. Sélection des descripteursC'est le problème fondamental du QSAR!
On génère tous (entre 400 et 1000) les descripteurs possible il faut sélectionner ceux qui sont les plus pertinent pour notre modèle.
1ère étape Elimination des descripteurs inintéressant par analyse statistique = ceux qui présente une très faible variance sur l'ensemble des molécules (la valeur du descripteur ne change pas ou peu pour l'ensemble des molécules = donc pas de description).
2ème étapeRégression à choisir parmi différents types
- stepwise régression- multi-linear régression- méthode heuristique- ...
5. Sélection des descripteurs3ème étapeOn calcule une régression linéaire pour chaque descripteur restant. On élimine le descripteurs si:
- test Fisher < 1- r² inférieur à une valeur seuil (paramétrable)- paramètre de Student < 0.1- deux descripteurs ont un r² d'intercorrélation > 0.8
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
6. ExemplesOn s'intéresse à prédire les temps d'élutions pour des acides aminés et des dérivés d'acides aminés (base ~30 composés)
Logiciel CODESSA (COmprehensive Descriptors for Structural and Statistical Analysis)+ HYPERCHEM (AM1 avec MOPAC) pour descripteurs 3D
Calcul de 460 descripteurs
Corrélation / Sélection des descripteurs / Breaking point
PCA pour éliminer les descripteurs redondants
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
R² = 0.84
Time = 50.94 + 3.69 Rev – 2.40 Þ + 0.059 Szx
Rev : « Reverse Index »
Þ : « Randic Index »
Szx : « ZX Shadow »
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
6. ExemplesOn s'intéresse à une série de 24 composés inhibiteurs d'entrées du VIH-1. La cible d'attaque est la protéine gp41. Même protocole.
Dr. Florent Barbault, ITODYS (CNRS UMR 7086)
7. Conclusions
QSAR 2D
- Outils puissant de drug-design- Facile à mettre en place- Nécessite un jeux de données statistiquement valable- On peut interpréter chimiquement l'équation résultante- Il faut comprendre chimiquement les descripteurs- On ne peut interpréter des régions structurales non-étudiées- Il ne faut sur-interpréter le résultat! Données bio = fragile- Ne pas perdre le sens chimique du QSAR!- Ne pas perdre le sens chimique du QSAR!
Perspective/développement- Méthodes de corrélations : RNA, SVM, AG...- Tests statistiques fiables- Encore plus de descripteurs???- 3D???- Projet Européen Reach