Upload
vutuong
View
214
Download
0
Embed Size (px)
Citation preview
Développement d'une méthode de prédictionde l'orientation et de l'insertion des protéines
dans une membrane modèle
Mémoire
Andrei Tudor
Maîtrise en biochimieMaître ès sciences (M. Sc.)
Québec, Canada
© Andrei Tudor, 2016
Résumé
Les protéines membranaires intégrales jouent un rôle indispensable dans la
survie des cellules et 20 à 30% des cadres de lectures ouverts codent pour cette
classe de protéines. La majorité des protéines membranaires se trouvant sur la
Protein Data Bank n’ont pas une orientation et une insertion connue. L’orientation,
l’insertion et la conformation que les protéines membranaires ont lorsqu’elles
interagissent avec une bicouche lipidique sont importantes pour la compréhension
de leur fonction, mais ce sont des caractéristiques difficiles à obtenir par des
méthodes expérimentales. Des méthodes computationnelles peuvent réduire le
temps et le coût de l'identification des caractéristiques des protéines
membranaires. Dans le cadre de ce projet de maîtrise, nous proposons une
nouvelle méthode computationnelle qui prédit l’orientation et l’insertion d’une
protéine dans une membrane. La méthode est basée sur les potentiels de force
moyenne de l’insertion membranaire des chaînes latérales des acides aminés
dans une membrane modèle composèe de dioléoylphosphatidylcholine.
iii
Abstract
Integral membrane proteins play many important roles, and account for 20
to 30% of the open reading frames code for this class of proteins. Most of the
membrane proteins found on the Protein Data Bank do not have a known
membrane orientation and insertion, and such information is not available from the
standard PDB format. The orientation, insertion and conformation that the
membrane proteins have when interacting with a lipid bilayer are important for
understanding their functions, but they are difficult characteristics to obtain
experimentally. Computational methods can help reduce the cost and time
allocated to determine the characteristics of a membrane protein. In this project,
we propose a new computational method that predicts the orientation and the
insertion of a protein in a lipid bilayer. The method is based on the potential mean
force of the insertion of the amino acid side chain analogs in a
dioleoylphosphatidylcholine lipid bilayer.
v
Table des matières
Résumé ..................................................................................................................... iiiAbstract ...................................................................................................................... vTable des matières ................................................................................................... viiListe des figures ........................................................................................................ ixListe des abréviations .............................................................................................. xiiiRemerciements ........................................................................................................ xvChapitre 1 : Introduction ............................................................................................. 1
1.1 Membranes ...................................................................................................... 11.2 Phospholipides ................................................................................................ 11.3 Membranes modèles ....................................................................................... 31.4 Protéines membranaires ................................................................................. 41.5 Les méthodes expérimentales ......................................................................... 71.6 Les méthodes computationnelles .................................................................. 10
Chapitre 2 : Hypothèse et Objectif ........................................................................... 152.1 Hypothèse ...................................................................................................... 152.2 Objectif ........................................................................................................... 15
Chapitre 3 : Méthodes .............................................................................................. 173.1 Théorie ........................................................................................................... 173.2 Calcul des PMF ............................................................................................. 19
3.2.1 Informations sur les simulations ............................................................. 213.3 Calcul du score .............................................................................................. 223.4 Méthodes utilisées par MemP3 ..................................................................... 253.5 Approximations nécessaires .......................................................................... 283.6 Méthodologie de la validation ........................................................................ 29
Chapitre 4 : Résultats ............................................................................................... 314.1 Peptide modèle .............................................................................................. 324.2 Protéines équilibrées par dynamique moléculaire ........................................ 34
4.2.1 Caveoline 1 ............................................................................................. 344.2.2 Protéine liant le retinol chez le bovin (PDB: 1KT7) ................................ 354.2.3 Src Homology 3 domain (PDB: 1SHG) ................................................. 384.2.4 Canal Potassium KvAP (PDB: 1ORS) ................................................... 394.2.5 Outer membrane protein W (PDB: 2F1V) .............................................. 414.2.5 Synaptotagmine C2B ............................................................................ 444.2.6 Cytochrome P450 3A4 ........................................................................... 464.2.7 Cytochrome P450 2C9 ........................................................................... 484.2.9 OMPLA (PDB: 1QD6) ............................................................................. 50
4.3 Limites de la méthode ................................................................................... 524.3.1 Hémoglobine tronquée (trHbN) - simulations de dynamique moléculaire ......................................................................................................................... 524.3.2 Hémoglobine tronquée (trHbN) - PDB 1IDR .......................................... 534.3.3 Peptide de fusion du virus de l’influenza (FusPept) - simulations de dynamique moléculaire ................................................................................... 544.3.4 Peptide de fusion du virus de l’influenza (FusPept) - PDB 1IBN ........... 55
vii
Chapitre 5 : Discussion ............................................................................................ 575.1 Précision de la méthode ................................................................................ 585.2 Limites de la méthode ................................................................................... 595.3 Vitesse de prédiction ..................................................................................... 62
Chapitre 6 : Conclusion et Perspectives .................................................................. 636.1 Conclusion ..................................................................................................... 636.2 Perspectives .................................................................................................. 64
Bibliographie ............................................................................................................ 67
viii
Liste des figures
Figure 1 : Exemple de membrane biologique. La membrane biologique d’une cellule est composée de phospholipides, de protéines membranaires (périphériques et transmembranaires), de cholesterol et d'oligosaccharides. Image adaptée de WikiCommons (https://commons.wikimedia.org/wiki/File: CellMembraneDrawing.jpg).....2
Figure 2 : Structure générale d’un phospholipide. La composition d’un phospholipide dépend de la nature de la molécule liée au groupement phosphate en position R3, ainsi que la nature des chaînes aliphatiques (R1 et R2) qui sont liées au glycérol à l’aide des groupements carbonyles. Image construite à l’aide du logiciel Marvin Sketch, ChemAxon (http://www.chemaxon.com)....................................................3
Figure 3 : Représentation d’une membrane modèle de POPC. En bleu foncé est représentée la phase aqueuse, les sphères rouges représentent les atomes d’oxygène et du glycérol, les sphères orange représentent les atomes de phosphate et les sphères grises représentent les atomes de carbone (les atomes d’hydrogène sont omis pour plus de clarté).............4
Figure 4 : Représentation d’une protéine périphérique et une transmembranaire. Image adaptée de WikiCommons ( https://commons.wikimedia.org/wiki/File:Cell_membrane_scheme.png )....................................................................................................................5
Figure 5 : Graphique du PMF d’insertion membranaire de la chaîne latérale des acides aminés lysine et alanine en fonction de la position en Z. L’énergie d’insertion est représentée selon l’axe X, et la position d’insertion selon lanormale du plan de la membrane est indiquée selon l’axe Z. Une énergie d’insertion positive est défavorable. Le centre de la membrane est situé àZ = 0 Å, et l’interface de la membrane se retrouve à Z ≈ 20Å. Les valeurs de PMF sont tirées des travaux de MacCallum et Tieleman (18)............14
Figure 6: L’acide aminé valine avec l’analogue de sa chaîne latérale. La chaîne latérale de l’acide aminé valine est tronquée au carbone β et la liaison avec le carbone α est remplacée par un proton.......................................20
Figure 7 : Représentation de la surface exposée au solvant (SASA) de la chaîne latérale du résidu LEU3 en présence du squelette protéique et le SASA de la même chaîne latérale seule dans le solvant. (A) La chaîne latérale du résidu LEU3 de la protéine trHbN (PDB: 1IDR) représentée sous forme de bâtonnets (jaune). Les sphères représentent les résidus LEU4 (gauche) et ILE13 (droite) qui influencent le SASA de la chaîne latérale LEU3. Le squelette de la protéine est représenté en cartoon. Les points bleus représentent le SASA de la chaîne latérale du résidu LEU3. (B) Le SASA de la chaîne latérale LEU3 complètement immergée dans le solvant est représenté par les sphères bleues.........................................24
ix
Figure 8 : Comparaison des prédictions du peptide poly-leucine faites par MemP3 (orange) et par PPM (vert) pour un peptide de poly-leucine formé de 25 résidus. ....................................................................................................33
Figure 9 : Comparaison des prédictions de la calveolin faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Riu et al. (23). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...................................................................................................35
Figure 10 : Comparaison des prédictions de la protéine liant le rétinol chez le bovinfaites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) prise sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................37
Figure 11 : Comparaison des prédictions de la protéine Src Homology 3 domain faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................39
Figure 12 : Comparaison des prédictions du canal potassium KvAP faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...............................................................................41
Figure 13 : Comparaison des prédictions de la protéine Outer membrane protein Wfaites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................43
Figure 14 : Comparaison des prédictions de la protéine Synaptotagmine C2B faitespar MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Wu et al. (24). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................45
Figure 15 : Comparaison des prédictions de la protéine Cytochrome P450 3A4 faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Cojocaru et al. (27). La partie A de la figure
x
compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence........................................47
Figure 16 : Comparaison des prédictions de la protéine Cytochrome P450 2C9 faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Berka et al. (26). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence........................................49
Figure 17 : Comparaison des prédictions de la protéine OMPLA faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...............................................................................51
Figure 18 : Comparaison des prédictions de la protéine trHbN faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Rhéault et al. (4). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...............................................................................53
Figure 19 : Comparaison des prédictions de la protéine trHbN PDB 1IDR faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Rhéault et al. (4). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................54
Figure 20 : Comparaison des prédictions du peptide de fusion faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Légaré et al. (29). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence...............................................................................55
Figure 21 : Comparaison des prédictions du peptide de fusion PDB 1IBN faites par MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu) fournie par Légaré et al. (29). La partie A de la figure compare la prédiction de MemP3 avec le positionnement de la structure de référence. La partie B de la figure compare la prédiction de PPM avec le positionnement de la structure de référence............................................56
xi
Liste des abréviations
CD Dichroisme circulaire
CGDB Coarse Grained DataBase
DCLE Dichloroethane
DOPC Dioléoyl phosphatidylcholine
DPPC Dipalmitoyl phosphatidylcholine
DVPC Divaléryl phosphatidylcholine
DVPS Divaléryl phosphatidylsérine
EPR Electron Paramagnetic Resonance
GBSW Generalized Born with simple smoothed SWitching
GLY Glycine
HIS Histidine
HMMM Highly Mobile Membrane Mimetic
ILE Isoleucine
LEU Leucine
MemP3 Membrane Protein Prediction and Positioning
MPEx Membrane Protein EXplorer
MSMS Maximal Speed Molecular Surfaces
NOE Nuclear Overhauser Effect
OCD Dichroisme Circulaire Orienté
OPM Orientation of Proteins in Membranes
ORF Cadres de Lecture Ouverts
OBPC Oléoyl diBromosteroyl Phosphatidylcholine
PDB Protein Data Bank
PMF Potentiel de Force Moyenne
POPC Palmitoyl Oléoyl Phosphatidylcholine
xiii
PPM Positioning of Proteins in Membranes
PRO Proline
RMN Résonance Magnétique Nucléaire
RMSD Root Mean Square Deviation
SASA Surface Exposée au Solvant
Tcl Tool Command Language
TMDET DETermine TransMembrane planes
VMD Visual Molecular Dynamics
xiv
Remerciements
J'aimerais remercier en premier mon directeur de recherche Patrick Lagüe.
Il m'a soutenu et conseillé tout le long de ma maîtrise. Il m'a appris l'importance de
la communication et de la rigueur scientifique. Avec son aide je suis devenu un
meilleur écrivain et pour ça je le remercie beaucoup.
Ensuite, je remercie les membres de mon comité aviseur qui sont Stéphane
Gagné et Christian Salesse. Ils m'ont fourni de précieux commentaires lors des
rencontres de ce comité.
Je remercie aussi mes collègues de laboratoire avec lesquels j'ai passé des
merveilleux moments, Xavier Barbeau, Sébastien Légaré, Jean-François Rheault
et Joël Tremblay-Marchand.
Je remercie mes parents, qui ont su me supporter durant mes études et me
pousser toujours plus loin.
J'aimerais remercier ma chère épouse, Andreea Dumitru, qui a toujours été
à mes côtés dans les moments les plus durs et qui comprend mieux que nul autre
le chemin par lequel je suis passé. Je t'aime!
xv
Chapitre 1 : Introduction
1.1 Membranes
Les membranes biologiques sont des composantes cellulaires complexes
d’une importance capitale pour la fonction et la structure de la cellule (1). En effet,
les membranes cellulaires permettent d’isoler le milieu extracellulaire du milieu
intracellulaire. Par conséquent, elles ont la fonction de contrôler les molécules qui
peuvent passer de l’intérieur vers l’extérieur de la cellule et vice-versa, ainsi
qu’entre l’intérieur de la cellule et l’intérieur de différents organites (1).
Les membranes biologiques sont généralement composées de plusieurs
molécules biologiques (1) : plusieurs types de phospholipides et différentes
protéines (voir Figure 1). Cette composition varie avec le type de tissus duquel la
cellule fait partie, ainsi qu’avec la fonction de la cellule (1). De plus, la composition
membranaire peut aussi varier à l’intérieur de la cellule, d’un organite à un autre
(voir Figure 1).
1.2 Phospholipides
Les membranes eukariotes sont principalement composées d'un type de
lipide appelé phospholipide (Figure 2). Les phospholipides sont des molécules
amphiphiles (1), ce qui leur donne un caractère à la fois hydrophobe et hydrophile
(1). La partie des chaînes aliphatiques (R1 et R2), les acides gras, forme la partie
hydrophobe des phospholipides (1). La partie hydrophile, la tête polaire, est
composée par le groupement R3, le groupement phosphate et le glycérol. Ainsi,
puisque les phospholipides sont composés d’une partie hydrophile et une autre
hydrophobe, ils s’organisent en différentes formes physiques lorsqu’ils sont dans
une solution aqueuse (1). La structure dans laquelle les lipides s’organisent
dépend essentiellement de la forme des lipides, leur type, leur concentration et la
1
température du mélange. La forme physique employée dans les cellules s'appelle
une bicouche lipidique (1). En effet, en milieu aqueux la partie hydrophile cherche
à être hydratée par les molécules d’eau, tandis que la partie hydrophobe cherche à
fuir les molécules d’eau (1). La formation d’une bicouche lipidique permet aux
parties hydrophiles de rester en contact avec l’eau et aux parties hydrophobes de
rester éloignées de la phase aqueuse (1).
Figure 1 : Exemple de membrane biologique. La membrane biologique
d’une cellule est composée de phospholipides, de protéines membranaires
(périphériques et transmembranaires), de cholesterol et d'oligosaccharides.
Image adaptée de WikiCommons (https://commons .wikimedia.org/wiki/File:
CellMembraneDrawing.jpg)
2
Figure 2 : Structure générale d’un phospholipide. La composition d’un
phospholipide dépend de la nature de la molécule liée au groupement
phosphate en position R3, ainsi que la nature des chaînes aliphatiques (R1
et R2) qui sont liées au glycérol à l’aide des groupements carbonyles. Image
construite à l’aide du logiciel Marvin Sketch, ChemAxon
(http://www.chemaxon.com)
1.3 Membranes modèles
La membrane modèle est une version simplifiée d’une membrane
biologique. Habituellement, les membranes modèles sont composées d’un seul
type de phospholipide, mais plusieurs types de phospholipides peuvent être
utilisés pour la même membrane. Par contre, plus on ajoute des phospholipides
différents, plus la complexité du système étudié augmente. La structure d’une
3
membrane modèle composée par le phospholipide palmitoyl oleoyl
phosphatidylcholine (POPC) dans l’état fluide (Lα) est représentée à la Figure 3.
Figure 3 : Représentation d’une membrane modèle de POPC. En bleu foncé
est représentée la phase aqueuse, les sphères rouges représentent les atomes
d’oxygène et du glycérol, les sphères orange représentent les atomes de
phosphate et les sphères grises représentent les atomes de carbone (les
atomes d’hydrogène sont omis pour plus de clarté).
1.4 Protéines membranaires
Pour l'exécution de leur fonction biologique, plusieurs protéines ont besoin
d’être liées à la membrane cellulaire. Ces protéines peuvent être divisées en deux
catégories, soit les protéines intrinsèques, qui traversent la membrane et les
protéines extrinsèques, qui s’accrochent à la surface des membranes cellulaires
(1) (voir Figure 4). Les protéines intrinsèques ou transmembranaires sont des
protéines qui sont fortement liées aux membranes principalement par des forces
hydrophobes. Elles traversent complètement la membrane cellulaire. Les protéines
4
extrinsèques ou périphériques sont des protéines qui se lient moins fortement aux
membranes que les protéines transmembranaires et lient une seule couche de la
membrane cellulaire.
Figure 4 : Représentation d’une protéine périphérique et une
transmembranaire. Image adaptée de WikiCommons (
https://commons.wikimedia.org/wiki/File:Cell_membrane_scheme.png )
Les protéines transmembranaires représentent seulement 2% des
soumissions de structures sur Protein Data Bank (PDB) (2)
(http://www.rcsb.org/pdb/statistics/holdings.do - consulté le 14 juillet 2015), alors
que 20 à 30 % des cadres de lecture ouverts (ORF) codent pour ces protéines (3).
Comme cette étude (3) ne prend pas en compte les protéines périphériques, on
peut s’attendre que ces pourcentages soient plus élevés. À première vue, on peut
conclure que les protéines membranaires sont sous-représentées dans la banque
PDB. Par contre, il faut considérer la possibilité que des protéines soient présentes
5
dans la banque PDB qui ne sont pas connues comme étant membranaires. Ceci
peut être dû au manque de connaissance des caractéristiques physiques de
certaines protéines amphipatiques. Dans ce cas, le pourcentage de protéines
membranaires présentes dans la banque PDB pourrait être plus élevé. Par
exemple, il a été récemment démontré que la protéine hémoglobine tronquée
trHbN (PDB 1IDR) est une protéine périphérique (4). Cette protéine était
considérée comme étant soluble avant l’étude de Rhéault et al. (4).
Les membranes influencent la fonction et la structure tridimensionnelle des
protéines membranaires (5, 6), mais il est difficile d’étudier l'interaction entre ces
protéines et les membranes. Compte tenu de la difficulté d’étudier cette interaction
en utilisant des méthodes expérimentales, l’orientation, l’insertion membranaire et
la conformation en présence des lipides d’une partie des structures se trouvant
dans la banque PDB ne sont pas connues. C’est pourquoi le présent projet de
maîtrise consiste à développer un outil pouvant prédire l’insertion et l’orientation
des protéines dans plusieurs membranes modèles. Dans le cadre de ce projetet
dans le but du dévéloppement initial, nous avons utilisé une membrane modèle fait
du phospholypide dioléoyl phosphatidylcholine (DOPC).
Présentement, il existe quelques méthodes computationnelles et
expérimentales qui peuvent être utilisées pour prédire ou déterminer l’orientation et
l’insertion des protéines interagissant avec les membranes. Le texte suivant
présente brièvement les différentes méthodes expérimentales courantes et les
outils computationnels en mettant en évidence leurs forces et leurs faiblesses. Il
sera ensuite question de présenter en détail la théorie et le fonctionnement de
l’outil développé (chapitre 3). Suivra la section des résultats (chapitre 4), la
discussion (chapitre 5) et finalement la conclusion (chapitre 6).
6
1.5 Les méthodes expérimentales
Les méthodes expérimentales les plus utilisées pour déterminer l’insertion
et l’orientation des protéines membranaires sont la diffraction par rayons X (7), la
résonance magnétique nucléaire (RMN) (8), la fluorescence du tryptophane (8), la
résonance magnétique électronique EPR (8), la spectroscopie infrarouge et le
dichroisme circulaire orienté (8).
La méthode de diffraction par rayons X est utilisée pour déterminer la
structure d’un peptide ou d’une protéine, ainsi que la distribution des lipides les
entourant (7). Essentielement, des faisceaux de rayons X frappent un crystal, ce
qui produit des rayons X diffractés. Ces dérnières frappent un détecteur, ce qui
créé un patron de diffraction. À partir de ce patron, la structure tridimentionelle
d'une protéine peut être calculée. Par exemple, la conformation et l'orientation du
peptide Ac-18A-NH2 dans une bicouche lipidique de type dioléoyl
phosphatidylcholine / oléoyl dibromosteroyl glycero phosphocholine (DOPC/OBPC)
ont été déterminées à l'aide de cette méthode (7). Il a été observé que lorsque le
peptide est présent, il a tendance à être entouré par des lipides de type OBPC
plutôt que DOPC. La méthodologie utilisée consiste dans un premier temps à
déterminer l'orientation des microstructures des lipides ainsi que le niveau
d'hydratation de celles-ci en absence et en présence d'un peptide ou d’une
protéine (7). Dans un deuxième temps, la perturbation de la bicouche lipidique par
le peptide est calculée. Lors de cette étape, la perturbation des lipides est indiquée
par la distribution des liens marqués au brome (Br) (7). Dans un troisième temps,
la position en Z de la paire gaussienne optimale du peptide est calculée. Cette
étape permet de trouver la position du peptide par rapport au centre de la
membrane. La quatrième et dernière étape est la modélisation de la conformation,
la position et l'orientation du peptide. En connaissant la structure du peptide à
l'aide de la diffraction des rayons X et les données qui été obtenues à propos de la
position sur l’axe z et l'orientation du peptide dans la membrane, les scientifiques
ont été capables de positionner, computationnellement, le peptide dans une
7
membrane (7). La difficultée de la méthode de diffraction par rayons X est l'étape
de la création des crystaux. En effet, dépendant des protéines, la qualitée des
cristaux peut varier, ce qui influence la résolution du modèle atomique résultant du
patron de difffraction.
Les méthodes de RMN peuvent être divisées en deux catégories, soit la
RMN solide et la RMN en solution (8). Les méthodes de RMN solide sont utilisées
pour déterminer la localisation d’un peptide dans une bicouche lipidique (8).
L’orientation peut être calculée indirectement avec des analyses supplémentaires
(8). La bicouche lipidique est orientée avec la normale, donc parallèle à la direction
du champ magnétique. La majorité des peptides étudiés par RMN solide sont des
hélices alpha (8). Les méthodes de RMN liquide permettent de déterminer la
structure d’un petit peptide interagissant avec une micelle, une bicelle ou une
vésicule unilamelaire. La RMN liquide ne permet pas la détermination de
l’orientation et la localisation d’un peptide dans une membrane (8). Pour cela
plusieurs techniques ont été mises au point pour , comme le Nuclear Overhauser
Effect (NOE), Residual Dipolar Couplings et Paramagnetic Relaxation
Enhancement (8).
La méthode de fluorescence du tryptophane profite de la présence du
résidu tryptophane dans les peptides ou les protéines qui se lient aux membranes
pour déterminer leur orientation et leur insertion (8). Le tryptophane agit comme
point d’ancrage entre une protéine et la membrane cellulaire, puisqu’il interagit
avec les molécules d’eau se trouvant à l’interface membranaire (9). Lorsque le
résidu tryptophane s'insère dans une bicouche lipidique, l’émission de
fluorescence se déplace vers des longueurs d’onde plus courtes, ce qui produit
une lumière ultraviolette (8). Le degré d’intensité de la fluorescence peut être
corrélé avec l’insertion du peptide ou de la protéine dans la membrane (8). Comme
cette méthode a besoin de la présence des résidus tryptophane, elle est restreinte
seulement aux peptides et protéines qui en contiennent (8).
La méthode de spectroscopie EPR est utilisée pour observer l’effet d’une
bicouche lipidique sur le temps de relaxation d’un peptide auquel a été ajouté un
8
marqueue de spin (8). Les résidus du peptide WALP ont été un par un remplacés
par une cystéine, sur laquelle un marqueur de spin est ajouté. Comme l’orientation
de ce peptide est connue, la profondeur d’insertion des résidus peut être calculée
(8). Cette information peut être utilisée pour obtenir l’orientation d’autres peptides.
Les résidus doivent être remplacés un par un par une cystéine (8). Le grand
désavantage de cette méthode est que les peptides étudiés doivent être modifiés,
ce qui est un travail laborieux et les modifications peuvent influencer le
comportement du peptide dans un environnement hydrophobe (8).
La méthode de spectroscopie infrarouge permet de déterminer la présence
de différentes structures secondaires d’un peptide ou d’une protéine,
principalement par l’analyse du groupement carbonyle des lipides (8). En plus de
la structure, l’orientation des éléments de structure secondaire ordonnée dans une
bicouche lipidique peut être déterminée par ATR-IR (Attenuated Total Reflexion
Infrared Spectroscopy) (8).
La méthode de dichroisme circulaire orienté (OCD) est similaire à la
méthode classique de dichroisme circulaire (CD) (8). En effet, dans le cas des
deux méthodes, l’absorption de la lumière polarisée à gauche et à droite est
monitorée. Le CD est utilisé pour déterminer la présence de structures secondaires
d’une protéine ou d’un peptide en fonction des changements de son
environnement (8). Dans le cas de la méthode OCD la lumière polarisée est
envoyée perpendiculairement ou à des angles obliques à la bicouche membranaire
(8). Cela permet d’obtenir des informations non seulement sur la structure de la
protéine, mais aussi sur son orientation et insertion dans la bicouche lipidique.
Ces méthodes expérimentales requièrent un budget important, beaucoup de
temps et ont certaines limitations. Par exemple, les méthodes de RMN solide et
liquide permettent d’obtenir des informations que sur des petits peptides (8). Pour
cela, les méthodes doivent être combinées, ce qui augmente les coûts et le temps
consacré. Pour contrer ce problème et pour étudier les protéines qui sont difficiles,
voire, même impossibles à étudier avec des méthodes expérimentales, des
9
méthodes de prédiction computationnelles ont été développées.
1.6 Les méthodes computationnelles
Les méthodes computationnelles ont pour objectif de prédire l’insertion et
l’orientation d’une protéine dans une membrane. Les méthodes présentement
disponibles peuvent être séparées en deux catégories : celles qui utilisent la
dynamique moléculaire et celles qui ne l’utilisent pas. Parmi les méthodes utilisant
de la dynamique moléculaire, il y a les simulations tout-atome, les simulations à
gros grains (10) et les simulations de type Generalized Born with simple smoothed
SWitching (GBSW) (11). Parmi les méthodes n’utilisant pas de dynamique
moléculaire il y a la méthode Membrane Protein EXplorer (MPEx) (12), la méthode
Positioning of Proteins in Membranes (PPM) employée par Orientation of Proteins
in Membranes (OPM) (13) et finalement l’algorithme DETermine TransMembrane
planes (TMDET) (14).
La dynamique moléculaire tout-atome permet de calculer toutes les
interactions entre les atomes, étant ainsi la méthode computationnelle la plus
exacte. À cause de la grande quantité de calculs qui doivent être réalisés, cette
méthode est aussi la plus lente. Il est possible d’observer l’insertion d’un peptide
dans une membrane, mais ce processus est très long et requiért des ordinateurs
puissants.
Les modèles à gros grains représentent un petit nombre d’atomes par un
seul objet (15), ce qui permet d’accélérer les calculs. Par exemple, pour
représenter les lipides membranaires, 4 atomes lourds sont groupés en un seul
gros grain (10, 16). En utilisant cette méthode, le nombre d’atomes de la
membrane est diminué considérablement, mais il reste que la puissance de calcul
nécessaire demeure assez grande.
Une troisième méthode utilisant la dynamique moléculaire est le GBSW
10
(11), qui consiste à remplacer les molécules du solvant (eau et membrane) par un
milieu diélectrique. Avec ces simulations, le temps de calcul peut être plus court
qu’avec le modèle à gros grains, mais cela n’est pas toujours le cas. Un des
désavantages est que la déformation de la membrane causée par la liaison d’une
protéine à une membrane ne peut pas être simulée avec cette méthode (11).
Les méthodes présentées jusqu’ici utilisent la dynamique moléculaire, et
requièrent une puissance de calcul importante, en plus du temps de préparation
des systèmes à simuler, qui requiert beaucoup d’interventions manuelles. Pour
accélérer le processus, des méthodes qui n’utilisent pas la dynamique moléculaire
ont été mises au point. Par contre, ces méthodes ont leurs propres désavantages.
Certaines ne peuvent fonctionner avec des protéines périphériques, comme la
méthode TMDET, alors que d’autres fonctionnent seulement avec un type de
membrane, comme la méthode PPM.
Un premier outil n’utilisant pas de dynamique moléculaire est le logiciel
«Membrane Protein Explorer» (MPEx) (12). Le logiciel offre l’analyse et la
prédiction de structure des protéines transmembranaires contenant des hélices α,
ainsi que des barils β (12). Tout ce que le logiciel nécessite en entrée est la
structure primaire d’une protéine. Dans le cas des hélices α, l’outil calcule
l’hydrophobicité de la protéine et l’énergie libre des hélices, pour déterminer la
portion membranaire. Pour ce qui est des barils β, MPEx utilise l’algorithme de
Wimley (12) pour prédire si des acides aminés formant les feuillets β ou les coudes
font partie de la partie transmembranaire (12). Le plus grand désavantage de cette
méthode est qu’elle fonctionne seulement avec des protéines transmembranaires.
Un autre désavantage est que l’outil ne fournit pas les coordonnées des atomes tel
que prédit.
Il existe aussi la méthode «Positionning of Proteins in Membranes» (PPM).
Cette méthode est utilisée par «Orientation of Proteins in Membranes» (OPM) pour
étudier les protéines membranaires (13). Cette méthode nécessite un fichier PDB
de la structure de la protéine d’intérêt. L’insertion et l’orientation de la protéine sont
obtenues par la minimisation de l’énergie de transfert de ces atomes d’un milieu
11
aqueux vers un milieu hydrophobe (17). La minimisation emploie la méthode de
minimisation locale Davidon-Fletcher-Powel combinée avec un balayage de grille
(17). Ce balayage permet de déterminer les points de départ de la méthode de
minimisation locale (17). La méthode PPM a été testée avec 24 protéines
transmembranaires qui sont disponibles sur la banque PDB. Leurs résultats sont
plus rapprochés des résultats expérimentaux que ceux des autres méthodes
automatiques présentées ici (13). Cette méthode peut différencier avec une bonne
précision les protéines solubles et celles transmembranaires. Le désavantage de
cette méthode est qu’elle ne tient pas compte de la composition des têtes polaires,
ni la composition des chaînes aliphatiques des lipides.
Une troisième méthode est l’algorithme TMDET (14). Cet outil utilise un
fichier de coordonnés PDB. La première étape est de prédire la surface de la
protéine qui est accessible au solvant. Cela est réalisé par une fonction objective
qui utilise la surface accessible au solvant de la protéine et un vecteur normal pour
définir la membrane. Cette fonction permet de trouver les parties de la protéine qui
se trouvent à l’intérieur de la membrane (14). Ensuite, l’algorithme calcule le
meilleur angle du plan de la membrane cellulaire. Cette méthode a été utilisée pour
analyser toute la base de données PDB et trouver les protéines
transmembranaires, mais elle ne fonctionne pas avec les protéines périphériques.
Ces méthodes rapides (MPEx, PPM et TMDET) ont toutes le même
désavantage, soit l’impossibilité de prédire la conformation des protéines en
présence des lipides. Cela ne peut être prédit qu’avec la dynamique moléculaire.
Lors de ce projet de maîtrise, un outil qui prédit l’orientation et l’insertion des
protéines dans une membrane a été développé. Bien que l’outil développé
n’utilisera pas la dynamique moléculaire, il sera possible de développer une
extension de cet outil qui inclura cette possibilité.
L’outil développé au cours de ce projet de maîtrise est basé sur les PMF
(Potential of Mean Force) d’insertion membranaire des chaines latérales des
acides aminés. Le PMF d’insertion membranaire des chaines latérales des acides
aminés représente la différence d’énergie libre ΔG(z) associée au déplacement
12
des chaînes latérales des acides aminés entre le solvant et la membrane, selon un
axe normal au plan de la membrane. Dans le cadre de ce projet, les PMF
d’insertion membranaire des chaines latérales des acides aminés calculés dans le
laboratoire du Dr. Peter Tieleman (18) seront utilisées. Un exemple de courbe de
PMF d’insertion membranaire de la chaine latérale de l’alanine se trouve à la
Figure 5. Nous avons nommé l’outil ainsi développé MemP3, qui est une
abréviation de Membrane Protein Prediction and Positionning.
13
Figure 5 : Graphique du PMF d’insertion membranaire de la chaîne latérale
des acides aminés lysine et alanine en fonction de la position en Z.
L’énergie d’insertion est représentée selon l’axe X, et la position d’insertion
selon la normale du plan de la membrane est indiquée selon l’axe Z. Une
énergie d’insertion positive est défavorable. Le centre de la membrane est situé
à Z = 0 Å, et l’interface de la membrane se retrouve à Z ≈ 20Å. Les valeurs de
PMF sont tirées des travaux de MacCallum et Tieleman (18).
14
Chapitre 2 : Hypothèse et Objectif
2.1 Hypothèse
L’utilisation des PMF d’insertion des chaînes latérales des acides aminés
dans les membranes permettra de prédire l’orientation et l’insertion des protéines
lorsqu’elles interagissent avec une membrane. Selon les PMF d’insertion
disponibles, les prédictions pourront être effectuées pour différentes compositions
lipidiques membranaires.
2.2 Objectif
Mettre au point un outil pour déterminer l’orientation et l’insertion d’une
protéine dans une membrane modèle. Cet outil utilisera une structure de protéine
rigide, ainsi que des PMF d’insertion membranaire des chaînes latérales des
acides aminés. De plus, cet outil sera une preuve de concept que l’approche des
PMF fonctionne, et pourra être subséquemment utilisée pour développer une
méthode plus complexe incluant la dynamique moléculaire (cette approche sera
brièvement décrite dans les perspectives, dans le dernier chapitre).
15
Chapitre 3 : Méthodes
La théorie associée à la méthode développée dans les présents travaux
sera décrite dans la première section du chapitre. Ensuite, tous les détails reliés au
fonctionnement de la méthode seront exposés dans la section suivante.
3.1 Théorie
La méthode de prédiction de l’insertion membranaire des protéines que
nous avons développée est basée sur les PMF d’insertion des chaînes latérales
des acides aminés dans les membranes. En effet, l'hypothèse que nous formulons
est que l’insertion membranaire d’une protéine est dirigée par l’insertion des acides
aminés composant cette dernière. En d’autres mots, l’énergie libre d’insertion
membranaire de la protéine est la somme des énergies libres d’insertion de
chacun des acides aminés la composant, et la position et l’orientation d’équilibre
de la protéine insérée dans la membrane sera celle pour laquelle la somme des
énergies libres de chacun des acides aminés sera minimale. Cette hypothèse
s’apparente à l’hypothèse thermodynamique qui suppose que la séquence des
protéines va diriger naturellement leur repliement dans une configuration native
selon les bases de la thermodynamique (19). De plus, cette approche suppose
aussi une additivité pour laquelle l’énergie effective de liaison membranaire peut
être exprimée selon la somme des énergies individuelles de chacun des acides
aminés. Cette hypothèse d’additivité est couramment utilisée avec succès en
modélisation moléculaire, avec un des exemples les plus éloquents que sont les
champs de forces empiriques (19).
17
Les différentes étapes de la méthode sont :
1. Calculer le PMF d’insertion membranaire pour chacun des acides aminés
existants. Cette étape n’est effectuée qu’une seule fois, pour une
composition membranaire donnée, et les résultats sont réutilisés à chaque
prédiction réalisée. Suivant cette étape, nous avons une valeur d’énergie
libre d’insertion selon l’insertion membranaire le long de la normale de la
bicouche, pour chacun des acides aminés.
2. Obtenir et préparer le fichier contenant la structure de la protéine.
3. Choisir une position et une orientation de départ relatives à la membrane, et
calculer l’énergie libre d’insertion, soit la somme des énergies libres de
chacun des acides aminés. Cette valeur totale d’énergie libre est associée à
un score. La position de départ de la protéine peut dépendre de l’algorithme
utilisé. Cette variation n’influence aucunement le résultat final.
4. Rechercher la position et l’orientation d'insertion membranaire ayant
l’énergie libre la plus basse, selon les itérations suivantes:
a) Modifier la position et/ou l’orientation d’insertion membranaire de la
protéine.
b) Calculer l’énergie libre d’insertion (ou le score) pour la configuration
actuelle, et la comparer aux configurations précédentes; si la
configuration actuelle possède l’énergie la plus basse, la conserver
en mémoire.
c) Déterminer si la recherche doit être poursuivie ou non.
18
Les étapes de cette section sont générales et peuvent êtres accomplies en
utilisant différentes méthodes. La prochaine section détaille la méthode utilisée
pour calculer un score associé à l’insertion et l’orientation membranaire d’une
protéine.
Cette section est suivie de deux autres sections, avant de présenter en
détails la méthodologie utilisée par MemP3. Ces deux sections, soit Calcul des
PMF et Calcul du Score, sont nécessaires pour pouvoir expliquer le concept des
potentiels de force moyenne, ainsi que la méthode utilisée pour déterminer la
meilleure position d’une protéine. Par la suite, les méthodes que nous avons
choisies pour accomplir chacune des étapes décrites ci-dessus seront détaillées.
3.2 Calcul des PMF
Le potentiel de force moyenne (PMF) est un type de simulation qui peut être
fait à l’aide des simulations Monte Carlo ou bien à l’aide des simulations de
dynamique moléculaire. Le PMF détermine comment l’énergie libre d'un système
change en fonction d’un paramètre spécifique (20).
Par exemple, le PMF peut déterminer comment l’énergie libre d’un système
varie en fonction de la distance entre deux résidus, ou bien la variation de l’énergie
libre du système au fur et à mesure qu’une protéine est insérée dans une bicouche
lipidique (20). Le PMF peut être calculé en fonction d’une coordonnée
géométrique, ou bien selons la variation d’une donnée énergétique.
Habituellement, les simulations PMF sont exécutées avec une méthode appelée
umbrella sampling, pour pouvoir échantillonner tout l’espace du système, même
lorsque l’énergie libre touche des niveaux qui ne sont pas physiquement possibles
(20).
En utilisant les PMF il est possible de prédire l’orientation et l’insertion d’une
protéine dans une membrane, parce qu’ils représentent toutes les forces étant
19
appliquées sur un atome à un endroit dans l’espace. Un exemple de PMF de
l’insertion membranaire de la chaîne latérale d’un acide aminé se trouve à la
Figure 5.
Les potentiels de force moyenne (PMF) d’insertion des chaînes latérales
dans une membrane ont été calculés par MacCallum et al. (18) à l’aide des
simulations de dynamique moléculaire, utilisant la méthode appelée umbrella
sampling. Les acides aminés histidine (HIS), glycine (GLY) et proline (PRO) ont été
exclus des calculs de PMF. Les formes neutres et chargées des acides aminés
acide glutamique, acide aspartique, lysine et arginine ont été utilisées pour calculer
les PMF d’insertion membranaire des chaînes latérales.
Les 17 chaînes latérales des acides aminés utilisés ont été tronquées au
carbone β, résultant en des petites molécules analogues. Par exemple, la chaîne
latérale de l’acide aminé valine devient une molécule de propane, montrée à la
Figure 6. GLY et PRO ne sont pas utilisées pour faire les calculs de PMF
d’insertion membranaire des chaînes latérales d’un acide aminé, car GLY et PRO
n’ont pas des petites molécules équivalentes à leurs chaînes latérales. Dans le cas
de l’histidine, il est difficile de faire des calculs de PMF d’insertion membranaire de
sa chaîne latérale, puisque celle-ci a des multiples états de protonation.
Figure 6: L’acide aminé valine avec l’analogue de sa chaîne latérale. La
chaîne latérale de l’acide aminé valine est tronquée au carbone β et la liaison
avec le carbone α est remplacée par un proton.
20
3.2.1 Informations sur les simulations
La membrane modèle utilisée pour les calculs de PMF par MacCalum et
Tieleman est composée des phospholipides DOPC. Le système simulé contient 64
molécules de DOPC, 32 molécules par couche de la membrane modèle, ainsi que
deux chaînes latérales d’un même résidu (18). Tout dépendant du système, le
nombre d’atomes est d’environs 11 900. Les simulations ont été exécutées avec le
logiciel de dynamique moléculaire GROMACS 3.3.1, avec le champ de forces
Berger pour les molécules de DOPC et le champ de forces OPLS-All Atoms pour
les analogues des chaînes latérales des acides aminés (18). Comme modèle de
molécule d’eau, le Simple Point Charge a été utilisé. La température du système
simulé a été gardée à 298 K pendant toute la durée de la simulation en utilisant un
algorithme de couplage faible, avec une constante de couplage de 0.1 ps. La
pression du système a été gardée constante à 1 bar à l’aide d’un algorithme de
couplage faible semi-isotropique, avec une constante de couplage de 1 ps. La
longueur des liens, ainsi que les angles des molécules d’eau ont été contraints
avec l’algorithme SETTLE (18). Tous les autres liens et angles ont été contraints
avec l’algorithme LINCS. Ce dernier algorithme permet d’utiliser un time-step de 2
fs. Les interactions électrostatiques ont été évaluées avec la méthode de smooth
particle mesh Ewald avec un seuil de 1 nm (18).
Chaque simulation contient 2 copies du même analogue de la même chaîne
latérale d’un acide aminé donné, une de chaque côté de la bicouche lipidique. La
méthode de dynamique moléculaire Umbrella sampling a été utilisée avec une
force constante de 3000 kJ*mol-1*nm-2 appliquée entre le centre de masse de la
chaîne latérale et le centre de la membrane, dans la direction de la normale de la
bicouche lipidique (18). Les deux chaînes latérales ont été ajoutées dans le
système de façon à ce que lorsqu’une est dans l’eau, l’autre se trouve au centre de
la bicouche membranaire. Au total, 38 simulations ont été exécutées pour chaque
chaîne latérale pour environ 30 ns par simulation, pour un total de 20 µs de temps
de simulation (18).
21
Les simulations de la chaîne latérale du tryptophane ainsi que celles des résidus
chargés ou polaires ont été simulées pendant 80 ns chacune, afin d’obtenir des
marges d’erreur acceptables.
Les valeurs de PMF d’insertion membranaire des chaînes latérales des
acides aminés sont utilisées pour calculer l’énergie globale qui est associée à une
position de la protéine. Ce calcul est détaillé dans la section suivante (Calcul du
score).
3.3 Calcul du score
Le calcul du score associé à une position de la protéine dans la membrane
est un point central de la méthode de prédiction. La valeur du score est en quelque
sorte une valeur d’énergie libre d’insertion membranaire, qui varie en fonction de la
position en z de la protéine et l’orientation � de celle-ci, ce qui est noté ΔGt(z, �).
L’énergie libre ΔGt(z, �) est calculée à l’aide de l’équation 1 :
Équation 1 :
Équation 2 :
Cette énergie libre ΔGt(z, )� correspond à la somme des énergies libres de
chaque chaîne latérale d'acides aminés ΔGi(z) normalisé par la valeur relative de
surface de la chaîne latérale exposée au solvant (Srel,i).
Dans l’équation 1, l’énergie libre d’une chaîne latérale d’un acide aminé
ΔGi(z) est extraite à partir des données PMF d’insertion membranaire des chaînes
latérales des acides aminés en fonction de la position en z du centre de masse de
22
la chaîne latérale d’un acide aminé, tel que décrit dans la section Calcul des PMF.
Le centre de masse est calculé à l’aide de la commande measure com de VMD
(Visual Molecular Dynamics). Cette commande permet de calculer le centre de
masse d’une sélection d’atomes, et seulement les atomes de la chaîne latérale de
chacun des acides aminés sont utilisés dans le calcul.
Le calcul de la surface relative accessible au solvant (Srel,i) est utilisé par la
fonction du calcul du score pour normaliser la valeur d’énergie libre de tous les
résidus. Pour la méthode de prédiction développée dans les présents travaux,
nous faisons l’hypothèse que les acides aminés, lors de la liaison membranaire,
vont interagir avec la membrane en fonction de leur surface exposée à celle-ci. En
effet, les résidus qui se trouvent à l’intérieur de la protéine ou qui ont leurs chaînes
latérales orientées vers l’intérieur de la protéine n'interagissent pas avec les
lipides. Il est donc important de considérer la surface exposée au solvant dans le
calcul du score, et de normaliser la valeur du PMF d’insertion en proportion de la
surface exposée. Puisque les PMF d’insertion correspondent aux chaînes
latérales, nous avons considéré la surface exposée au solvant (SASA) des
chaînes latérales des acides aminés. La chaîne latérale est composée des atomes
en commençant par le carbone β et en excluant les atomes d’hydrogène.
Srel,i est le rapport entre le SASA de la chaîne latérale du résidu i en
présence de la protéine (SASAi,prot) et le SASA de la chaîne latérale du résidu i
complètement entourée par le solvant (SASAi,solvant). Un exemple de SASAi,prot est
montré à la Figure 7A et un exemple de SASAi,solvant est montré à la Figure 7B. Cette
relation entre les deux types de SASA est représentée à l’aide de l’équation 2. La
valeur que Srel,i peut prendre est comprise entre 0 et 1. Lorsque la chaîne latérale
d’un acide aminé est complètement enfouie dans la protéine, la valeur de Srel,i est
égale à 0. En d’autres mots, la surface accessible au solvant est 0. Dans le cas où
la chaîne latérale d’un acide aminé est complètement entourée du solvant, comme
montré à la Figure 7B, le Srel associé est de 1. En d’autres mots, la surface
accessible au solvant de la chaîne latérale d’un acide aminé est à son maximum
possible, et n’est pas influencé par aucun atome externe.
23
L’étape de normalisation est accomplie avec l’aide de la commande
measure sasa de VMD. Cette commande permet de calculer le SASA d’une
sélection d’atomes en tenant compte des autres atomes qui l’entourent ou en la
considérant seule dans le vide. Pour calculer le SASA d’une sélection, VMD utilise
l’algorithme Maximal Speed Molecular Surfaces (MSMS) (21). Cet algorithme
calcule le SASA d’un atome en considérant le rayon van der Vaals ce celui-ci avec
le rayon van der Vaals d’une molécule de solvant, soit 1.4 Å pour une molécule
d’eau (21). L’étape de normalisation est exécutée seulement une fois au
démarrage du script de prédiction.
24
Figure 7 : Représentation de la surface exposée au solvant (SASA) de la
chaîne latérale du résidu LEU3 en présence du squelette protéique et le
SASA de la même chaîne latérale seule dans le solvant. (A) La chaîne
latérale du résidu LEU3 de la protéine trHbN (PDB: 1IDR) représentée sous
forme de bâtonnets (jaune). Les sphères représentent les résidus LEU4
(gauche) et ILE13 (droite) qui influencent le SASA de la chaîne latérale LEU3.
Le squelette de la protéine est représenté en cartoon. Les points bleus
représentent le SASA de la chaîne latérale du résidu LEU3. (B) Le SASA de la
chaîne latérale LEU3 complètement immergée dans le solvant est représenté
par les sphères bleues.
3.4 Méthodes utilisées par MemP3
Cette section expose les détails associés à la réalisation des différentes
étapes de la méthode de prédiction d’insertion membranaire des protéines. La
méthodologie de MemP3 est implémentée dans un script TCL (Tool Command
Language) exécuté par le programme VMD (22). L’utilisation de VMD permet de
profiter des fonctions déjà implémentées, par exemple le chargement de la
protéine, la sélection des atomes et les calculs de centre de masse. Ceci
augmente la vitesse de développement de l’outil.
Voici donc les détails associés à chacune des étapes :
1) Calculer le PMF d’insertion membranaire pour chacun des acides aminés
existants.
Le calcul des PMF d’insertion membranaire pour chacun des acides aminés
existants est une tâche colossale qui équivaut à un projet complet en lui seul. Nous
avons plutôt choisi d’utiliser des résultats déjà publiés dans la littérature, soit les
valeurs calculées par MacCallum et Tieleman. (18). Ces valeurs ont été obtenues
par simulations de dynamique moléculaire en utilisant une bicouche de DOPC. Les
détails du calcul des PMF ont été présentés dans la section Calcul des PMF. Il est
intéressant de noter que les valeurs de PMF d’insertion varient généralement selon
la composition membranaire. Donc, avec MEMP3, il serait possible d’effectuer des
prédictions de liaison pour différentes compositions membranaires selon la
disponibilité des PMF d’insertion.
Pour cette étape, MemP3 charge les données des PMF d’insertion
membranaire des chaînes latérales des acides aminés dans une structure de
données, plus spécifiquement un dictionnaire. Ceci permettra de faire des
recherches rapides dans le dictionnaire à l’aide des noms des acides aminés. Il est
à noter que les prédictions ne considèrent seulement que les états de protonation
à pH physiologique, ce qui implique l’utilisation des PMF correspondant aux états
de protonation normales à pH physiologique sera utilisé. ie. le PMF de l’arginine
chargée positivement est utilisé pour toutes les arginines, le PMF de la lysine
25
chargée positivement est utilisé pour toutes les lysines, le PMF de l'acide
glutamique chargé négativement est utilisé pour tous les acides glutamiques et
finalement, le PMF de l'acide aspartique chargé négativement est utilisé pour tous
les acides aspartiques.
2) Obtenir et préparer le fichier contenant la structure de la protéine.
La deuxième étape de l’algorithme de prédiction est le chargement du fichier pdb
d’entrée créé par le script de préparation. Le chargement est fait à l’aide de la
commande mol load pdb déjà implémentée dans VMD (22).
Le fichier d’entrée peut être un pdb extrait de la Protein Data Bank (PDB)
(2) ou extrait à partir de simulations de dynamique moléculaire. Ensuite, un script
TCL, différent du celui faisant la prédiction, prépare la structure de la protéine pour
l’étape de prédiction. Deux types de problèmes peuvent être présents dans un
fichier pdb provenant de la banque de données PDB. Premièrement, certaines
protéines trouvées sur la banque de données PDB ne sont pas complètes. En
effet, certains atomes ou même des résidus entiers d’une protéine peuvent parfois
être absents dans le fichier pdb. Dans ce cas, ces résidus seront ignorés par
MemP3, ce qui signifie que le fichier pdb prédit par MemP3 ne contiendra que les
atomes présents dans le fichier pdb d’origine. Dans ce cas, le script de préparation
indique à l'utilisateur quels résidus se retrouvent dans cette situation.
Deuxièmement, il arrive parfois que le fichier pdb initial contient également
des atomes qui n’appartiennent pas à la protéine (par exemple des atomes de
métaux ou des ligands). Dans ce cas, ces atomes ou molécules peuvent être pris
en compte dans le calcul de prédiction lors des calculs de surface accessible au
solvant (plus de détails à ce sujet plus loin). L’utilisateur peut indiquer au script de
prédiction s’il veut garder ou non ces atomes dans le fichier pdb d’entrée.
La protonation des résidus ne sera pas modifié par le script de préparation,
ni par l'algorithme de prédiction. Ces derniers considèrent tous les résidus comme
étant à pH physiologique.
26
3) Déterminer une position et une orientation de départ relative à la
membrane, et calculer l’énergie libre d’insertion.
La troisième étape de l’algorithme de prédiction utilisé par l’outil MemP3 est
de définir la position de départ et calculer son score. Le score représente la
somme des énergies libres de chacune des chaînes latérales des acides aminés.
Cette dernière valeur est normalisée par la surface relative exposée au solvant de
la chaîne latérale en question.
Une fois le fichier pdb contenant la structure tridimentionnelle de la protéine
est chargé, cette dernière est positionnée à 35 Å du centre de la bicouche
lipidique, le long de la normale. Si une protéine doit être placée plus loin de la
bicouche lipidique, l’usager devra modifier cette valeur de 35 Å avec la bonne.
Cette position est considérée comme étant la position initiale. Le score de cette
position est calculé et puisque pour l’instant c’est le seul score que nous avons, il
est considéré comme étant le meilleur. Plus la recherche systématique avance,
d‘autres positions vont donner un meilleur score, donc le score initial ne sera plus
considéré comme étant le meilleur.
4) Recherche systématique
L’algorithme de minimisation utilisé est une recherche systématique de
l’énergie libre la plus petite, donc le score le plus petit. Cet algorithme applique en
boucle des matrices de rotations en x et y et des translations en z sur la protéine,
afin de changer son orientation. Les rotations sont de l'ordre de 10° autour de
chaque axe, soit x et y et ce jusqu’à atteindre 360°, donc revenir à la position de
départ et les incréments en z sont de l'ordre de 1 Å. Nous avons choisi 10° comme
valeur d’incrément des rotations, puisqu'elle permet d’obtenir une structure avec
l’énergie très près du minimum possible, sans coûter beaucoup de temps. Au
contraire, aller avec des incréments plus petits, ne donne pas un résultat éloigné
de celui trouvé avec des incréments de 10° pour le coût de temps supplémentaire.
Dans le même ordre d’idée, des incréments de 1 Å sur l’axe des z permettent
27
d’avoir une structure représentative du minimum d’énergie avec un temps de calcul
raisonnable. Après chaque changement de la position de la protéine, que ce les
centres de masse de chaque chaîne latérale sont calculés, comme détaillé dans
au point 3). Ce centre de masse, plus exactement la position en Z de la chaîne
latérale d'un acide aminé, sera utilisé pour chercher l’énergie libre à cette position
à partir des valeurs PMF.
Par la suite, l’énergie libre de chacune des chaînes latérales est multipliée
par la valeur normalisée de la surface exposée au solvant. Ainsi, on considérera
seulement les résidus qui peuvent interagir avec la membrane. La somme de
l’énergie libre de chaque chaîne latérale est calculée. Si l’énergie totale est plus
petite que celle de l’orientation précédente, l’orientation et la position de la protéine
seront sauvegardées. Lorsque toutes les conformations ont été testées, le
programme s’arrête.
3.5 Approximations nécessaires
Les approximations suivantes ont été nécessaires et suffisantes pour
permettre la prédiction de l’orientation et l’insertion d’une protéine dans une
membrane modèle en un temps court :
1. La méthode ne tient pas compte de la déformation possible de la membrane
lors de la liaison d’une protéine.
2. Une protéine est considérée comme un corps rigide, i.e. la méthode ne
pourra prédire un changement de conformation possible de la protéine lors
de la liaison à la membrane.
28
3.6 Méthodologie de la validation
Pour vérifier la méthode, un jeu de protéines a été sélectionné dont la
structure tridimensionnelle est connue. De plus, l’insertion, l’orientation et la
conformation de ces protéines dans une bicouche lipidique ont été étudiées par
diverses méthodes de dynamiques moléculaires. Il est donc possible de comparer
les prédictions faites par MemP3 avec les résultats des simulations de dynamique
moléculaire. Les prédictions faites par MemP3 seront aussi comparées avec les
prédictions de l’outil Prediction of Proteins in Membranes (PPM) (13).
Les prédictions faites par MemP3 et PPM seront comparées entre elles et
avec les résultats des simulations de dynamique moléculaire. Les comparaisons
seront faites du point de vue qualitatif et quantitatif. Pour la partie quantitative, une
valeur de root mean square deviation (RMSD), une valeur d’insertion et une
déviation angulaire seront utilisées pour comparer la prédiction de MemP3 et PPM
avec la référence. Utiliser un RMSD pour comparer la position des structures
permet de vérifier avec une seule valeur des variations dans l’insertion et dans
l’orientation des prédictions. Le RMSD est calculé à l'aide des atomes formant les
chaines latérales, donc commençant par le carbone β, puisque ce sont seulement
ces atomes qui participent à la prédiction de l'orientation et de l'insertion. La valeur
d’insertion est une distance en Z entre le centre de masse de la protéine et le
centre de la membrane. Ce dernier se situe à 0 Å. La déviation angulaire est
calculée comme étant les valeurs nécessaires d’angle pour superposer les deux
prédictions sur la référence. À l’aide de la commande VMD “measure fit” il est
possible d’obtenir une matrice de rotation qui permet de superposer la prédiction
du premier outil sur la structure de référence. En utilisant la matrice de rotation, il
est possible de calculer les angles d'Euler. Ces derniers sont les angles de rotation
autour de l'axe x, y, z nécessaires pour superposer les deux structures.
29
Chapitre 4 : Résultats
Le chapitre est divisé en trois sections : la première section présente les
résultats de prédiction pour un peptide modèle. La deuxième section présente les
résultats de prédiction pour plusieurs protéines périphériques et
transmembranaires dont la structure provient de la dynamique moléculaire. La
troisième section présente les limites de la méthode développée à travers le cas
de l’hémoglobine tronquée (trHbN) et celui du peptide de fusion du virus de
l’influenza.
Pour chacune des sections, les résultats de prédiction faits avec MemP3
sont comparés à ceux obtenus avec la méthode PPM et, lorsque disponibles, aux
structures provenant de dynamique moléculaire tout atome ou à gros grains, ces
dernières seront considérées comme des structures de référence. Les résultats de
prédiction faits avec MemP3 et PPM sont comparés avec la structure de référence.
Toutes les images présentées dans cette section suivent le même code de
couleurs. La structure de référence, provenant de simulations de dynamique
moléculaire, est colorée en bleu, la structure prédite avec MemP3 est en orange et
la structure de la prédiction obtenue à l’aide de l’outil PPM est en vert. Les plans
rouge et violet représentent la position de la densité maximale des groupements
phosphates des lipides pour une membrane modèle de DOPC dans la couche
externe et interne de la membrane cellulaire respectivement, comme présenté
dans les travaux de MacCallum et al. (18).
Dans chaque image se trouvent la valeur de RMSD et les valeurs de
déviation angulaire (x, y et z) entre la structure prédite et la structure de référence.
Pour le calcul du RMSD, les protéines sont fixes. De plus, seulement les atomes
lourds des chaînes latérales des acides aminés sont pris en compte dans ce
calcul. Les angles de déviation sont calculés à l’aide de VMD. Avec ce programme,
on peut obtenir la matrice de rotation nécessaire pour superposer la structure
prédite sur la structure de référence. À partir de cette matrice de rotation il est
31
possible d’obtenir les angles de déviation autour des axes x, y et z. L'insertion,
définie comme la différence entre la valeur en z du centre de masse de la structure
de référence et celle prédite, est aussi indiquée pour chacune des structures
prédites. Ces valeurs sont utilisées pour quantifier les différences et similarités
entre les prédictions.
4.1 Peptide modèle
Les peptides modèles sont des peptides étudiés depuis plusieurs années, et
pour lesquels les propriétés physiques sont connues, celles-ci ayants été
déterminées par plusieurs chercheurs au courant des années.
Le peptide de poly-leucine a été choisi pour le simple fait qu'il est composé
d'un seul type d'acides aminés et il est donc possible de tester l'influence de
l'abscence des PMF des termini sur les prédictions faites par MemP3.
La Figure 8 présente et compare le résultat de MemP3 avec celui de PPM
pour le peptide de poly-leucine.
Le résultat de la prédiction du peptide de poly-leucine permet de montrer
une première limitation de la méthode MemP3. Dans la prédiction de MemP3, le
peptide se trouve au centre de la membrane, parallèle au plan de la membrane.
Quoi que loin de la position perpendiculaire de la poly-leucine, le résultat de PPM
est plus rapproché de ce qui est attendu du point de vue théorique. En théorie, le
peptide de poly-leucine devrait traverser la membrane de bord en bord. Le résultat
de MemP3 est dû au manque de PMF pour les C-terminal et N-terminal chargés.
Par contre, ce manque de PMF influence moins les prédictions de protéines,
puisque celles-ci sont composées de plusieurs résidus différents.
32
Figure 8 : Comparaison des prédictions du peptide poly-leucine
faites par MemP3 (orange) et par PPM (vert) pour un peptide de
poly-leucine formé de 25 résidus.
33
4.2 Protéines équilibrées par dynamique moléculaire
Les protéines équilibrées par dynamique moléculaire ont été utilisées pour
tester l'exactitute de la méthode MemP3, ainsi que comparer les prédictions avec
celles de PPM. Les protéines choisies ont été simulées pendant des longues
périodes, ce qui permet d'obtenir des structures équilibrèes.
4.2.1 Caveoline 1
La structure de référence de la protéine Caveoline 1 a été fournie par Riu et
al. (23). La structure et la position de la protéine ont été caractérisées en présence
d’une membrane modèle de dimyristoylphosphatidylcholine (DMPC) par RMN,
fluorescence des résidus tryptophane et par dynamique moléculaire tout atomes
(23). La structure de référence provient de la partie de production des simulations
de dynamiques moléculaire (23).
Dans le cas de cette protéine, MemP3 et PPM ont des prédictions
rapprochées de point de vue qualitatif, mais aucune des méthodes n'a réussi à
faire des prédictions qui se rapprochent de la structure de référence
34
Figure 9 : Comparaison des prédictions de la calveolin faites par MemP3
(orange) et par PPM (vert) avec la structure de référence (bleu) fournie par
Riu et al. (23). La partie A de la figure compare la prédiction de MemP3 avec le
positionnement de la structure de référence. La partie B de la figure compare la
prédiction de PPM avec le positionnement de la structure de référence.
4.2.2 Protéine liant le retinol chez le bovin (PDB: 1KT7)
La structure de référence de la protéine Retinol-Binding a été prise de la
banque de données Coarse Grained DataBase (CGDB) (10). La structure et la
position de la protéine ont été caractérisées en présence d’une membrane modèle
de dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique
moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la
35
protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux
phospholipides de former une bicouche lipidique avec la protéine insérée dedans
(10). La structure de référence provient de la partie de production des simulations
de dynamiques moléculaire (10).
Les deux méthodes, soit MemP3 et PPM ont prédit cette protéine comme
étant périphérique. Par contre, l'insertion de la prédiction faite par MemP3 est
beaucoup plus profonde, avec 7.83 Å de différence par rapport à la position
moyenne des phosphates.
36
Figure 10 : Comparaison des prédictions de la protéine liant le rétinol chez
le bovin faites par MemP3 (orange) et par PPM (vert) avec la structure de
référence (bleu) prise sur CGDB (10). La partie A de la figure compare la
prédiction de MemP3 avec le positionnement de la structure de référence. La
partie B de la figure compare la prédiction de PPM avec le positionnement de la
structure de référence.
37
4.2.3 Src Homology 3 domain (PDB: 1SHG)
La structure de référence de la protéine PDB 1SHG a été prise de la
banque de données Coarse Grained DataBase (CGDB) (10). La structure et la
position de la protéine ont été caractérisées en présence d’une membrane modèle
de dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique
moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la
protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux
phospholipides de former une bicouche lipidique avec la protéine insérée dedans
(10). La structure de référence provient de la partie de production des simulations
de dynamiques moléculaire (10).
La protéine est prédite par les deux méthodes comme étant périphérique.
Par contre, aucune des méthodes n'a pu prédire une orientation semblable à celle
ressortie des simulations de dynamique moléculaire. En effet, pour MemP3 et PPM
les RMSD sont grands, celui de la prédiction de PPM étant le plus grand, soit de
8.88 Å.
38
Figure 11 : Comparaison des prédictions de la protéine Src Homology 3
domain faites par MemP3 (orange) et par PPM (vert) avec la structure de
référence (bleu) pris sur CGDB (10). La partie A de la figure compare la
prédiction de MemP3 avec le positionnement de la structure de référence. La
partie B de la figure compare la prédiction de PPM avec le positionnement de
la structure de référence.
4.2.4 Canal Potassium KvAP (PDB: 1ORS)
La structure de référence du canal potassium KvAP a été prise de la
banque de données Coarse Grained DataBase (CGDB) (10). La structure et la
position de la protéine ont été caractérisées en présence d’une membrane modèle
39
de dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique
moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la
protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux
phospholipides de former une bicouche lipidique avec la protéine insérée dedans
(10). La structure de référence provient de la partie de production des simulations
de dynamiques moléculaire (10).
Dans le cas des deux outils MemP3 et PPM, l'orientation et l'insertion de
cette protéine transmembranaire a été prédite avec précision, ayant des RMSD
plus petits que 3 Å.
40
Figure 12 : Comparaison des prédictions du canal potassium KvAP faites
par MemP3 (orange) et par PPM (vert) avec la structure de référence
(bleu) pris sur CGDB (10). La partie A de la figure compare la prédiction de
MemP3 avec le positionnement de la structure de référence. La partie B de la
figure compare la prédiction de PPM avec le positionnement de la structure de
référence.
4.2.5 Outer membrane protein W (PDB: 2F1V)
La structure de référence de la protéine PDB 1F1V a été prise de la banque
de données Coarse Grained DataBase (CGDB) (10). La structure et la position de
la protéine ont été caractérisées en présence d’une membrane modèle de
41
dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique
moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la
protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux
phospholipides de former une bicouche lipidique avec la protéine insérée dedans
(10). La structure de référence provient de la partie de production des simulations
de dynamiques moléculaire (10).
Comme pour la protéine précédente, les deux méthodes ont pu prédire avec
exactitude la position et l'orientation, encore une fois, les RMSD étant inférieurs à 3
Å.
42
Figure 13 : Comparaison des prédictions de la protéine Outer membrane
protein W faites par MemP3 (orange) et par PPM (vert) avec la structure de
référence (bleu) pris sur CGDB (10). La partie A de la figure compare la
prédiction de MemP3 avec le positionnement de la structure de référence. La
partie B de la figure compare la prédiction de PPM avec le positionnement de la
structure de référence.
43
4.2.5 Synaptotagmine C2B
La structure de référence de la protéine synaptotagmin C2B a été fournie
par Wu et al. (24). L’orientation et la conformation de cette structure ont été
charactérisées par dynamique moléculaire en utilisant le protocol highly mobile
membrane mimetic (HMMM) (25). Ceci a pour effet d’augmenter la vitesse
d’insertion d’une protéine dans la membrane HMMM. Wu et al. ont utilisé des
lipides à queue courte divalerylphosphatidylserine (DVPS) et
divalerylphosphatidylcholine (DVPC) sur les couches proximale et distale avec une
couche du solvant organique 1,1-dichloroethane (DCLE) au milieu (24).
Dans le cas de cette protéine, les deux méthodes ont pu la prédire comme
étant périphérique. Par contre, ni MemP3, ni PPM n'ont pu prédire l'orientation
trouvée à l'aide des simulations de dynamique moléculaire.
44
Figure 14 : Comparaison des prédictions de la protéine Synaptotagmine
C2B faites par MemP3 (orange) et par PPM (vert) avec la structure de
référence (bleu) fournie par Wu et al. (24). La partie A de la figure compare
la prédiction de MemP3 avec le positionnement de la structure de référence. La
partie B de la figure compare la prédiction de PPM avec le positionnement de
la structure de référence.
45
4.2.6 Cytochrome P450 3A4
La structure de référence de la protéine cytochrome P450 2C9 a été fournie
par Berka et al. (27). L’orientation et la conformation de la protéine en contact avec
une membrane modèle de DOPC ont été déterminés à l’aide de la dynamique
moléculaire tout atome (27). La phase de production de la simulation de
dynamique tout atome a été exécutée pour un total de 100 ns. La structure utilisée
pour les prédictions de MemP3 et PPM provient de la simulation tout atome de la
protéine seule en contact avec la membrane modèle.
Les méthodes MemP3 et PPM ont prédits le domaine périphérique de cette
protéine comme étant périphérique, ainsi que la partie transmembranaire comme
étant transmembranaire. Quoique les deux méthodes présentent des petites
variations par rapport à la structure de référence, les prédictions se rapprochent de
la structure de référence.
46
Figure 15 : Comparaison des prédictions de la protéine Cytochrome P450
3A4 faites par MemP3 (orange) et par PPM (vert) avec la structure de
référence (bleu) fournie par Cojocaru et al. (27). La partie A de la figure
compare la prédiction de MemP3 avec le positionnement de la structure de
référence. La partie B de la figure compare la prédiction de PPM avec le
positionnement de la structure de référence.
47
4.2.7 Cytochrome P450 2C9
La structure de référence de la protéine cytochrome P450 2C9 a été fournie
par Cojocaru et al. (26). L’orientation et la conformation de la protéine dans une
membrane modèle de POPC ont été déterminées par des simulations de
dynamique moléculaire à gros grains et tout atome (26). Le système protéine-
lipides gros grains a été simulé pendant une période de 3 µs (26). La structure
équilibrée provenant de la simulation à gros grains a été convertie en résolution
atomique, dans le but de faire des simulations tout atome (26). La structure utilisée
pour les prédictions de MemP3 et PPM provient de la simulation tout atome de la
protéine seule en contact avec la membrane modèle.
Dans le cas du cytochrome P450, le résultat de PPM se rapproche plus de
la structure de référence que la prédiction de MemP3. En effet, même si du point
de vue RMSD la prédiction de PPM semble plus éloignée, il est possible de
remarquer que la partie transmembranaire prédite par MemP3 ne se rapproche pas
de la structure de référence.
48
Figure 16 : Comparaison des prédictions de la protéine Cytochrome P450
2C9 faites par MemP3 (orange) et par PPM (vert) avec la structure de
référence (bleu) fournie par Berka et al. (26). La partie A de la figure
compare la prédiction de MemP3 avec le positionnement de la structure de
référence. La partie B de la figure compare la prédiction de PPM avec le
positionnement de la structure de référence.
49
4.2.9 OMPLA (PDB: 1QD6)
La structure de référence de la protéine OMPLA a été prise de la banque de
donnée Coarse Grained DataBase (CGDB) (10). La structure et la position de la
protéine ont été caractérisées en présence d’une membrane modèle de
dipalmitoylphosphatidylcholine (DPPC) à l’aide d’une simulation de dynamique
moléculaire à gros grains (10). Les phospholipides ont été ajoutés autour de la
protéine. Par la suite, ce système a été simulé pendant 200 ns pour permettre aux
phospholipides de former une bicouche lipidique avec la protéine insérée dedans
(10). La structure de référence provient de la partie de production des simulations
de dynamiques moléculaire (10).
Les deux méthodes, soit MemP3 et PPM sont capable de prédire cette
protéine comme étant transmembranaire, ainsi que prédire une orientation et
insertion se rapprochant de la structure de référence.
50
Figure 17 : Comparaison des prédictions de la protéine OMPLA faites par
MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu)
pris sur CGDB (10). La partie A de la figure compare la prédiction de MemP3
avec le positionnement de la structure de référence. La partie B de la figure
compare la prédiction de PPM avec le positionnement de la structure de
référence.
51
4.3 Limites de la méthode
Les prochaines prédictions présentent des limitations de la méthode
MemP3, ce qui permet d'évaluer le plein potentiel de cette première version, ainsi
que les améliorations à apporter dans une prochaine version de la méthode.
4.3.1 Hémoglobine tronquée (trHbN) - simulations de dynamique moléculaire
La structure de référence dans les deux figures suivantes a été fournie par
Rhéault et al (4). La structure et la position de la protéine ont été caractérisées en
présence d’une membrane modèle de dioleoylphosphatidylcholine (DOPC) à l’aide
de simulations de dynamique moléculaire tout atomes (4). La protéine en présence
de la bicouche lipidique a été simulée pendant 250 ns et ce pour trois trajectoires
(4). La structure de référence provient de la partie de production de la simulation
de dynamique moléculaire d’une des trois simulations.
Dans cette première figure, les méthodes MemP3 et PPM ont été utilisées
pour prédire l'orientation et l'insertion de la structure provenant des simulations de
dynamique moléculaire. Les deux prédictions ont une orientation qui se rapproche
de la structure de référence. Par contre, du point de vue insertion, les deux
méthodes ont prédit une position plus insérée comparativement à la structure de
référence.
52
Figure 18 : Comparaison des prédictions de la protéine trHbN faites par
MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu)
fournie par Rhéault et al. (4). La partie A de la figure compare la prédiction de
MemP3 avec le positionnement de la structure de référence. La partie B de la
figure compare la prédiction de PPM avec le positionnement de la structure de
référence.
4.3.2 Hémoglobine tronquée (trHbN) - PDB 1IDR
Dans le cas de cette deuxième figure, les méthodes MemP3 et PMM ont été
utilisées pour prédire l'orientation et l'insertion de la structure tridimentionelle de
trHbN provenant de PDB, donc n'ayant pas subi d'équilibration par simulation de
dynamique moléculaire. Ces prédictions ont été comparées avec la même
structure de référence que la figure précédante.
Les deux méthodes n'ont pas été capable de prédire une bonne orientation
ou insertion de la structure provenant de la banque de données PDB. Ceci est du
principalement aux torsions au niveau des angles du coude qui réunit l'hélice Pre-A
avec le reste de la protéine.
53
Figure 19 : Comparaison des prédictions de la protéine trHbN PDB 1IDR
faites par MemP3 (orange) et par PPM (vert) avec la structure de référence
(bleu) fournie par Rhéault et al. (4). La partie A de la figure compare la
prédiction de MemP3 avec le positionnement de la structure de référence. La
partie B de la figure compare la prédiction de PPM avec le positionnement de
la structure de référence.
4.3.3 Peptide de fusion du virus de l’influenza (FusPept) - simulations de dynamique moléculaire
La structure de référence dans les deux images suivantes a été fournie par
Légaré et al. (29). La structure et la position du peptide ont été caractérisées dans
une membrane modèle POPC à l’aide des simulations de dynamique moléculaire
tout atoms. Huit trajectoires de 200 ns ont été simulées avec le peptide en
présence de la bicouche lipidique. La structure de référence provient d’une de ces
trajectoires.
Comme dans le cas de trHbN, les prédictions de la structure
tridimensionnelle du peptide de fusion provenant des simulations de dynamique
moléculaire et de la banque PDB ont été comparées avec une structure de
54
référence provenant des simulations de dynamique moléculaire.
Dans ce premier cas, la structure provenant des simulations dynamique
moléculaire a été utilisée pour les prédictions. La prédiction de MemP3 a une
insertion plus grande que la prédiction de PPM, ainsi que des degrées d'angles
plus importants.
Figure 20 : Comparaison des prédictions du peptide de fusion faites par
MemP3 (orange) et par PPM (vert) avec la structure de référence (bleu)
fournie par Légaré et al. (29). La partie A de la figure compare la prédiction
de MemP3 avec le positionnement de la structure de référence. La partie B de
la figure compare la prédiction de PPM avec le positionnement de la structure
de référence.
4.3.4 Peptide de fusion du virus de l’influenza (FusPept) - PDB 1IBN
Dans le cas de l'utilisation de la structure tridimensionelle provenant de la
banque PDB, l'insertion prédite par MemP3 est plus importante que pour la
structure provenant des simulations de dynamique moléculaire. Ceci peut être dû
au positionnement des chaines latérales, qui bougent lors d'une simulation de
55
dynamique moléculaire.
Figure 21 : Comparaison des prédictions du peptide de fusion PDB 1IBN
faites par MemP3 (orange) et par PPM (vert) avec la structure de référence
(bleu) fournie par Légaré et al. (29). La partie A de la figure compare la
prédiction de MemP3 avec le positionnement de la structure de référence. La
partie B de la figure compare la prédiction de PPM avec le positionnement de
la structure de référence.
56
Chapitre 5 : Discussion
Comme présenté dans le chapitre 1, l’étude expérimentale des protéines
interagissant avec les membranes est plutôt difficile et les informations obtenues
ne sont pas toujours claires. La grande difficulté dans l’étude des protéines
membranaires réside dans la détermination de leur orientation et de leur insertion
dans une bicouche lipidique. Plusieurs méthodes expérimentales existent pour
déterminer ces deux propriétés, mais ces méthodes sont très coûteuses. D’où
l’importance d’étudier l’orientation et l’insertion des protéines dans une membrane
par des méthodes de modélisation moléculaire.
L'objectif du travail présenté dans ce mémoire est de développer un tel outil
de modélisation moléculaire réalisant une prédiction de l’orientation et de l’insertion
dans une membrane des protéines étudiées, affin d'accélérer le démarrage de
simulations de dynamique moléculaire. De plus, MemP3 est une méthode haut
débit, qui peut être utilisée pour la prédiction du positionnement d'une centaine de
protéines en quelques jours seulement.
La méthode présentée dans ce mémoire permet la prédiction de l’orientation
et l’insertion des protéines dans une membrane et se nomme Membrane Protein
Prediction and Positioning (MemP3). Elle utilise un fichier PDB contenant la
position des atomes pour effectuer les calculs. De plus, MemP3 utilise des PMF
d’insertion membranaires des chaînes latérales des acides aminés, mais ceux-ci
ont été obtenues de la littérature (18) pour une membrane modèle de DOPC. Une
recherche systématique de l’orientation et de l’insertion est effectuée affin de
déterminer la position optimale de la protéine. Cette position est estimée à l’aide
d’un système de score qui est déterminé a l’aide des PMF d’insertion
membranaires des chaînes latérales des acides aminés ainsi que du SASA
normalisé.
L'évaluation d’une méthode de prédiction comme MemP3 se fait à l’aide
d’une sélection de structures de références. Pour valider la méthode MemP3, nous
57
avons choisi des protéines qui ont été équilibrées à l’aide de différentes méthodes
de dynamiques moléculaire. La sélection des protéines de référence inclut une
combinaison de protéines transmembranaires et périphériques, ce qui permet de
tester MemP3 avec ces deux types de protéines.
5.1 Précision de la méthode
La méthode MemP3 permet d’obtenir des prédictions pour les protéines
transmembranaires qui sont en concordance avec les structures de référence. En
effet, du point de vue RMSD, la meilleure prédiction est celle du canal potassium
KvAP (Figure 12) avec un RMSD de 2.26 Å et le résultat avec le plus grand RMSD
est la cytochrome p 450 2C9 (Figure 16), avec un RMSD de 6.33 Å. Même avec
un RMSD de 6.33 Å la position de la structure prédite est semblable avec la
position de la structure de référence. Parmi les protéines transmembranaires, la
prédiction qui s’éloigne le plus de la position de la structure de référence est celle
de la Caveolin-1 (Figure 9) à la fois pour MemP3 et PPM. Par contre, la prédiction
de MemP3 est plus rapprochée de la structure de référence du point de vue RMSD
et de la différence d’insertion que la prédiction de PPM. En effet, le RMSD de la
prédiction de PPM, soit 9.89 Å, est plus que le double du RMSD de la prédiction
faite par MemP3, soit 4.58 Å. La différence d’insertion est la donnée qui influence le
plus la valeur de RMSD. La prédiction de MemP3 ayant une différence d’insertion
de 5.00 Å comparativement à 8.74 Å pour la prédiction de PPM.
Dans le cas des protéines périphériques, certaines prédictions qui sont
rapprochées, alors que d'autres sont éloignés des structures de référence. En
effet, la protéine bovine liant le retinol (Figure 10), l’hémoglobine tronquée (Figure
19) et le peptide de fusion du virus de l’influenza (Figure 21) se rapprochent
beaucoup de la position de leur structure de référence, à la fois pour PPM et
MemP3. Le RMSD de la protéine bovine liant le retinol prédite par MemP3 est de
7.90 Å. Par contre cette valeur est influencée par la différence d’insertion entre la
58
structure prédite et celle de référence, qui est de 7.83 Å. Du point de vue
orientation, les protéines sont rapprochées avec des angles de rotation autour des
axes x, y et z de 5.58°, -4.36° et -0.34° respectivement. Par contre, les prédictions
des protéines scr homology 3 domain (Figure 11), synaptogamin C2B (Figure 14)
et OSH4 (Figure 17) sont éloignés de la position de leur structure de référence
respective, à la fois pour PPM et MemP3. Ces protéines ont un RMSD de 6.60 Å,
21.62 Å et 17.30 Å respectivement, pour les prédictions faites par MemP3 et 8.88
Å,18.49 Å et 12.16 Å respectivement, pour les prédictions faites par PPM. Toutes
ces protéines ont été prédites comme étant périphériques par MemP3 et PPM.
5.2 Limites de la méthode
Les résultats présentés dans le Chapitre 3 démontrent que la méthode
MemP3 est capable de prédire avec précision l’orientation et l’insertion dans une
membrane modèle DOPC pour toutes les protéines transmembranaires et la
plupart des protéines périphériques. De plus, il apparaît clair que la méthode
MemP3 est capable de différencier entre les protéines périphériques et
transmembranaires. En effet, même dans les cas où l’orientation ou l’insertion
prédites par MemP3 ne sont pas parfaites, l’outil a été capable de bien différencier
entre les protéines périphériques (Figures 10, 11, 14, 17, 19, 20, 21 et 22) et
transmembranaires (Figures 9, 12, 13, 15, 16 et 18). Pour que l’outil différencie
aussi les protéines solubles, la protéine devra avoir des résidus exposés au
solvant qui sont principalement chargés négativement. En effet, si la protéine a
seulement les résidus acide aspartique et acide glutamique exposés au solvant,
MemP3 sera capable de prédire cette protéine comme n’ayant aucune liaison
membranaire.
La méthode MemP3 n'est pourtant pas sans limitations. En effet, quatres
types de limitations sont présentes : celle due à l’absence des PMF pour les
atomes terminaux chargés, celle due à l’absence de paramètres et celle due à la
59
conformation de départ. De plus, il est nécéssaire de valider les résultats obtenus
avec la méthode MemP3 par des données expérimentales.
Premièrement, le peptide modèle PolyLeucine montre une limitation de la
méthode MemP3, mais surtout avec l’utilisation des PMF d’insertion membranaire
des chaines latérales calculées par MacCallum et al. (18). En effet, MemP3 prédit
le peptide comme étant complètement allongé au milieu de la bicouche lipidique.
Contrairement à cette prédiction, PPM prédit le peptide comme étant orienté près
de la normale de la bicouche lipidique, un résultat qui se rapproche beaucoup plus
de ce qui est attendu en théorie. Le résultat de MemP3 est influencé par le fait qu’il
n’y a présentement pas de PMF disponible pour les atomes terminaux qui sont
chargés. En effet, MacCallum et al. (18) n’ont pas calculé des PMF pour les
atomes chargés se trouvant en C-terminal et N-terminal. Par contre, la prédiction
de MemP3 pour le peptide poly-leucine pourrait être améliorée à l’aide de
l’utilisation des PMF d’insertion membranaire des termini chargés. Le manque de
ces PMF influence moins les prédictions que MemP3 peut faire pour une protéine,
puisque celle-ci est formée par des différents types de résidus.
Deuxièmement, la Figure 21 montre le résultat de la prédiction du peptide
de fusion du virus de l’influenza. Cette prédiction a été faite en utilisant une
structure provenant de la dynamique moléculaire. Les deux outils, MemP3 et PPM,
sont capables de prédire une position qui s’approche de celle de la structure de
référence (Figure 21). Le RMSD de la prédiction de MemP3, pour la structure
provenant de dynamique moléculaire, est de 4.58 Å. La différence majeure entre la
structure prédite et celle de référence provient en majorité de l’insertion du côté N-
terminal. La prédiction est 3.86 Å insérée plus profondément dans la membrane
que la structure de référence. Les carbonyls libres du peptide de fusion participent
à la liaison membranaire, ce qui n’est pas pris en compte dans la prédiction faite
par MemP3, puisqu’il n’y a pas de PMF disponible pour ces groupements. Cela
influence l’insertion du peptide. De plus, lorsque la structure provenant des
données de la banque PDB est utilisée (PDB 1IBN), la prédiction de MemP3 est
moins bonne que la prédiction de PPM (Figure 22). Le RMSD de cette prédiction
60
est de 6.30 Å avec une différence d’insertion de 6.04 Å. Comme la seule différence
entre les deux structures utilisées pour faire des prédictions est une différence
conformationnelle, il est possible de tirer la conclusion que la structure de départ
influence le résultat de la prédiction, en plus du manque de PMF présenté plus
haut. Une possible amélioration sera présentée dans les perspectives de ce travail.
Troisièmement, la Figure 19 montre le résultat de la prédiction de la protéine
trHbN utilisant une structure à l'équilibre provenant de la dynamique moléculaire.
Comme cette structure a expérimenté un changement conformationnel lorsqu’elle
est entrée en contact avec une bicouche lipidique, la prédiction de MemP3 et celle
de PPM sont proches de la position de la structure de référence. Par contre,
lorsqu’on utilise la structure provenant de la base de données PDB, soit 1IDR pour
faire les prédictions, les résultats sont moins bons. Ces résultats peuvent être vus
à la Figure 20. MemP3 tourne la protéine de 97.27° autour de l’axe des x pour
pouvoir placer l’hélice trouvée en C-terminal à l’interface membranaire. Par contre,
PPM place l’hélice du côté C-terminal complètement dans le solvant. Cette hélice
est un point important dans la liaison de la protéine avec la membrane, comme
montré par Rheault et al. (4), donc elle doit se trouver à l’interface. Toutefois, cela
entraîne un mauvais positionnement de la majeure partie de la protéine, dans le
cas de MemP3.
Quatrièmement, les PMF d’insertion des chaînes latérales des acides
aminés histidine, proline et glycine ne sont pas pris en compte dans le calcul des
prédictions, puisque ces PMF n’ont pas été calculés par MacCallum et al. (18).
61
5.3 Vitesse de prédiction
La vitesse d'exécution de MemP3 varie en fonction du nombre d’acides
aminés qui forme la protéine. Par exemple, pour la protéine trHbN présentée dans
les résultats (Figures 19 et 20), le temps de calcul est d’environ 10 minutes.
Lorsque la protéine compte autour de 400 résidus, le temps de calcul peut même
atteindre 60 minutes. Même c’est un temps très rapide par rapport aux simulations
de dynamique moléculaire, la méthode peut être améliorée pour être encore plus
rapide, en modifiant l’algorithme de recherche systématique. Cette amélioration
sera détaillée dans le chapitre 6.
62
Chapitre 6 : Conclusion et Perspectives
6.1 Conclusion
En conclusion, ce projet de maîtrise a permis l’élaboration d’une méthode
appelée MemP3 permettant la prédiction de l’orientation et l’insertion d’une protéine
dans une membrane modèle.
Pour pouvoir utiliser la méthode MemP3, la structure tridimensionnelle de la
protéine d'interêt doit être connue et un fichier PDB contenant la position des
atomes doit être disponible. De plus, MemP3 utilise des PMF d’insertion
membranaire des chaines latérales des acides aminés qui se trouvent dans la
littérature (18) pour une membrane modèle de DOPC. Ces derniers ont été utilisés
lors du dévelopement et de la validation de MemP3. D’autres PMF pourraient être
utilisées sans modification au code source de MemP3.
Le fichier PDB que MemP3 utilise doit être préparé. Cela implique d’enlever
tous les atomes du fichier PDB sauf ceux de la protéine. Par la suite une recherche
systématique de l’orientation et de l’insertion est réalisée en positionnant cette
structure le long de l’axe des z, soit la normale de la membrane, en variant les
angles de rotations autour des axes x et y. Pour déterminer la meilleure orientation
et insertion, MemP3 utilise un système de score. Ce dernier est calculé à l’aide des
PMF d’insertion membranaire des chaînes latérales des acides aminés et du SASA
normalisé des chaînes latérales des acides aminés.
Il a été démontré que MemP3 est capable de prédire avec précision
l’orientation et l’insertion des protéines transmembranaires et périphériques. Par
contre, la méthode est capable de prédire l'orientation et l'insertion des protéines
transmembranaires avec une meilleure précision que pour les protéines
périphériques.
63
6.2 Perspectives
Plusieurs améliorations à la méthode ont été identifiées au cours des
travaux. Une première faisant référence aux PMF manquants pour les C-terminal
et N-terminal chargés, une deuxième qui permettrait l'utilisation du concept de
dynamique moléculaire directement à l'intérieur de MemP3, une troisième qui
permettrait de réduire significativement le temps de prédiction de MemP3 et une
quatrième amélioration qui consiste en l'utilisation des PMF calculés avec des
membranes modèles composées d'autres phospholipides que ceux déjà utilisèes.
Une amélioration qui pourrait être apportée à MemP3 consiste à ajouter des
PMF chargés pour les parties C-terminal et N-terminal des peptides. Cette
amélioration permettra de prédire l’orientation et l’insertion des petits peptides
dans une membrane modèle. De plus, les PMF pour les acides aminés histidine,
proline et glycine peuvent être calculés et ainsi augmenter la précision de MemP3.
La méthode MemP3, tel que développée, ne peut être utilisée pour prédire la
conformation d’une protéine en contact avec une bicouche lipidique. Par contre,
une extension pourrait être ajoutée à MemP3 pour ajouter de la flexibilité aux
protéines à l’aide d’une simulation de dynamique moléculaire dans laquelle les
PMF seraient utilisées pour dériver des forces. Lors de cette dynamique
moléculaire, ces forces seraient appliquées en z sur les atomes des chaines
latérales des acides aminés. Ainsi, le système ne contiendrait que les atomes de la
protéine et, en fonction de leur position en z, une force serait appliquée sur eux.
Cette extension pourrait être une solution au problème présenté dans la section
4.2.
Le temps de calcul d’une prédiction varie selon le nombre de résidus qui
forment la protéine. Comme mentionné dans la section 4.3, le temps de calcul peut
être amélioré. En effet, la fonction de recherche systématique décrite dans le
chapitre 3 peut être remplacée par une fonction de minimisation. Une méthode de
minimisation permet de ne pas évaluer toutes les orientations et positions
possibles de la protéine. En effet, le but est de minimiser l’équation 1, en utilisant
64
un algorithme de minimisation locale. Pour éviter que l’algorithme soit pris dans un
minimum d’énergie local, plusieurs positions de départ devent être utilisées. Dans
ce cas, l’algorithme de minimisation locale sera exécuté pour chaque position de
départ. La position avec l’énergie la plus petite est considérée comme étant la
meilleure prédiction. L’utilisation d’un tel algorithme permet de ne plus calculer le
score pour chacune des positions et orientations de la protéine, ce qui permettrait
de diminuer considérablement le temps de calcul de la méthode. En bref,
l'utilisation d'un algorithme de minimisation plus sophistiqué pourrait effectuer une
recherche en effectuant moins de recherches conformationnelles.
La manière dont MemP3 a été développé permet l’utilisation des PMF de
différents types de membranes modèles. Des PMF d’insertion membranaire des
chaines latérales des acides aminés pour d’autres types de membranes modèle
que celle utilisée ici peuvent être calculés. Ainsi, la méthode pourrait être utilisée
pour comparer l’orientation et l’insertion d’un protéine dans différentes membranes
modèles et évaluer l’impact de ces dernières sur le positionnement de la protéine.
Cette extension permet à MemP3 d'être la première méthode qui peut utiliser des
membranes modèles différentes. Par contre, ces travaux correspondraient au
travail d'un mémoire, voir d'un doctorat.
65
Bibliographie
1. Pedersen, P. L. (1995) Biochemistry, 2nd edit., edited by Donald Voet and Judith G. Voet. New York: Wiley, 1995, 1392 pages, $86.95, Proteins: Structure, Function, and Genetics 23, 613–613.
2. Berman, H. M. (2000) The Protein Data Bank, Nucleic Acids Res. 28, 235–242.
3. Krogh, A., Larsson, B., von Heijne, G., and Sonnhammer, E. L. (2001) Predicting transmembrane protein topology with a hidden Markov model: application to complete genomes, J. Mol. Biol. 305, 567–580.
4. Rhéault, J.-F., Gagné, È., Guertin, M., Lamoureux, G., Auger, M., and Lagüe, P. (2015) Molecular model of hemoglobin N from Mycobacterium tuberculosis bound to lipid bilayers: a combined spectroscopic and computational study, Biochemistry 54, 2073–2084.
5. McIntosh, T. J., and Simon, S. A. (2007) Bilayers as protein solvents: role of bilayer structure and elastic properties, J. Gen. Physiol. 130, 225–227.
6. White, S. H., and Wimley, W. C. (1999) Membrane protein folding and stability:physical principles, Annu. Rev. Biophys. Biomol. Struct. 28, 319–365.
7. Hristova, K., Kalina, H., Wimley, W. C., Mishra, V. K., Anantharamiah, G. M., Segrest, J. P., and White, S. H. (1999) An amphipathic α-helix at a membrane interface: a structural study using a novel X-ray diffraction method, J. Mol. Biol. 290, 99–117.
8. Hohlweg, W., Kosol, S., and Zangger, K. (2012) Determining the Orientation and Localization of Membrane-Bound Peptides, CPPS 13, 267–279.
9. Johnston, A. J., Zhang, Y. R., Busch, S., Pardo, L. C., Imberti, S., and McLain, S. E. (2015) Amphipathic solvation of indole: implications for the role of tryptophan in membrane proteins, J. Phys. Chem. B 119, 5979–5987.
10. Sansom, M. S. P., Scott, K. A., and Bond, P. J. (2008) Coarse-grained simulation: a high-throughput computational approach to membrane proteins, Biochem. Soc. Trans. 36, 27–32.
11. Brooks, B. R., Brooks, C. L., 3rd, Mackerell, A. D., Jr, Nilsson, L., Petrella, R. J., Roux, B., Won, Y., Archontis, G., Bartels, C., Boresch, S., Caflisch, A., Caves, L., Cui, Q., Dinner, A. R., Feig, M., Fischer, S., Gao, J., Hodoscek, M., Im, W., Kuczera, K., Lazaridis, T., Ma, J., Ovchinnikov, V., Paci, E., Pastor, R. W., Post, C. B., Pu, J. Z., Schaefer, M., Tidor, B., Venable, R. M., Woodcock, H. L., Wu, X., Yang, W., York, D. M., and Karplus, M. (2009) CHARMM: the biomolecular simulation program, J. Comput. Chem. 30, 1545–1614.
12. Snider, C., Craig, S., Sajith, J., Kalina, H., and White, S. H. (2009) MPEx: A tool for exploring membrane proteins, Protein Sci. 18, 2624–2628.
13. Lomize, M. A., Lomize, A. L., Pogozheva, I. D., and Mosberg, H. I. (2006) OPM: Orientations of Proteins in Membranes database, Bioinformatics 22, 623–625.
14. Tusnady, G. E., Dosztanyi, Z., and Simon, I. (2004) TMDET: web server for detecting transmembrane regions of proteins by using their 3D coordinates, Bioinformatics 21, 1276–1277.
15. Riniker, S., Sereina, R., Allison, J. R., and van Gunsteren, W. F. (2012) On
67
developing coarse-grained models for biomolecular simulation: a review, Phys. Chem. Chem. Phys. 14, 12423.
16. Marrink, S. J., de Vries, A. H., and Mark, A. E. (2004) Coarse Grained Model for Semiquantitative Lipid Simulations, J. Phys. Chem. B 108, 750–760.
17. Lomize, A. L., Pogozheva, I. D., and Mosberg, H. I. (2011) Anisotropic solvent model of the lipid bilayer. 2. Energetics of insertion of small molecules, peptides, and proteins in membranes, J. Chem. Inf. Model. 51, 930–946.
18. MacCallum, J. L., Drew Bennett, W. F., and Peter Tieleman, D. (2008) Distribution of Amino Acids in a Lipid Bilayer from Computer Simulations, Biophys. J. 94, 3393–3404.
19. Schlick, T., and Tamar, S. (2002) Molecular Modeling and Simulation.20. Leach, A. R. (2001) Molecular Modelling: Principles and Applications, Pearson
Education.21. Durham, E., Dorr, B., Woetzel, N., Staritzbichler, R., and Meiler, J. (2009)
Solvent accessible surface area approximations for rapid and accurate protein structure prediction, J. Mol. Model. 15, 1093–1108.
22. Humphrey, W., William, H., Andrew, D., and Klaus, S. (1996) VMD: Visual molecular dynamics, J. Mol. Graph. 14, 33–38.
23. Rui, H., Huan, R., Root, K. T., Jinwoo, L., Glover, K. J., and Wonpil, I. (2014) Probing the U-Shaped Conformation of Caveolin-1 in a Bilayer, Biophys. J. 106, 1371–1380.
24. Wu, Z., Zhe, W., and Klaus, S. (2014) Synaptotagmin’s Role in Neurotransmitter Release Likely Involves Ca2 -induced Conformational Transition, Biophys. J. 107, 1156–1166.
25. Ohkubo, Y. Z., Zenmei Ohkubo, Y., Pogorelov, T. V., Arcario, M. J., Christensen, G. A., and Emad, T. (2012) Accelerating Membrane Insertion of Peripheral Proteins with a Novel Membrane Mimetic Model, Biophys. J. 102, 2130–2139.
26. Cojocaru, V., Balali-Mood, K., Sansom, M. S. P., and Wade, R. C. (2011) Structure and dynamics of the membrane-bound cytochrome P450 2C9, PLoSComput. Biol. 7, e1002152.
27. Berka, K., Paloncýová, M., Anzenbacher, P., and Otyepka, M. (2013) Behavior of human cytochromes P450 on lipid membranes, J. Phys. Chem. B 117, 11556–11564.
28. Rogaski, B., and Klauda, J. B. (2012) Membrane-binding mechanism of a peripheral membrane protein through microsecond molecular dynamics simulations, J. Mol. Biol. 423, 847–861.
29. Légaré, S., and Lagüe, P. (2014) The influenza fusion peptide promotes lipid polar head intrusion through hydrogen bonding with phosphates and N-terminal membrane insertion depth, Proteins 82, 2118–2127.
68