If you can't read please download the document
Upload
luke
View
38
Download
0
Embed Size (px)
DESCRIPTION
Bioinformatique et Biologie Structurale I/ – Principes et techniques A/ L’information structurale B/ Les différentes techniques de détermination de structure C/ Les nouveaux challenges de la biologie/bioinformatique structurale II/ – Application à l’étude d’enzymes d’intérêt médical - PowerPoint PPT Presentation
Citation preview
Bioinformatique et Biologie Structurale
I/ Principes et techniques
A/ Linformation structurale B/ Les diffrentes techniques de dtermination de structureC/ Les nouveaux challenges de la biologie/bioinformatique structurale
II/ Application ltude denzymes dintrt mdical
A/ Un bref aperu de ce que lon appelle Drug designB/ Recherche dinhibiteurs daminopeptidases de StreptocoquesC/ Relations structure-fonction dhlicases impliques dans les cancers
Bioinformatique et Biologie Structurale
I/ Principes et techniques
A/ Linformation structurale B/ Les diffrentes techniques de dtermination de structureC/ Les nouveaux challenges de la biologie structurale
II/ Application ltude denzymes dintrt mdical
A/ Un bref aperu de ce que lon appelle Drug designB/ Recherche dinhibiteurs daminopeptidases de StreptocoquesC/ Relations structure-fonction dhlicases impliques dans les cancers
Bioinformatique et Biologie Structurale
I/ Principes et techniques
A/ Linformation structurale
1- Le modle molculaire 2- Protein Data Bank (PDB) 3 - Exploiter linformation structurale 4 - Familles de protines 5 - Quelques dfinitions
1- Le modle molculaire
Les chevaux ponctus environ 25000 ans BPIl y a fort longtemps, notre perception du monde tait dj relie au meilleurs outils, dpendant de lchelle et de la rsolution du moment.
Biologie structurale
- F. Crick formule le dogme central de la biologie molculaire :lADN est le support molculaire de linformation gntique qui sexprime travers les protines, notamment les enzymes.
1 Gne ( 1 protine
( relation entre la structure et la fonction de la protine
observable ( Fond sur l'exprience, donnes acquises relles
(cristallographie, RMN,)
prvisible ( Fond sur le calcul et les modles
("modlisation et dynamique molculaires)
Unit fonctionnelle
Comprendre la fonction des gnes
Aller au plus simple
Comprendre la fonction d'un gne passe par l'analyse de la structure tridimensionnelle de la protine pour laquelle code le gne
Pourquoi procder ainsi ?
Les motifs structuraux sont mieux conservs que les squences travers l'volution.
Dmarche
collecter et enregistrer des donnes
interprtation des donnes
relier l'information aux banques de donnes (squence, protines, structure 3D, )
Outils
banques de donnes (( interactives) (gnomique, cDNA, protines, structures 3D, )
Structure 3D
liaisons banques
FONCTION
structure
Gne
Squence
(protique - aa)
familles
1895 :Dcouverte des rayons X1912 :Von Laue dtermine la nature des rayons X - Diffraction par un cristal [NaCl]1926:Premire protine cristallise (Sumner) :Premier clich de diffraction des rayons X obtenu partir d'un cristal de protine - la pepsine - ( Bernal / Hodgkin) Naissance de la Biologie Structurale1953 :Watson et Crick dterminent la structure de la double hlice d'ADN 1955:Elucidation de la premire squence protique (Insuline, Sanger)1959 : Premire structure de protine rsolue (Kendrew) myoglobine, 1200 atomes non hydrogne [Calculateur EDSAC une des toutes 1res applications de l'informatique la biologie] :Lien entre squence et structure (Globines, Perutz)1969: Premire station graphique (Evans and Sutherland ; 9 ans de recherche luniversit de lUtah): Mthode recherche de similarits entre les squences de 2 protines (Needleman & Wunsch)1971:Cration de la Protein Data Bank (PDB) [2 structures dposes en 1972]1974: Prediction of protein conformation (Chou & Fasman)1977: Premier package Bioinformatique (Staden):: Bases de donnes ACNUC, PIR, EMBL, Genbank1978:Modle atomique complet du virus de la Tomate (Harrison) Quel chemin parcouru Les pionniers
The diffraction photograph of the B form of DNA taken by Rosalind Franklin in May 1952 was by far the best photograph of its kind. Data derived from this photograph were instrumental in allowing James Watson and Francis Crick to construct their Nobel Prizewinning model for DNA.
vers 1980:Application de la RMN la structure des macromolcules (100 rsidus) ; premires modlisations molculaires ab initio1981: Los Alamos_Genbank : 270 squences, 370.000 nuclotides (environ 3 Mo) Programme dalignement local (Smith & Waterman)1984:Micro-ordinateur avec interface graphique et souris (MacIntosh)1985 :Premire protine membranaire rsolue - Centre de la raction photosynthtique (Deisenhofer) 12000 atomes autres qu'hydrogne1985-88:Programme Fasta (Pearson-Lipman) et SWISSPROT (1986)1989 : Naissance dInternet1996:La structure de la protase du virus HIV1 contribue la "tri-thrapie" anti SIDA1996:Squence complte de la levure (consortium europen)1997:Structures du Nuclosome (Richmond) et du virus de la Langue Bleue1999:Ralisation du premier mdicament luttant efficacement contre la grippe partir de la structure de la Neuraminidase du virus2000:Structures des sous-units 30 S et 50 S du ribosome2000: Squenage complet du gnome humain.2001:Structure de la RNA polymrase II21me sicleVers une automatisation de la rsolution des structures 3D de macromolculesSynchrotrons de 3me gnration largement ddis la biologie (SOLEIL) Gnomique structurale ("high throughput studies") et thrapie gnique Vers la nanoscale et lautomatisation de toutes les tapes de rsolutionLes ordinateurs se sont perfectionns au fur et mesure qu'augmentaient les besoins des biologistes.
1985 : (Deisenhofer) - 2.3 Centre raction photosynthtiqueRhodopseudomonas virdis, Les objets complexes2000 : Structures des sous-units 30 S et 50 S du ribosome (E. coli)Virus de la Tomate1978 : Virus de la Tomate(Harrisson)
2 - Protein Data Bank (PDB)
Repliement globalDtails l'chelle des liaisons inter atomiquesImage virtuelle (qui reprsente la ralit une chelle agrandie)Couleurs accessoiresPositions atomiquesEnsemble des coordonnes x,y,z! la rsolution d'tudeModle molculaireCette protine adopte un repliement unique qui est la cl de sa fonction.Pepsine humaine et pepstatine (inhibiteur)Relations structure-fonctionRepliement auquel il faut ajouter linformation de dynamique molculaire (interne ; vnements= liaison substrat / inhibiteurs)25
Un exemple de fichier PDB(plusieurs dizaines de pages )
Un exemple de fichier PDB(plusieurs dizaines de pages )
Demographics of Depositions
Macromolecule Type90% - Protein 6% - Nucleic acid 4% - Protein/Nucleic acid complexes
Experimental Method84.0% - X-Ray diffraction15.0% - NMR 0.3% - Electron diffraction 0.1% - Neutron diffraction
Geographic Region59.7% - North America24.8% - Europe12.9% - Asia 2.4% - Australia/New Zealand 0.1% - South America
Release Status63% - HPUB21% - REL16% - HOLD
40.000 structures dposes dont 10.000 humaines (redondances) ... des millions de protines dans le monde du vivantIl reste du chemin parcourir Nov 2006On estime environ 25000 le nombre de gnes et 500000 celui des protines chez lhomme, sans compter les anticorps fabriqus spcifiquement pour rpondre une situation particulire et dont le nombre est certainement de plusieurs millions.Aujourd'hui le nombre de squences de protines rpertories, tout organisme confondu, avoisine les 400000 Pionniers, dvpt mthodesPremires protines clonesGnomique structurale
New Folds (organisation tridimensionnelle originale)1100 folds de protine (diffrents) connus ce jour 90% des repliements (attendus)
Chart8
58
37
30
31
52
36
30
24
28
24
31
15
15
11
18
19
15
11
8
10
11
Year
New folds (% of all chains)
Sheet1
198071258
1981102737
1982175630
198372231
1984254852
198571936
198662030
1987125024
19883713228
19895422224
19909429731
19918653915
199212277815
1993130112011
1994265147018
1995362186719
1996338222115
1997357319811
199834138598
1999385371410
20009680511
Sheet1
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
00
Year
Chains
Sheet2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Year
New folds (% of all chains)
Sheet3
http://www.rcsb.org
Une banque de donnes et un vritable outil de travail
http://www.expasy.org/sprot/SWISS-PROT : du gne lorganisation structurale [20 ans]
Aujourd'hui, en 2006 : plus de 500 bases de donnes gntiques et protiques
3 - Exploiter linformation structurale
Active site(bien souvent la structure est rsume cela)Fold
4 - Familles de protines
1100 folds de protine sont connus, leurs combinaisons conduisent environ 1500 familles de protines (SCOP CATH)
la famille la plus peuple contient environ 220 structures et seules 5 familles ont plus de 100 protines. Les structures protiques sont classes en familles (ou superfamilles)Gnomique structurale : Les protines regroupes dans une mme famille tant structuralement similaires, partagent une fonction similaire
La gntique, puis la gnomique ont ajout ce schma volutif, la nature algorithmique des squences d'ADN. Une consquence de cette volution est que la structure ne dit pas la fonction, en gnral. Ainsi, pour comprendre ce qu'est la vie au moyen du texte des gnome, il nous faudra toujours ajouter de la connaissance biologique (y compris le mode de vie des organismes considrs) notre connaissance des gnomes.
5 - Quelques dfinitions
Quelques dfinitions
dfinition propose par le MIT , BOSTON USA :
[http://matrix.bu.edu/BF527/whatIsPic.html]
Bioinformatics: The application of computer and information science to (complex) biological problems.
dfinition propose par l'universit de Lausane (CH) :
[http://www.isb-sib.ch/DEA/]
La bioinformatique est oprationnellement dfinie comme tant l'tude, laide de techniques informatiques, des composants du monde vivant et plus particulirement des molcules telles que les protines, les acides nucliques et les sucres, et de leurs interactions.
dfinition propose par le Bioinformatics Supercomputing Centre
[Toronto]
(traduction)
La bioinformatique est une discipline scientifique mergente qui utilise la technologie de l'information pour organiser, visualiser, analyser et distribuer l'information biologique afin de rpondre des questions biologiques complexes. Les outils de la bioinformatique permettent aux chercheurs d'affronter le flux sans cesse croissant des donnes biologiques et de rpondre une varit de questions biologiques en une fraction du temps que cela prendrait si on utilisait les techniques d'analyse traditionnelles.
Bioinformatique structurale :
Discipline qui regroupe les mthodes et les techniques qui permettent d'obtenir mais aussi d'exploiter
la structure des macromolcules l'aide de l'outil informatique
(ordinateurs [stations UNIX et PC], logiciels spcialiss et banques de donnes ddies).
Ds que l'on s'aventure dans la structure des protines, on ne peut rien
faire sans l'aide d'un ordinateur et de logiciels puissants et spcialiss.
A quoi sert la Bioinformatique Structurale ?
- Visualiser l'architecture dune macromolcule l'chelle de la liaison inter-atomique.
- En tirer des informations utiles pour tudier les proprits de la molcule.
- Elucider les relations entre structure et fonction
- Agir sur la fonction partir de modifications cibles de la structure
Applications mdicales, pharmaceutiques, agro-alimentaire, volution,
Etude de la spcificit d'un enzyme (d'intrt pharmaceutique, agro-alimentaire, ...)
proposer un mcanisme ractionnel - tude fondamentale (dj)
(S3D + infos biochimie et physiologie)
agir sur la structure (via la squence) pour changer l'activit biologique.
complexes Enzyme - Inhibiteur ou Enzyme - pseudo Substrat
protein design ou enzyme design
proposer des mutations pour permettre l'entre d'un substrat dans le Site Actif
design de molcules "idales"
changer l'activit par la nature de la raction catalyse
modlisation d'un substrat ou d'un inhibiteur dans le site actif (drug design)
tude du repliement d'un ARN ou d'une portion d'ADN
interactions protine - protine, protine - substrat et protine - solvant
surface implique et nature des contacts
interactions Anticorps - Antigne dans le domaine Biomdical
interactions protine - acide nuclique
etc.
L'une des cls des biotechnologies modernes
Analyse d'images Exemple de la radiocristallographie des protines