Bioinformatique et Biologie Structurale I/ – Principes et techniques

  • Upload
    luke

  • View
    38

  • Download
    0

Embed Size (px)

DESCRIPTION

Bioinformatique et Biologie Structurale I/ – Principes et techniques A/ L’information structurale B/ Les différentes techniques de détermination de structure C/ Les nouveaux challenges de la biologie/bioinformatique structurale II/ – Application à l’étude d’enzymes d’intérêt médical - PowerPoint PPT Presentation

Citation preview

  • Bioinformatique et Biologie Structurale

    I/ Principes et techniques

    A/ Linformation structurale B/ Les diffrentes techniques de dtermination de structureC/ Les nouveaux challenges de la biologie/bioinformatique structurale

    II/ Application ltude denzymes dintrt mdical

    A/ Un bref aperu de ce que lon appelle Drug designB/ Recherche dinhibiteurs daminopeptidases de StreptocoquesC/ Relations structure-fonction dhlicases impliques dans les cancers

  • Bioinformatique et Biologie Structurale

    I/ Principes et techniques

    A/ Linformation structurale B/ Les diffrentes techniques de dtermination de structureC/ Les nouveaux challenges de la biologie structurale

    II/ Application ltude denzymes dintrt mdical

    A/ Un bref aperu de ce que lon appelle Drug designB/ Recherche dinhibiteurs daminopeptidases de StreptocoquesC/ Relations structure-fonction dhlicases impliques dans les cancers

  • Bioinformatique et Biologie Structurale

    I/ Principes et techniques

    A/ Linformation structurale

    1- Le modle molculaire 2- Protein Data Bank (PDB) 3 - Exploiter linformation structurale 4 - Familles de protines 5 - Quelques dfinitions

  • 1- Le modle molculaire

  • Les chevaux ponctus environ 25000 ans BPIl y a fort longtemps, notre perception du monde tait dj relie au meilleurs outils, dpendant de lchelle et de la rsolution du moment.

  • Biologie structurale

  • - F. Crick formule le dogme central de la biologie molculaire :lADN est le support molculaire de linformation gntique qui sexprime travers les protines, notamment les enzymes.

    1 Gne ( 1 protine

    ( relation entre la structure et la fonction de la protine

    observable ( Fond sur l'exprience, donnes acquises relles

    (cristallographie, RMN,)

    prvisible ( Fond sur le calcul et les modles

    ("modlisation et dynamique molculaires)

  • Unit fonctionnelle

  • Comprendre la fonction des gnes

    Aller au plus simple

    Comprendre la fonction d'un gne passe par l'analyse de la structure tridimensionnelle de la protine pour laquelle code le gne

    Pourquoi procder ainsi ?

    Les motifs structuraux sont mieux conservs que les squences travers l'volution.

    Dmarche

    collecter et enregistrer des donnes

    interprtation des donnes

    relier l'information aux banques de donnes (squence, protines, structure 3D, )

    Outils

    banques de donnes (( interactives) (gnomique, cDNA, protines, structures 3D, )

    Structure 3D

    liaisons banques

    FONCTION

    structure

    Gne

    Squence

    (protique - aa)

    familles

  • 1895 :Dcouverte des rayons X1912 :Von Laue dtermine la nature des rayons X - Diffraction par un cristal [NaCl]1926:Premire protine cristallise (Sumner) :Premier clich de diffraction des rayons X obtenu partir d'un cristal de protine - la pepsine - ( Bernal / Hodgkin) Naissance de la Biologie Structurale1953 :Watson et Crick dterminent la structure de la double hlice d'ADN 1955:Elucidation de la premire squence protique (Insuline, Sanger)1959 : Premire structure de protine rsolue (Kendrew) myoglobine, 1200 atomes non hydrogne [Calculateur EDSAC une des toutes 1res applications de l'informatique la biologie] :Lien entre squence et structure (Globines, Perutz)1969: Premire station graphique (Evans and Sutherland ; 9 ans de recherche luniversit de lUtah): Mthode recherche de similarits entre les squences de 2 protines (Needleman & Wunsch)1971:Cration de la Protein Data Bank (PDB) [2 structures dposes en 1972]1974: Prediction of protein conformation (Chou & Fasman)1977: Premier package Bioinformatique (Staden):: Bases de donnes ACNUC, PIR, EMBL, Genbank1978:Modle atomique complet du virus de la Tomate (Harrison) Quel chemin parcouru Les pionniers

  • The diffraction photograph of the B form of DNA taken by Rosalind Franklin in May 1952 was by far the best photograph of its kind. Data derived from this photograph were instrumental in allowing James Watson and Francis Crick to construct their Nobel Prizewinning model for DNA.

  • vers 1980:Application de la RMN la structure des macromolcules (100 rsidus) ; premires modlisations molculaires ab initio1981: Los Alamos_Genbank : 270 squences, 370.000 nuclotides (environ 3 Mo) Programme dalignement local (Smith & Waterman)1984:Micro-ordinateur avec interface graphique et souris (MacIntosh)1985 :Premire protine membranaire rsolue - Centre de la raction photosynthtique (Deisenhofer) 12000 atomes autres qu'hydrogne1985-88:Programme Fasta (Pearson-Lipman) et SWISSPROT (1986)1989 : Naissance dInternet1996:La structure de la protase du virus HIV1 contribue la "tri-thrapie" anti SIDA1996:Squence complte de la levure (consortium europen)1997:Structures du Nuclosome (Richmond) et du virus de la Langue Bleue1999:Ralisation du premier mdicament luttant efficacement contre la grippe partir de la structure de la Neuraminidase du virus2000:Structures des sous-units 30 S et 50 S du ribosome2000: Squenage complet du gnome humain.2001:Structure de la RNA polymrase II21me sicleVers une automatisation de la rsolution des structures 3D de macromolculesSynchrotrons de 3me gnration largement ddis la biologie (SOLEIL) Gnomique structurale ("high throughput studies") et thrapie gnique Vers la nanoscale et lautomatisation de toutes les tapes de rsolutionLes ordinateurs se sont perfectionns au fur et mesure qu'augmentaient les besoins des biologistes.

  • 1985 : (Deisenhofer) - 2.3 Centre raction photosynthtiqueRhodopseudomonas virdis, Les objets complexes2000 : Structures des sous-units 30 S et 50 S du ribosome (E. coli)Virus de la Tomate1978 : Virus de la Tomate(Harrisson)

  • 2 - Protein Data Bank (PDB)

  • Repliement globalDtails l'chelle des liaisons inter atomiquesImage virtuelle (qui reprsente la ralit une chelle agrandie)Couleurs accessoiresPositions atomiquesEnsemble des coordonnes x,y,z! la rsolution d'tudeModle molculaireCette protine adopte un repliement unique qui est la cl de sa fonction.Pepsine humaine et pepstatine (inhibiteur)Relations structure-fonctionRepliement auquel il faut ajouter linformation de dynamique molculaire (interne ; vnements= liaison substrat / inhibiteurs)25

  • Un exemple de fichier PDB(plusieurs dizaines de pages )

  • Un exemple de fichier PDB(plusieurs dizaines de pages )

  • Demographics of Depositions

    Macromolecule Type90% - Protein 6% - Nucleic acid 4% - Protein/Nucleic acid complexes

    Experimental Method84.0% - X-Ray diffraction15.0% - NMR 0.3% - Electron diffraction 0.1% - Neutron diffraction

    Geographic Region59.7% - North America24.8% - Europe12.9% - Asia 2.4% - Australia/New Zealand 0.1% - South America

    Release Status63% - HPUB21% - REL16% - HOLD

  • 40.000 structures dposes dont 10.000 humaines (redondances) ... des millions de protines dans le monde du vivantIl reste du chemin parcourir Nov 2006On estime environ 25000 le nombre de gnes et 500000 celui des protines chez lhomme, sans compter les anticorps fabriqus spcifiquement pour rpondre une situation particulire et dont le nombre est certainement de plusieurs millions.Aujourd'hui le nombre de squences de protines rpertories, tout organisme confondu, avoisine les 400000 Pionniers, dvpt mthodesPremires protines clonesGnomique structurale

  • New Folds (organisation tridimensionnelle originale)1100 folds de protine (diffrents) connus ce jour 90% des repliements (attendus)

    Chart8

    58

    37

    30

    31

    52

    36

    30

    24

    28

    24

    31

    15

    15

    11

    18

    19

    15

    11

    8

    10

    11

    Year

    New folds (% of all chains)

    Sheet1

    198071258

    1981102737

    1982175630

    198372231

    1984254852

    198571936

    198662030

    1987125024

    19883713228

    19895422224

    19909429731

    19918653915

    199212277815

    1993130112011

    1994265147018

    1995362186719

    1996338222115

    1997357319811

    199834138598

    1999385371410

    20009680511

    Sheet1

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    00

    Year

    Chains

    Sheet2

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    Year

    New folds (% of all chains)

    Sheet3

  • http://www.rcsb.org

  • Une banque de donnes et un vritable outil de travail

  • http://www.expasy.org/sprot/SWISS-PROT : du gne lorganisation structurale [20 ans]

  • Aujourd'hui, en 2006 : plus de 500 bases de donnes gntiques et protiques

  • 3 - Exploiter linformation structurale

  • Active site(bien souvent la structure est rsume cela)Fold

  • 4 - Familles de protines

  • 1100 folds de protine sont connus, leurs combinaisons conduisent environ 1500 familles de protines (SCOP CATH)

    la famille la plus peuple contient environ 220 structures et seules 5 familles ont plus de 100 protines. Les structures protiques sont classes en familles (ou superfamilles)Gnomique structurale : Les protines regroupes dans une mme famille tant structuralement similaires, partagent une fonction similaire

  • La gntique, puis la gnomique ont ajout ce schma volutif, la nature algorithmique des squences d'ADN. Une consquence de cette volution est que la structure ne dit pas la fonction, en gnral. Ainsi, pour comprendre ce qu'est la vie au moyen du texte des gnome, il nous faudra toujours ajouter de la connaissance biologique (y compris le mode de vie des organismes considrs) notre connaissance des gnomes.

  • 5 - Quelques dfinitions

  • Quelques dfinitions

    dfinition propose par le MIT , BOSTON USA :

    [http://matrix.bu.edu/BF527/whatIsPic.html]

    Bioinformatics: The application of computer and information science to (complex) biological problems.

    dfinition propose par l'universit de Lausane (CH) :

    [http://www.isb-sib.ch/DEA/]

    La bioinformatique est oprationnellement dfinie comme tant l'tude, laide de techniques informatiques, des composants du monde vivant et plus particulirement des molcules telles que les protines, les acides nucliques et les sucres, et de leurs interactions.

    dfinition propose par le Bioinformatics Supercomputing Centre

    [Toronto]

    (traduction)

    La bioinformatique est une discipline scientifique mergente qui utilise la technologie de l'information pour organiser, visualiser, analyser et distribuer l'information biologique afin de rpondre des questions biologiques complexes. Les outils de la bioinformatique permettent aux chercheurs d'affronter le flux sans cesse croissant des donnes biologiques et de rpondre une varit de questions biologiques en une fraction du temps que cela prendrait si on utilisait les techniques d'analyse traditionnelles.

    Bioinformatique structurale :

    Discipline qui regroupe les mthodes et les techniques qui permettent d'obtenir mais aussi d'exploiter

    la structure des macromolcules l'aide de l'outil informatique

    (ordinateurs [stations UNIX et PC], logiciels spcialiss et banques de donnes ddies).

    Ds que l'on s'aventure dans la structure des protines, on ne peut rien

    faire sans l'aide d'un ordinateur et de logiciels puissants et spcialiss.

  • A quoi sert la Bioinformatique Structurale ?

    - Visualiser l'architecture dune macromolcule l'chelle de la liaison inter-atomique.

    - En tirer des informations utiles pour tudier les proprits de la molcule.

    - Elucider les relations entre structure et fonction

    - Agir sur la fonction partir de modifications cibles de la structure

    Applications mdicales, pharmaceutiques, agro-alimentaire, volution,

    Etude de la spcificit d'un enzyme (d'intrt pharmaceutique, agro-alimentaire, ...)

    proposer un mcanisme ractionnel - tude fondamentale (dj)

    (S3D + infos biochimie et physiologie)

    agir sur la structure (via la squence) pour changer l'activit biologique.

    complexes Enzyme - Inhibiteur ou Enzyme - pseudo Substrat

    protein design ou enzyme design

    proposer des mutations pour permettre l'entre d'un substrat dans le Site Actif

    design de molcules "idales"

    changer l'activit par la nature de la raction catalyse

    modlisation d'un substrat ou d'un inhibiteur dans le site actif (drug design)

    tude du repliement d'un ARN ou d'une portion d'ADN

    interactions protine - protine, protine - substrat et protine - solvant

    surface implique et nature des contacts

    interactions Anticorps - Antigne dans le domaine Biomdical

    interactions protine - acide nuclique

    etc.

    L'une des cls des biotechnologies modernes

  • Analyse d'images Exemple de la radiocristallographie des protines