29
Bevezetés a Bevezetés a Bioinformatikába Bioinformatikába Fehérjék Fehérjék t t é é rszerkezet rszerkezet e e Kozlovszky Miklós [email protected] 3. Előadás

Bevezetés a Bioinformatikába Fehérjék t é rszerkezet e

  • Upload
    zea

  • View
    28

  • Download
    1

Embed Size (px)

DESCRIPTION

Bevezetés a Bioinformatikába Fehérjék t é rszerkezet e. Kozlovszky Miklós [email protected] 3 . Előadás. Ismétlés. Inform áció kódolás Jelkészlet: IUPAC Fileformátumok Genbank PDB FASTA ASN.1. Ismétlés II. Enzimek: szubsztrát->tranzíciós állapot-> produktum Kötődési modellek - PowerPoint PPT Presentation

Citation preview

Page 1: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Bevezetés a BioinformatikábaBevezetés a BioinformatikábaFehérjékFehérjék t téérszerkezetrszerkezetee

Kozlovszky Miklós

[email protected]

3. Előadás

Page 2: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

IsmétlésIsmétlés

Információ kódolás– Jelkészlet: IUPAC– Fileformátumok

Genbank PDB FASTA ASN.1

Page 3: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Ismétlés II.Ismétlés II.

Enzimek: szubsztrát->tranzíciós állapot-> produktum

Kötődési modellek– Kulcs-zár– Indukált illesztés

Aktív hely, szubsztrát kötő helyFehérje adatbázisok

– PDB, Swiss-prot

Page 4: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Felhasználási területek I.Felhasználási területek I.

Molekulastruktúra megjelenítés– Számítógépes grafikával– Aktív centrumok meghatározása– Másodlagos szerkezet analízis– Domén identifikáció– Molekulageometria analízis– Molekulák közötti kapcsolati területek– Molekulafelszín vizualizáció– Elektrostatikus potenciál számolás

Page 5: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Fehasználási területek II.Fehasználási területek II. Fehérjeazonosítás

– Aminosav összetétel/tömeg/izoelektromos pont stb. alapján– Struktúra klasszifikáció, fehérje azonosításhoz

Struktúra illesztés, összehasonlítás– Rokonsági (pl. evolúciós) kapcsolatok kutatása

Fizikai tulajdonságok predikciója a szekvenciából– Térszerkezet-predikció – Oldószer általi hozzáférhetőség predikciója– Transzmembrán hélixek predikciója– Kölcsönhatások predikciója– Töltésviszonyok predikciója– Felszíni struktúrák, üregek meghatározása (hozzáférési pontok!)

Page 6: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Fizikai tulajdonságok Fizikai tulajdonságok és a szekvencia I.és a szekvencia I.

Aktív területek jóslása– http://www.biochem.ucl.ac.uk/bsm/ligplot/

ligplot.html

Topológia-cartoon (segít a vizualizációban)– http://www3.ebi.ac.uk/tops/

Page 7: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Fizikai tulajdonság és a Fizikai tulajdonság és a szekvencia II.szekvencia II.

Naccess (Oldékonyság/oldhatóság)– A hozzáférhető molekulákat számolja PDB file-ból– http://wolf.bms.umist.ac.uk/naccess/

Elektrosztatikus potenciál számolás + molekula dinamika+ brown mozgás szimulációk– UHBD (University of Houston Brownian Dynamics)

http://adrik.bchs.uh.edu/uhbd.html

Page 8: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Struktúra osztályozásStruktúra osztályozás

Adatbankok – SCOP (structural Classification of Proteins)

http://scop.mrc-lmb.cam.ac.uk/scop/

– CATH hasonló a SCOP-hoz, csak más szempontok alapján

osztályozhttp://www.biochem.ucl.ac.uk/bsm/cath/cath.html

Page 9: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Kérdés:Kérdés:Miért kell térszerkezetet Miért kell térszerkezetet jósolnijósolni??

0

50000

100000

150000

200000

250000

300000

1984 1986 1988 1990 1992 1994 1996 1998 2000

Year

Num

ber

of e

ntri

es

Sequences (PIR)

Structures (PDB)

Page 10: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

VálaszokVálaszok

A kísérletek– költségesek– nehezen automatizálhatóak– sok időbe kerülnek

In silico:– Olcsó, „gyors”,automatizálható => pontatlan

Ha tudjuk a szerkezetet– következtethetünk a funkcióra

Ha többféle vizsgálatot használunk csökken a tévedés veszélye

Page 11: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

SzekvenciaSzekvencia<<??>strukt>struktúraúraSzent grál kereséseSzent grál keresése

CASP– Aminosav szekvenciából struktúra jóslás– Két évente rendezik a versenyt– http://predictioncenter.org/– Népszerű verseny (sok algoritmus)– A verseny nyílt, az algoritmusokat többféle

szempont alapján rangsorolják

Page 12: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Másodlagos struktúrajóslás Másodlagos struktúrajóslás pontosság mérésepontosság mérése

Q3 mérőszám– N-aminosavak száma a láncban

– Nr3-helyesen jósolt struktúra (alfa-hélix, stb.)

Sov mérőszám (Segment overlap score) (Burkhard Rost et al.) Erősebb mint a Q3

Büntetőpontokat ad ha nem összefüggő a szekvencia (lukakért)

– Megjegyzés Legyünk mindig konzervatívak, érdemes átlagos értékekkel számolni,

Egyszerű statisztikák, nincs bennük „fontossági” mérőszám

Szürke szín=egyezés

Page 13: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

• Első generációs algoritmusok (70-es évek) egyszerű aminosav sorrenden alapultak:• Chou & Fasman (1974) (Aminosav táblázatból)• Lim (1974)• Garnier, Osguthorpe & Robson (1978)• Q3 pontosság kb: 50-55%

• Második generációs algoritmusok (80-as évek)Peptid szegmenseken alapulnak:• GOR III (1987) ismert aminosav sorrendből felállított

struktúrák alapján gyakoriságot vizsgál• Neurális hálózatokkal: Qian & Sejnowski (1988)

• Korábbi algoritmusokból kapott tudást MI-vel megtámogatták

• Q3 pontosság kb: 60-65%

Megoldások, eszközök I.Megoldások, eszközök I.

Page 14: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Megoldások, eszközök II.Megoldások, eszközök II.

Harmadik generációs algoritmusok (90-es évek)Evolúciós információk alapján, többszörös szekvencia illesztéssel• PHD (Q3 ~ 70%)

-Rost B, Sander, C. (1993)• PSIPRED (Q3 ~ 77%)

- http://bioinf.cs.ucl.ac.uk/psipred/- Jones, D. T. (1999) - Sok éven át vezette a CASP-ot

Negyedik generációs algoritmusok? – Max 88% felső korlát?

Page 15: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Strukturálatlan részek Strukturálatlan részek predikciójapredikciója

Viszonylag új területA genom kb. 1/5-e ilyen területeket kódolDISOPRED (2004, Ward et al.)

– http://bioinf.cs.ucl.ac.uk/disopred/

Page 16: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Fold recognitionFold recognition

Viszgált Szekvencia

Fold adatbázis

Hasonlóság mérése

Pont, vagy potenciál

Page 17: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Megoldások, eszközökMegoldások, eszközök THREADER, Jones et al. (1992)

– Nem próbál pontos struktúrát meghatározni– Elég hatékony, de lassú is– Kisebb szerkezeti struktúrákhoz jól használható, teljes

modellekre kevésbé– Az eredmények nehezen értelmezhetők– ftp://bioinf.cs.ucl.ac.uk/pub/threader/manual.pdf

Page 18: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Transzmembrán-hélixek Transzmembrán-hélixek Nagyon fontos terület (80-as évektől)

– (Sejt)membránokhoz/ba kapcsolódás– Membránfehérjék szükségesek alapvető dolgokhoz pl:fotoszintézis,idegi

aktiváció,légzés,immunválasz,sejtközötti jelátvitel,stb…. Fehérje struktúrákat keresünk, melyek:

– Adott helyeken hélix szerkezetűek (17-25 aminosav hossz)– Meghatározott helyeken hidrofób struktúrájuk van– Használható szoftverek

TMHMM

– www.cbs.dtu.dk/services/TMHMM-2.0/ TOPPRED2

– http://bioweb.pasteur.fr/seqanal/interfaces/toppred.html MEMSAT

– http://saier-144-37.ucsd.edu/memsat.html

Kb. 90-95%-os pontosság

Page 19: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

3D 3D Jóslási módszerek általánosságbanJóslási módszerek általánosságban

Egyszerűnek tűnik, de nem az… Két út

– Homológia modellezés (Összehasonlítjuk ismert dolgokkal)

http://salilab.org/modeller/– Ab-initio-jóslás

(Kezdeti szekvenciából jósolunk) Már a másodlagos szerkezeteknél is gondban vagyunk, hátmég ha

bonyolítjuk a dolgot! (Samudrala- RAMP)

Harmadik út...– Hibrid módszereket alkalmazunk

Page 20: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Modell ellenőrzésModell ellenőrzés

Fontos, mert messze vagyunk a 100%-tól– VERIFY-3D

http://nihserver.mbi.ucla.edu/Verify_3D/

– PROCHECK http://www.biochem.ucl.ac.uk/~roman/procheck/

procheck.html

– WHAT IF http://swift.cmbi.kun.nl/whatif/

Page 21: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Fehérjeszerkezet megismerési Fehérjeszerkezet megismerési metodikák (ismétlés)metodikák (ismétlés)

Különválasztás legjellemzőbb tulajdonságok alapján– Méret (SDS-poliakrilamid, gélelektroforézis,

ultracentrifugálás, gélszűrés és kromatográfia– Oldékonyság (oldószerek, detergensek,pH érték)– Töltés (elektroforézis,elektroforézis pH grádiensben)– Kötődési affinitás– Aminosavak mennyiségi meghatározása– Aminosav sorrend meghatározása– 3D fehérjeszerkezet (rtg. kristallográfia, NMR)

Page 22: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

ElektroforézisElektroforézis

Elektroforézis (ismétlés) – Oldatban lévő különböző molekulatömegű és töltésű

(ionizált) részecskék elektródák (anód: +, katód: –) közötti elektromos erőtér hatására ellentétes töltésük szerint vándorolnak.

– Markerek használata– Gél mint vivő közeg

(pl. poliakrilamid – PAGE, agaróz,stb.)– nx100V,mx10perc, a végén festés/rögzítés– A gél (vivőanyag) pórusmérete változtatható

Elektroforézis pH grádiensben

Page 23: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Tömegspektrometria Tömegspektrometria – mass spectrometry -– mass spectrometry -

Jelenleg az egyik leghatékonyabb vizsgálati módszer J.J.Thomson (1910-es évek) – izotóp kutatás 1950-es évektől szerves vegyületekre is alkalmazzák MA: Gyors (20-30 perc)->összetett elegyek minőségi

és mennyiségi elemzése Ionos részecskéket választunk el fajlagos tömegük

(töltésegységre eső tömegük: m/z) szerint csökkentett nyomáson, elektromos, vagy mágneses mezők segítségével.

Felhasználási területek:BioTech, gyógyszerkutatás, környezetvédelem, ellenőrzés (pl.:víz, élelmiszer)

Page 24: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Tömegspektometria alapjaTömegspektometria alapja

Az elválasztott ionok intenzitását folyamatosan mérjük, s így egy ionáram intenzitás - fajlagos tömeg függvénykapcsolathoz, az ún. tömegspektrumhoz jutunk.

Nincs két olyan szerves vegyület, amelyiknek a tömegspektruma (a legintenzívebb ion intenzitására normált, ún. karakterisztikus tömegspektruma) azonos lenne.

Magyarul:megkapjuk a vizsgált peptidek pontos molekulatömegét. Ennek alapján a fehérje azonosítható.

Page 25: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Egy általános tömegspektrométer részeiEgy általános tömegspektrométer részei Mintabeviteli rendszer Ionforrás, ionoptikával, mely ionokat gerjeszt az alábbi

módszerekkel:– Elektronütközéssel

50-75eV energiájú elektronokat ütköztet Gáz fázis->bomlás nélkül kell párologtatni a vegyületet,stabilitás! Elterjedt (adatbankok)

– Kémiai ionizációval (reagens gázzal ütközteti a vegyületet)– Gyors atom bombázással (FAB) (hőérzékenyek dolgokhoz használják)– Mátrix közvetítésével végzett lézer deszorpciós ionizációval (kíméletes!)

lásd a következőkben:MALDI

Analizátor Detektor Vákuumrendszer Számítógép szabályzó és adatkezelő (gyűjtő, feldolgozó, archiváló)

funkcióval.

Page 26: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Jól szabályozható ionizáció lehetővé teszi termikusan igen érzékeny anyagok (enzimek,

hormonok, nagy tömegű biomolekulák, fehérje szekvenciák, stb. tömegspektrometriás vizsgálatát.

A lézer forrásból származó gerjesztő energiát egy mátrix veszi fel és közvetíti a vizsgálandó molekulák felé.

A keletkezett ionokat azután egy nagy térerejű gyorsító rendszer (60-100 kV) kiszívja

Deszorbeálja a kondenzált fázisból Azután a detektor érzékeli

MALDIMALDIMatrix-Assisted Laser Desorption Ionization Matrix-Assisted Laser Desorption Ionization

Page 27: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Analízátor típusokAnalízátor típusok Az elválasztás többféle elv alapján oldható meg. Repülési idő (TOF: time of flight) -> TOF-MALDI Analizátos lehet még: elektromos (pl. kvadropól, rádiófrekvenciás,

ioncsapda, omegatron), mágneses analizátorú, elektrosztatikus, kettős fókuszálású, tandem, stb.

eV = KE = mv2/2

Kinetikus energia

Tömeg-töltés (Mass-to-charge) arány

Elektr. mezőenerg.

20 40 60 80 100

50

100

m/z

Rel. int.%

M+.

86

58

57

4129

Page 28: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

Röntgen kristallográfiaRöntgen kristallográfiaKristályosítani kell hozzá az anyagokat

– Nagy és tiszta protein kristályok – Nehéz előállítás– Sok fehérjét nem „lehet” kristályosítani

Pl. a vízre érzékeny membránproteinek elveszítik formájukat

Page 29: Bevezetés a Bioinformatikába Fehérjék  t é rszerkezet e

NMRNMRNuclear Magnetic ResonanceNuclear Magnetic Resonance

Pauli (1924-25): „az atommagnak is van impulzus, és ezáltal mágneses momentuma”

Edward M. Purcell & Felix Bloch (1946) Több mint fél tucat Nobel-díj idáig az NMR kutatások

segítségével Felhasználási területek:

– Gyógyszeripar, anyagtudományok, kémia, élelmiszeripar,stb.

Egyszerüsített működése:– Az anyagot rádióhullámokkal gerjesztjük,

miközben erős elektromos térben van– Figyeljük a választ, nagyon érzékenyen :)