84
Bioinformatika - Proteomika Medzihradszky (Fölkl) Katalin Dept. of Pharmaceutical Chemistry, University of California San Francisco és Proteomikai Kutatócsoport, SzBK e-mail: [email protected]

Bioinformatika - Proteomika

  • Upload
    darva

  • View
    69

  • Download
    0

Embed Size (px)

DESCRIPTION

Bioinformatika - Proteomika. Medzihradszky (Fölkl) Katalin Dept. of Pharmaceutical Chemistry, University of California San Francisco és Proteomikai Kutatócsoport, SzBK e-mail: folkl @ cgl.ucsf.edu. Bioinformatika úgy általában. adatbázisok felépítése - PowerPoint PPT Presentation

Citation preview

Page 1: Bioinformatika - Proteomika

Bioinformatika - Proteomika

Medzihradszky (Fölkl) KatalinDept. of Pharmaceutical Chemistry,

University of California San Francisco

és

Proteomikai Kutatócsoport, SzBK

e-mail: [email protected]

Page 2: Bioinformatika - Proteomika

Bioinformatika úgy általában

• adatbázisok felépítése

• ezen adathalmazok statisztikai analízise, matematikai értelmezése

• szabályszerűségek meghatározása

• szabályok hasznosítása – predikciók pl. funkcióra, rokonságra, eredetre, szerkezetre stb.

Page 3: Bioinformatika - Proteomika

Bioinformatika úgy általában

• „összehordott” adatokból építkezünk

• többnyire elmélet eleinte

• a gyakorlati hasznosítás majd a végén jön

• persze ez visszahat az elméletre

Page 4: Bioinformatika - Proteomika

Mit lehet kiaknázni?

• genomiális adatbázisok

• fehérje szekvencia adatbázisok

• fehérje 3D szerkezeti adatbázisok

• stb, stb

Meghatározó faktor:

Mennyire megbízhatóak az adatok?

Page 5: Bioinformatika - Proteomika

Proteomika

A sejt fehérjetartalmának kvalitatív és kvantitatív

jellemzése

Mi van jelen? Mennyi? Milyen formában?

Lokalizáció? Kölcsönhatások? Partnerek?

Page 6: Bioinformatika - Proteomika

Problémák

• állandó dinamikus változások

• hatalmas mennyiségi különbségek

• igen eltérő fizikai tulajdonságok – még ugyanarra a géntermékre is

Page 7: Bioinformatika - Proteomika

Még mindig „problémák”

Poszt-transzlációs módosítások

Idő-, faj-, állapot-, lokalizáció- stb. -függő

• permanens vs. dinamikus

• teljes vs. részleges

• jelentős vs. csekély méretváltozás

• hidrofil

• hidrofób

Nem árt érteni a biológiához!

Page 8: Bioinformatika - Proteomika

Láthatóvá tenni a komplexitást...

Frakcionálni kell !

1D-, 2D-, multidimenziós módszerek

Page 9: Bioinformatika - Proteomika

23

45

67 8

18

1716

15

19

14

910

11 1213

11D-SDS-PAGE

* Minden belemegy a gélbe, de kicsi a felbontás.

* Várhatóan fehérje-elegyeketkell analizálni

Page 10: Bioinformatika - Proteomika

2D elfo

1. dimenzió: izoelektromos fókuszálás

→ pI szerint - pH 3-10

DE

savas vagy bázikus fehérjék NEM fókuszálódnak

membrán-fehérjék kicsapódnak

– ionos detergens nem használható

2. dimenzió: SDS-PAGE

Page 11: Bioinformatika - Proteomika

1. spot7. spot

8. spot

2. spot

3. spot

4. spot

5. spot

6. spot

9. spot

pH: 3 4 5 6 7 8 9 10

2 proteins

2 proteins

3 proteins

2 proteins

1 protein

1 protein

4 proteins

1 protein

3 proteins

Page 12: Bioinformatika - Proteomika

2D elfo másképpen

1. dimenzió: 16 BAC-PAGE

(pozitív „fejű” detergens)

2. dimenzió: SDS-PAGE

Minden belemegy a gélbe, de átlósan frakcionálódik – kis felbontás

Page 13: Bioinformatika - Proteomika

Speciális 2D elválasztás

16-BAC

SDS

Pros35 10/14 (71%) 33%

Pros7 34/36 (94%) 63%

Pros6 12/12 (100%) 42%

Pros28.1 14/21 (66%) 54%

Pros29 19/23 (83%) 59%

Pros2 13/15 (86%) 42%

GC12000 13/14 (93%) 35%

ProsMA5 22/44 (50%) 56%

Pros25 12/15 (80%) 50%

Pros3 18/24 (75%) 53%

Pros26 6/15 (40%) 46%

Pros5 11/12 (92%) 26%

GC17331 11/23 (47%) 46%

l(2)05070 15/19 (79%) 72%

Page 14: Bioinformatika - Proteomika

Festés

• Commassie Brillian Blue – kvanti

• Ezüst – érzékenyebb, de NEM kvanti

Trükkök:

• funkciós csoportra specifikus festés

• differenciál festés

Page 15: Bioinformatika - Proteomika

2D-kromatográfia

1. dimenzió: kation - ioncsere

2. dimenzió: fordított fázisú HPLC

Követés: 215 nm-en → peptidkötés

Nyilván semmi hidrofób nem érvényesül ilyen körülmények között...

Reprodukálhatóság degradálódik az oszlop életkorával!

Page 16: Bioinformatika - Proteomika

Ki is kell találni mit is válogattunk szét!

• Edman szekvenálás

→ N-terminuson blokkolt fehérjékkel, keverékkel nem megy

• Western-blot

→ tudni kell, hogy mit keresünk, és kell jó ellenanyag

Page 17: Bioinformatika - Proteomika

alapötlet• Egy bizonyos fehérje adott specificitású

enzimmel emésztve szekvenciájára jellemző hasítási termékeket fog produkálni

• Ha a valóságos emésztményt az adatbázis „in-silico” eredményeivel összevetjük azonosítani tudjuk a fehérjét

Az összehasonlítás alapja csak valami biztosan megjósolható és egyértelműen meghatároztató

tulajdonság lehet: TÖMEG

Page 18: Bioinformatika - Proteomika

A tömegspektrometria előnyei

• alkalmazható keverékekre

• blokkolt fehérjékre is

• kovalens módosítások azonosíthatóak

Page 19: Bioinformatika - Proteomika

Detektálási érzékenység

• Edman szekvenálás – kb. 1 pmól - 10-12 M

• MS – kb. 5-50 fmól - 5x 10-15 - 10-14 M

• Western blot – kevesebb, mint 10-15 M

Page 20: Bioinformatika - Proteomika

MS-alapú Proteomika

• Fordított bioinformatika:

mérési adatok + adatbázisok + algoritmusok → biológiai eredmények

Tudni illik valamit az analitikai módszerről

Page 21: Bioinformatika - Proteomika

Mass Spectrometry 101

• Ionokat mérünk Matrix Assisted Laser Desorption Ionization

Electrospray Ionization – többszörösen töltött ionok

• Nagy vákuumban• quadrupole, Time-of-Flight, ioncsapda

MS → MH+ adatokMS-MS alias CID, CAD, PSD ...

→ szekvencia info

Page 22: Bioinformatika - Proteomika

3000

2500

2000

1500

1000

500

0

15711570156915681567

1567.69 Monoizotópos tömegcsak C12, H1, N14, O16 and S32

← 1 C13

2 C13

Page 23: Bioinformatika - Proteomika

3000

2500

2000

1500

1000

500

0

15711570156915681567

1567.69Felbontás: m/m = 1567.69/0.2

~ 8000

Page 24: Bioinformatika - Proteomika

Miért is kell felbontás?

Page 25: Bioinformatika - Proteomika

Normál peptid, 1000-es felbontás

Page 26: Bioinformatika - Proteomika

Normál peptid, 10 000-es felbontás

Page 27: Bioinformatika - Proteomika

Br-Trp-tartalmú peptid, 1000-es felbontás

Page 28: Bioinformatika - Proteomika

Br-Trp-tartalmú peptid, 10 000-es felbontás

Page 29: Bioinformatika - Proteomika

3+ töltésű peptid, kis felbontás

Page 30: Bioinformatika - Proteomika

3+ töltésű peptid, nagy felbontás

492.26522Δ = 0.33426 = kb. 1/3

492.59948

Page 31: Bioinformatika - Proteomika

Tömegmérés pontossága

0.1 Da mérési hiba egész jó 2 kDa-nál,

DE katasztrófális egy kis molekulánál

Relatív értéket adjunk meg!

pars per million

Page 32: Bioinformatika - Proteomika

Milyen pontosan tudunk mérni?belső standarddal 20 ppm-en belül

± 0.02 Da @ 1000

külső standarddal 200 ppm-en belül

± 0.2 Da @ 1000

intakt fehérjékre 0.1%-on belül

± 100 Da @ 10 000

Gyenge jeleknél nem érvényesül a Gauss eloszlás!

Page 33: Bioinformatika - Proteomika

Emésztési elegy MALDI-spektruma

Page 34: Bioinformatika - Proteomika

Peptidek ESIMS analízise

200

150

100

50

0

Ion

Cou

nts

590585580575570565560

m/z

250

200

150

100

50

0

Ion

Cou

nts

57

2.4

57

2.2

57

2.0

57

1.8

57

1.6

57

1.4

57

1.2

57

1.0

57

0.8

m/z

[1-4

5]M

e

[1-4

5]M

e2

[1-45]Me3

[1-4

5]A

cMe

[1-4

5]A

cMe

2&

[1-4

5]M

e

[1-45]AcMe3& [1-45]Me2

[1-45]Me3

[1-4

5]A

cMe

[1-4

5]A

cMe

2

[1-45]AcMe3571.03(9+)

Page 35: Bioinformatika - Proteomika

Intakt fehérjék MALDI-analízise7000

6000

5000

4000

3000

2000

1000

0

Inte

nsi

ty

50000400003000020000m/z

1569

6

2174

1

2458

5

2743

1

3400

63216

73126

6

4917

0

1791

217

010 x4

Page 36: Bioinformatika - Proteomika

Intakt fehérje ESI-analízise

Page 37: Bioinformatika - Proteomika

Ha ez így megy, minek egyáltalán emésztgetni?

Miért nem mérjük az intakt fehérjéket?

preparatív és interpretív akadályok

Page 38: Bioinformatika - Proteomika

Minta-előkészítés

Legyen a fehérje hozzáférhető a hasításra:

→ denaturálás

→ diszulfid-hidak bontása

Emésztés, kémiai hasítás

Page 39: Bioinformatika - Proteomika

Specifikus hasítások

• tripszin - Lys↓ Arg ↓

• endoproteáz Lys-C - Lys ↓

• endoproteáz Glu-C - Glu ↓ (Asp ↓)

• endoproteáz Asp-N - ↓Asp (↓Glu)

pH kb. 7.5 - 8

• CNBr (+75 %-os TFA) - Met ↓

Page 40: Bioinformatika - Proteomika
Page 41: Bioinformatika - Proteomika
Page 42: Bioinformatika - Proteomika
Page 43: Bioinformatika - Proteomika
Page 44: Bioinformatika - Proteomika

Az analízis

• Egybemérjünk vagy frakcionáljunk?

MALDI vs ESIMS

LC-MALDI

LC-ESIMS

Page 45: Bioinformatika - Proteomika

Mennyire kellene pontosan mérni a peptideket ?

MH+ = 1296.4 ± 0.3 ppm

• 9 különböző aminosav-összetétel

• 36292 különböző szekvencia

• 3 különböző elemi összetétel

Ile/Leu ThrVal/SerLeu GlyGlu/AlaAsp

Page 46: Bioinformatika - Proteomika

Miért kell még szekvencia info?

• Keverékek

• Kovalens módosítások

• Izoformák

• Splice variants

• És ha nincs bent az adatbázisban?

Page 47: Bioinformatika - Proteomika

Hogyan tegyünk szert a szükséges információra?

Feladat: → meghatározni a komponensek tömegét→ egyet fizikailag elkülöníteni→ „szétverni”

Műszeres megoldás: tandem tömegspektrometria, ionkapu, ioncsapda

Fragmentálás: post-source decay (PSD),

ütközéses aktiválás (CID/CAD), elektron-befogás (ECD)

Page 48: Bioinformatika - Proteomika

Peptid fragmentáció

NH2-CH(R1)-CO-NH-CH(R2)-CO~ ~CO-NH-CH(Rn)-COOHyn-1 y1

yn-2 bn-1b2

(72) 159 256 371 534Ala-Ser-Pro-Asp-Tyr-Arg 637 550 453 338 175

bi= gyöksúly + 1

yi = gyöksúly + 19

A fragmentáció módszer- és készülék-függő!

Page 49: Bioinformatika - Proteomika

60.04 S 130.09 y1-NH3 276.16 y2 399.21 b3+H2O 528.25 b4+H2O

70.07 R 138.07 H 277.14 HR-NH3 406.18 HRE-NH3 552.29 y4-NH3

84.08 K 147.11 y1 286.15 RE 415.23 y3-NH3 556.26 m3

87.09 R 197.10 a2 294.17 HR 423.21 HRE 569.32 y4

100.09 R 207.09 b2-H2O 336.18 a3-NH3 432.26 y3 575.30 m2

101.11 K 225.10 b2 353.20 a3 465.22 a4-NH3 583.32 m4

102.06 E 258.16 RE-28 363.19 b3-H2O 482.25 a4 584.27 m5

110.07 H 259.13 y2-NH3 364.17 b3-NH3 492.23 b4-H2O 625.33 m1

112.09 R 266.17 HR-28 381.20 b3 493.22 b4-NH3    

129.10 K 269.12 RE-NH3 395.22 HRE-28 510.24 b4    

SHREK - Elméleti MALDI-CID spektrum – MS product

Page 50: Bioinformatika - Proteomika

131.0946 z1 242.1253 c2 353.2050 a3 416.2383 z3 527.2690 c4

197.1039 a2 260.1372 z2 398.2264 c3 482.2476 a4 553.2972 z4

SHREK – elméleti ECD fragmensek

Elméleti „spektrum”: → lehetséges fragmensek, egyenlő intenzitással

Page 51: Bioinformatika - Proteomika

És egy valóságos spektrum

120

100

80

60

40

20

0

Ion

Co

un

ts

140012001000800600

m/z

300

250

200

150

100

50

0

Ion

Co

un

ts

600500400300200100

m/z

1478.771377.741320.75

1175.761074.66

987.58

930.55

817.45

702.43

615.40

y5

y15y14y13

y12y11

y10

y9

y8

y6

y7

516.31

175.11

187.10

118.02

72.07

74.05

V

T

C* 141.09

159.10

171.07

228.09

270.15

274.19

345.23459.27

y1

y2

y3y4

b2a2

GL

TSG-H2O

b3-H2O474.19TSGLD

363.14

GC*TS-28

327.17210.08

414.20

396.19

SGLDS-28-H2O

730.91(2+)

y152+

832.92(2+)

precursor ion

Arg

ValAla

Asn Gly Val

Ser

Asp

Leu Gly

Ser

ThrCys*

GlyThr

Page 52: Bioinformatika - Proteomika

bioinformatika = bio + informatika

• Nem szabad elfelejtenünk, hogy biológiai mintákkal dolgozunk!

• és kémiailag is aktív vegyületekkel!

• Az algoritmus lehet tökéletes, csak a biológiai rendszer nem viselkedik!

Page 53: Bioinformatika - Proteomika

Megtörtént a frakcionálás, az emésztés...Jön az analízis!

Mondjuk, MALDI

MS-mérés frakcionálatlan, vagy HPLC után

→ egy jellemző (?) MH+ sorozat

↓ MS-Fit

Peptide Mass Fingerprint – alapú fehérjeazonosítás

Mi lehet a baj?

→ aspecifikus hasítás, kovalens módosítás, szennyezés stb.

Page 54: Bioinformatika - Proteomika
Page 55: Bioinformatika - Proteomika
Page 56: Bioinformatika - Proteomika
Page 57: Bioinformatika - Proteomika
Page 58: Bioinformatika - Proteomika
Page 59: Bioinformatika - Proteomika

Nem mindig ilyen szép a menyasszony!

• azaz a PMF-alapú azonosítást meg kell erősíteni

MIÉRT??? – lásd előbb és később is...

• a „vád tanúja”: az MS-MS kísérlet eredménye

Page 60: Bioinformatika - Proteomika

MS-MS eredményekkel is lehet keresgélni!

Page 61: Bioinformatika - Proteomika

Független PMF és MS-MS azonosítás az igazi!

Page 62: Bioinformatika - Proteomika

Elegánsabb az on-line LCMSMS

A nanoHPLC oszlopról minden megy a tömegspektrométerbe (250 nL/min)

ún. „adatfüggő” adatgyűjtés

1) MS mérés

2) Komputer kiválasztja a legintenzívebb iont

3) MS-MS mérés

Page 63: Bioinformatika - Proteomika

MS + MS-MS combined total ion current

MS

MS-MS

Page 64: Bioinformatika - Proteomika

Lekeresés csak MS-MS adatokkal

„script” – az összes MS-MS adatok megfelelő formába rendezve

az egyes spektrumokkal független lekeresés

az eredményeket viszont fehérjénként összegezzük

Page 65: Bioinformatika - Proteomika
Page 66: Bioinformatika - Proteomika
Page 67: Bioinformatika - Proteomika

Nem igazi adatokhoz, hanem az elméleti spektrumhoz hasonlítunk!

Page 68: Bioinformatika - Proteomika
Page 69: Bioinformatika - Proteomika
Page 70: Bioinformatika - Proteomika
Page 71: Bioinformatika - Proteomika

Kovalens módosítások detektálása

• szerencsés esetben találhatunk ilyet is automatizált MS-MS analízissel

• lekereső programok lehetővé teszik a kovalens módosítások követését

Page 72: Bioinformatika - Proteomika

Túl sok variációs lehetőség

rengeteg félreértelmezést okozhat !

Page 73: Bioinformatika - Proteomika

Proteomic studies on Schistosoma mansoni G. Knudsen, J.H McKerrow, UCSF

* “waterborn” parasitic disease, 200 M people infected worldwide through their skin

* Intermediate host – Biomphalaria glabrata

* Enzymes in cercaria secretion are the key to infection

Illusztráció a teljes (nem faj-specifikus) adatbázis lekeresés előnyéről

Page 74: Bioinformatika - Proteomika

It was assumed a simple mixture

• cercaria released from snails, rinsed • secretion triggered with skin lipid• solution collected, concentrated• 1D SDS-PAGE protein-fractionation• in-gel digestion with trypsin• LC/MS analysis Eksigent/Famous - 75 m ID PepMap column; 300 nL/min flow;

water/ACN/0.1% HCOOH mobile phase, gradient elution,

QSTAR; 1 sec MS/3 sec CID; single charged and dynamic exclusion

Page 75: Bioinformatika - Proteomika

What did we find?

• cercaria surface proteins

• cercaria elastases, and glycolytic enzymes

• snail immune response proteins

• photosynthetic proteins

• human keratin

• bovine serum albumin!

Page 76: Bioinformatika - Proteomika

Where did they come from?

• contamination from the cercaria

• SECRETION – the real stuff!

• contamination from the host

• lettuce - should we starve the snails?

• technician

• lab – should we clean the lab?

Page 77: Bioinformatika - Proteomika

Eddig csak kvali volt...

Kvantitatív proteomika1) a frakcionálás szintjén

Pl. 2D gélek összehasonlítása vizuálisan, komputer programokkal, differenciál festéssel

2) az MS-analízis során

Page 78: Bioinformatika - Proteomika

Az MS NEM kvantitatív módszer

* a különböző molekulák nem egyformán detektálhatók

pl. különböző peptidek relatív intenzitása nem tükrözi relatív mennyiségüket

* nem minden komponenst detektálunk az elegyekből

Page 79: Bioinformatika - Proteomika

Hogy lehet ezt legyőzni?

csak nagyon hasonló peptidek relatív intenzitását vethetjük össze!

1) Jelöljünk két sejt-populációt hasonlóan, de megkülönböztethetően!

2) Keverjük össze az összes fehérjét!

3) A keveréket emésszük, analizáljuk!

És így kvantizhatunk!

Page 80: Bioinformatika - Proteomika

Hogyan jelölhetünk?

• ICAT – Cys-oldalláncának alkilezése, könnyű (H8) és nehéz (D8) alkil-csoporttal

→ amiben nincs Cys, az kiesik

→ a deuterált vegyület retenciós ideje kicsit hosszabb

azonosítás: MS-MS alapon

kvanti: relatív intenzitásokból

ingadozás: van az 30% is!

Page 81: Bioinformatika - Proteomika

Hogyan jelölhetünk?

• SILAC (stable isotope labeling)C13, N15, O18

tápanyaggal visszük be – jelölt aminosav→ Olyat kell választani, ami nem alakulhat át más

aminosavvá, illetve nem szintetizálódik a sejtbenTripszines emésztéshez Arg a menő!

a keveréket frakcionáljuk, emésztjük, analizáljuk azonosítás MS-MS alapon kvanti a relatív intenzitásból

Page 82: Bioinformatika - Proteomika

Hogyan jelölhetünk?

• tripszines emésztés H2O18-ban

Két oxigén lép be, minden peptid jelölődik

Rengeteg információ

Még a szekvenálás is könnyebb, a C-terminális ionok csúsznak

DE beszárítás a normál emésztés után, hosszú enzimes inkubáció...

→ veszteségek, nem specifikus hasítások

Page 83: Bioinformatika - Proteomika

Hogyan jelölhetünk?

• iTRAQ ™ (Applied Biosystems)

Nagyon ravasz jelölés!

• amino-csoportra (N-terminus, Lys)

• 4-féle stabil izotópos szerkezet, azonos additív tömeggel, de különböző fragmensekkel (m/z 114, 115, 116, 117)

azonosítás és kvanti az MS-MS adatokból!

Page 84: Bioinformatika - Proteomika

Hasznos web-oldalak

ProteinProspector – http://prospector.ucsf.edu

MS-BLAST - http://dove.embl-heidelberg.de/Blast2/msblast.html

BLAST - http://www.ncbi.nlm.nih.gov/BLAST/

European Bioinformatics Institute - http://www.ebi.ac.uk/

Szekvencia-összehasonlítás -http://www.ebi.ac.uk/clustalw/index.html

MS kezdőknek - „What is mass spectrometry” - www.asms.org