CRO GRID Aplikacije

  • View
    38

  • Download
    1

Embed Size (px)

DESCRIPTION

CRO GRID Aplikacije. Modeliranje i simulacija savijanja proteina i katalitike uloge enzima Izvjee za razdoblje 0 1 .01.2004 1.12.2006. Prof. dr. sc. Zvonimir Maksi Institut Ruer Bokovi Zagreb, Studeni 2006. CILJEVI. - PowerPoint PPT Presentation

Transcript

  • CRO GRID AplikacijeModeliranje i simulacija savijanja proteina i katalitike uloge enzimaIzvjee za razdoblje01.01.2004 1.12.2006.

    Prof. dr. sc. Zvonimir Maksi

    Institut Ruer Bokovi

    Zagreb, Studeni 2006.

  • CILJEVIModeliranje i simulacija savijanja proteina i katalitike uloge enzima

    Ciljevi:- Primjeniti moderne raunske metode u analizi strukture i dinamike biolokih sustava, konkretno peptida i malih proteina.- Razraditi proceduru za simulaciju dinamike peptida i manjih proteina u fiziolokim uvjetima (MD simulacije), te proceduru analize rezultata dobivenih MD simulacijama (analiza MD trajektorija).- Identificirati raunski zahtjevne dijelove simulacije i analize koji bi se mogli ubrzati raunanjem na GRID-u.- Razviti vlastitu aplikaciju za GRID.- Primjeniti alikaciju na sloenije sustave.

  • METODEMetode- U simulaciji dinamike peptida koritena je metoda klasine molekulske dinamike (MD) U toj metodi atomi u molekuli tretiraju se kao klasine estice koje se gibaju u skladu sa zakonima klasine mehanike. Sile koje djeluju na estice izvode se iz funkcije potencijalne energije odnosno iz parametara tzv. polja sila koji su dobiveni vrlo tonim kvantno kemijskim raunima. MD rauni se svode na rjeavanje Newtonovih jednadbi gibanja:Fi = mi ai (1)(2)U praksi se jednadba (2) numeriki integrira sa konanim vremenskim korakom t koji tipino iznosi 1-2 ps.- U analizi rezultata koritene su metode analize glavnih komponenti (PCA) i clustering analiza. Potrebne rutine za analizu preuzete su iz 'open source' paketa MMTSB (Multiscale Modeling Tools for Structural Biology). Za procesiranje MD trajektorija koriten open source alat ptraj.

  • POSTIGNUTI REZULTATI - SIMULACIJA

    Znanstveni cilj projekta bio je ispitivanje postojanja specifinih interakcija izmeu peptida, tzv. sense-antisense interakcija. Te interakcije su izuzetno vane u teoriji molekulskog prepoznavanja. Premda je bilo dosta eksperimentalnih podataka koji su upuivali na postojanje specifinih interakcija meu peptidima, konana eksperimentalna, a pogotovo teorijska potvrda nije postojala. Kao modelni sustav za simulacije izabran je pentapeptid Met-enkefalin (peptid spada u endogene opioidne peptide koji su odgovorni za razliite bioloke procese od kojih je najbolje opisan proces ublaavanja boli). Na primjeru tog peptida prvo je razraena procedura za simulaciju dinamike peptida (MD simulacija). Testirana je tzv. replika exchange metoda koja se odnedavno koristi u simulacijama ovakvog tipa. Mi smo utvrdili da se ona moe u veini sluajeva zamijeniti metodom neinteragirajuih replika, koja se pak moe izvoditi na GRID-u jer ne zahtijeva komunikaciju meu procesima Dobivena znanja pretoena su u tutorial za MD simulacije koji se moe pronai na adresi http://spider.irb.hr/tutorial

  • POSTIGNUTI REZULTATI - SIMULACIJA50 ps MD simulacije na 300 K s implicitnim otapalomPrimjer simulacije peptida Met-enkefalina u implicitnom otapalu animacija trajektorijeKako zapravo izgleda jedna tipina MD simulacija ?

  • POSTIGNUTI REZULTATI - SIMULACIJAPrimjer simulacije peptida Met-enkefalina u eksplicitnom otapalu (H2O) animacija trajektorije 50 ps MD simulacije na 300 K sa eksplicitnim otapalom (kutija vode)Animacije su vizalno dojmljive, ali to iz njih moemo zakljuiti o ponaanju peptida?GOTOVO NITA!

  • POSTIGNUTI REZULTATI - ANALIZA

    Problem koji je bilo potrebni rijeiti, bio je problem analize trajektorija dobivenih MD simulacijama (posebno trajektorija dobivenih tzv. replika exchange metodom).Rezultat simulacije od 1ns za Met-enkefalin koji ima 5 aminokiselina, u kutiji vode dimenzija 27 , je datoteka veliine oko 16 GB (850 MB kad se izbaci voda), dakle radi se o ogromnoj koliini podataka koju je potrebno analizirati. Ovaj problem u analizi identificiran je kao problem koji je mogue adekvatno rijeiti pisanjem aplikacije za GRID. Na primjeru gore spomenutog peptida razraena je procedura za analizu MD trajektorija. Procedura je opisana u tutorialu koji se nalazi na adresi http://spider.irb.hr/tutorial2Na osnovu definirane procedure opisane u tutorialu 2 napisan je program koji nam je omoguio rutinsku analizu MD trajektorija. U analizi se koristi tzv. analiza glavnih komponenti (PCA) i klastering analiza. Program je koriten u analizi trajektorija modelnog sustava Met-enkefalina a kasnije je primijenjen i u analizi veeg sustava hormona -MSH.

  • POSTIGNUTI REZULTATI - ANALIZAAnaliza: ClusteringCluster 1, Pop. = 61%

    Cluster 2, Pop. = 13%

    Cluster 3, Pop. = 26%

    Ace-Ile-Pro-Pro-Lys-Tyr-Nme

  • POSTIGNUTI REZULTATI - ANALIZAAnaliza glavnih komponenti (PCA)Projekcija na vlastite vektore matrice kovarijanceAce-Ile-Pro-Pro-Lys-Tyr-Nme

  • POSTIGNUTI REZULTATI - ANALIZAAnaliza glavnih komponentiKombinirana sa clustering analizomAce-Ile-Pro-Pro-Lys-Tyr-Nme

  • POSTIGNUTI REZULTATI - ANALIZAAnaliza glavnih komponentiKombinirana sa potential of mean force [-ln(M/Mtot)]Ace-Ile-Pro-Pro-Lys-Tyr-Nme

  • POSTIGNUTI REZULTATI - ANALIZAAnaliza trajektorija dobivenih replika exchage dinamikom (REMD) je puno zahtjevnijaREMD -Istodobno izvravanje nekoliko simulacija (replika) na razliitim temperaturamapri emu se dozvoljava njihova izmjena kada je ispunjen odreen uvjet slinosti 16 replika, svaka simulira 2.5 ns to znai da je ukupno vrijeme simulacije 40 ns. Temperaturni rasponje od 275K do 420K.

  • POSTIGNUTI REZULTATI - ANALIZAREMD analiza 4 temperatureAce-Tyr-Gly-Gly-Phe-Met-Nme

  • POSTIGNUTI REZULTATI - ANALIZAto su zapravo sense i komplenetarni peptidi ?

  • POSTIGNUTI REZULTATI - ANALIZASvakoj aminokiselini iz sense peptida odgovara jedna ili dvije aminokiseline u komplementarnom peptidu

  • POSTIGNUTI REZULTATI - ANALIZASense i koplementarni (antisense) peptid postoji li specifina interakcija?Ace-Tyr-Gly-Gly-Phe-Met-NmeAce-Ile-Pro-Pro-Lys-Tyr-Nme

  • POSTIGNUTI REZULTATI - ANALIZAAnaliza: Strukturna svojstvaHistogrami udaljenosti centara masa (COM) komplementarnih aminokiselina

  • POSTIGNUTI REZULTATI - ANALIZAAnaliza: Strukturna svojstvaUdaljenosti izmeu centara masa komplementarnih peptida

  • POSTIGNUTI REZULTATI - ANALIZAMjera komplementarnosti ?

  • Mjera komplementarnosti peptidaPOSTIGNUTI REZULTATI - ANALIZA

  • POSTIGNUTI REZULTATI - ANALIZAStrukture koje su unutar granine vrijednosti za komplementarnost grupiraju se u dva klastera. Te strukture ine 2% ukupnog konformacijskog prostora

  • POSTIGNUTI REZULTATI - ANALIZAZakljuak:

    Simulacije ukazuju na postojanje interakcija izmeu Met-Enkefalina i njegovog antisense peptida.

    Simulacije takoer pokazuju da se 2% ukupnog broja struktura u simulacijimoe smatrati strukturama sparenim prema definiciji komplementarnosti.

    Ovaj pristup simulaciji i analizi peptida koji smo razvili pokazao se vrlo obeavajuiu razumijevanju interakcija izmeu sense i komplementarnih peptida.

  • POSTIGNUTI REZULTATI PROGRAM ZA ANALIZU

    Analiza trajektorija dobivenih replica exchhange simulacijama pokazala se izuzetno zahtjevnom Koliina podataka prelazi 16 GB za pentapeptid u kutiji vode veliine 27 . Analiza je zahtijevala izradu odgovarajueg programa, koji je u poetku napisan za izvravanje na klasteru a kasnije je modificiran i prilagoen radu na GRID-u. Program je zamiljen tako da analizira podatke za svaku pojedinu temperaturu iz replica exchange simulacije na zasebnom nodu unutar klastera odnosno na zasebnom raunalu unutar GRID-a. Analiza MD trajektorija sastoji se od posla koji se moe razdijeliti na nekoliko neovisnih procesa (analiza pojedinih teperatura) i posla koji se mora izvriti na jednom procesoru (dijeljenje trajektorije na n dijelova pri emu je n broj temperatura). Da bi se takav kompleksan posao mogli izvravati na GRID-u bilo je potrebno definirati workflow. To smo postigli pisanjem odgovarajue CONDOR-DAGMAN skripte, te nekoliko CONDOR skripti. Program se na gridu pokree izvravanjem jedne skripte sa nekoliko argumenata: [TRAJEKTORIJA] [BROJ REPLIKA] [BROJ STRUKTURA] [TOPOLOGIJA] [RADIJUS KLASTERA]

  • POSTIGNUTI REZULTATI PROGRAM ZA ANALIZUOutput programa ine slijedee datoteke:Centroid.stats sadri informacije o broju klastera i njihovoj populaciji (statistika)CentroidI.member.dat (gdje je I broj klastera) sadri strukture koje su dio tog klasteraCentroidI.pdb (gdje je I broj klastera) sadri kordinate centroida tog klasteraClustI.crd(gdje je I broj klastera) je ASCII trajektorija tog klasterabestI-J.pdb(gdje je I broj klastera a J je broj strukture najblie centroidu tog klastera) sadri strukturu najbliu centroidu klasterapca-I.dat(gdje je I broj klastera) sadri projekciju prve dvije glavne komponente struktura u I-to klasterurmscI.dat(gdje je I broj klastera) sadri rmsd struktura u klasteru I u odnosu na centroid I-tog klasterarmsbI.dat(gdje je I broj klastera) sadri rmsd struktura u klasteru I u odnosu na strukturu najbliu centroidu klasteraProgram je testiran na analizi Met-enkefalina i kasnije je rutinski primjenjen u analizi veeg peptida tzv. -melanocit hormona - peptida koji se sastoji od 13 aminokiselina.

  • POSTIGNUTI REZULTATI PROGRAM ZA ANALIZUZakljuak:

    Pokazali smo da je analizu trajektorija dobivenih replica exchange MD simulacijama mogue izvravati na GRID-u. Napisan je program za analizu MD trajektorija prilagoen radu na postojeoj CRO-GRID infrastrukturi i instaliranom middleware-u. Koritenjem programa na GRID-u analiza je ubrzana nekoliko puta u odnosu analizu koja se prije izvravala sekvencijalno na jednom raunalu. Koritenjem programa sada je mogue rutinski analizirati i vee sustave to smo demonstrirali na sluaju peptida -MSH (koji ima 13 aminokiselina) i dimera -MSH i njegovog komplementarnog peptida.

  • POSTIGNUTI REZULTATI - SAETAK

    Razraena je pr