39
genomika ....uvod

genomika uvod VKMGE

Embed Size (px)

Citation preview

Page 1: genomika uvod VKMGE

genomika ....uvod

Page 2: genomika uvod VKMGE

• Termin genom prvi put koristi nemački botaničarHans Winker, 1920. godine kao skup gena u haploidnom setu hromozoma

• odnosi se na ukupnu DNK ćelije • 1986 genetičar Thomas Roderick koristi izraz

genomika za “mapiranje, sekvenciranje i karakterisanje genoma”

• novi termini vezani za genomiku:funkcionalna genomika, transkriptomika, proteomika, metabolomika (omics)

Page 3: genomika uvod VKMGE

• Genomika se odnosi na sveukupnu studiju gena u genomu

• uključuje: sekvenciranje, transkripcione eseje, funkcionalne studije aktivnosti i regulacije gena, računarske metode, evolutivna poredjenja, itd.

• Obuhvata

– Genom Prokariota

– Genom Eukariota

• nukleus, nDNK

• mitohondrije, mtDNK

• hloroplasti, cpDNK

Page 4: genomika uvod VKMGE

• Sekvenca genoma nam može dati informaciju o:– razviću organizma,

– otpornosti na oboljenja– istoriji vrste, populacije

– budućnosti vrste, populacije

– sličnosti sa ostalim vrstama, populacijama

Page 5: genomika uvod VKMGE

Ciljevi genomike

•Uspostavljanje integrativnih baza podataka– ...uglavnom je „magacioniranje“a trebalo bi ih povezivati

sa ekspresijom

•Opisivanje svakog gena:– funkcija/ekspresija/interakcije/fenotip

– 3-d struktura i njeno ispoljavanje (introni/egzoni, domeni, ponovci)

– sličnosti sa drugim genima

•Karakteristike razvnovrsnosti sekvence u populacijama

Page 6: genomika uvod VKMGE

Genomika:

Strukturna– nalaženje sekvenci

•Funkcionalna– kada je poznata sekvenca gena, istražuje se njena funkcija

– Genom je isti u svim ćelijama ali samo se deo genoma eksprimira u nekim ćelijamaspecifičnosi se razvijaju tokom diferencijacije u razviću

•Komparativna– poredjenje i strukture i funkcije sekvenci genoma medju taksonima

Page 7: genomika uvod VKMGE

veličina genoma

Page 8: genomika uvod VKMGE

Tehnologija rekombinantne DNK

•DNA sekvenciranje, genomske biblioteke, PCR, tehnike hibridizacije

Mapiranje genoma

Ranije....

•Genetičke mape– Rastojanja među jednostavnim markerima izraženo u jedinicama rekombinacije

•Citološke mape– Bojenje hromozoma, vidljivo pod mikroskopom

Sada....

•Fizičke mape– Rastojanje među nukleotidima izraženo u bazama

•Komparativne mape– Detekcija odgovarajućih gena i regulatornih sekvenci

Page 9: genomika uvod VKMGE

Projekat Humanog Genoma (HGP)• Formalno započeo 1990, u U.S.A. Koordinisan od strane U.S. Department

of Energy i National Institute of Health. Planirano da traje 15 godina, ali brzi napredak tehnologije ubrzao završetak.

Ciljevi projekta su bili:

• identifikovati svih 20,000-25,000 gena u humanoj DNK,

• determinisati sekvence 3 milijarde baznih parova koje čine humanu DNK

• čuvati informacije u bazama podataka

• poboljšavati metode za analizu podataka

• obratiti pažnju na etičke, pravne i socijalne probleme koji mogu proizaći iz projekta

Page 10: genomika uvod VKMGE

• Oko 30 000 gena je identifikovano tokom Projekta Humanog Genoma- HGP (od 1990)

• Samo oko 2% humanoggenoma čine geni kojikodiraju za proteine

• Promene u sekvencama DNK mogu da se dese bilo gde, ne samo u genima

Page 11: genomika uvod VKMGE

Mapiranje genoma čoveka

Page 12: genomika uvod VKMGE

http://www.ncbi.nlm.nih.gov/

Page 13: genomika uvod VKMGE
Page 14: genomika uvod VKMGE

Bioinformatika: računarska analiza podataka genomike

• stvaranje algoritama, računarskih i statističkih tehnika i teorije u cilju rešavanja praktičnih problema u analizi bioloških podataka

• Uključuje: applied mathematics informatics, statistics computer science, artificial intelligence, chemistry and biochemistry

• za rešavanje bioloških problema, obično na molekularnom nivou.

• Glavni domeni istraživanja su:– sequence alignment, gene finding, genome assembly, protein

structure alignment, protein structure prediction, prediction ofgene expression and protein-protein interactions, modeling of evolution.

Page 15: genomika uvod VKMGE

Zastupljenost gena prema funkciji u ćeliji sisara

Page 16: genomika uvod VKMGE

postgenomska era

• razumevanje proteoma, transkriptoma, metaloboma...

• svaka ćelija ima isti genom, istu DNK sekvencu sa kojom se radja, ali svaka ćelija u telu ima drugačiji proteom, a on se menja i kroz vreme.

– pri infekciji, proteom se menja u ćelijama, kao imuni odgovor.

– proteomi se menjaju kao odgovor na fluktuacije i unutarćelijskoj i medjućelijskoj sredini ....Lekovi, vežbanje, ishrana.

Page 17: genomika uvod VKMGE

Glavne oblasti istraživanja i primene genomike, proteomike,

bioinformatike

Analiza sekvenci

• DNK faga Φ-X174 je sekvencirana 1977. godine i od tada su DNK sekvence stotina organizama dekodirane i smeštene u bazama podataka odakle se analiziraju, poredeitd.

• Sa porastom broja podataka postalo je teško obradjivati manuelno sekvence pa se računarski progami koriste za istraživanje genoma, hiljade organizama, sa milijardama nukleotida....

Page 18: genomika uvod VKMGE

shotgun sequencing

prvi put u The Institute for Genomic Research prisekvenciranju prvog bakterijskog genoma, Haemophilus influenza

• daje sekvence hiljada kratkih DNK fragmenata (600-800 nukleotida)

• krajevi ovih fragmenata se preklapaju i kada se pravilno postave uzdužno, čine ceo genom.

• daje brzo podatke o sekvencama ali je sklapanje tih fragmenata dugo i komplikovano je za velike genome i zato je upotreba algoritama u sklapanju genomaznačajni deo bioinformatike.

Page 19: genomika uvod VKMGE

Označavanje genoma (genome annotation)

• proces markiranja, označavanja gena i biološki značajnih mesta na DNK.

• Prvi softver za to je dizajniran 1995 - Owen White, član tima koji je sekvencirao prvi organizam, Haemophilus influenzae)

Page 20: genomika uvod VKMGE

automatsko traganje za genima i regulatornim sekvencama unutar genoma

• nisu svi nukleotidi u genomu deo gena i ova “junk DNK” može sadržati nepoznate, ali funkcionalne elemente.

• Bioinformatika spaja procep izmedju genoma i proteoma.

Page 21: genomika uvod VKMGE

Analiza genske ekspresije

• Ekspresija više gena može se odrediti preko nivoa i-RNK– microarrays - DNK čipovi, expressed cDNA sequence tag (EST) sequencing, serial analysis of

gene expression (SAGE) tag sequencing, massively parallel signature sequencing(MPSS), multiplexed in-situ hybridization)

• Sve ove tehnike podložne su greškama (“šumu”) koji proističe iz samog biološkog sistema i merenja i u računarskoj biologiji se razvijaju statističke metode kojima se razdvaja pravi signal od “šuma”

• Ovakve studije se često koriste da odrede gene koji su uključeni u ispoljavanje poremećaja:

– mogu se porediti microarray podaci iz kanceroznih epitelijalnih ćelija i iz nekanceroznih, da se odrede transkripti koji su uzvodno ili nizvodno regulisani u odredjenoj grupi ćelija kancera.

Analiza proteinske ekspresije• Proteinskičipovi i visoko protočna (HT) masena spektrometrija (MS) pružaju sliku o

proteinima prisutnim u biološkom uzorku.

Bioinformatika pravi smisao medju ovim podacima

Page 22: genomika uvod VKMGE

DNK čipovi

• su u najvećoj meri transformisali genomiku• 1. omogućavaju da se simultano meri

nivo transkripcije za svaki gen u genomu• 2. omogućavaju sakupljanje podataka o

celom genomu i njegovom odgovoru na promenu sredine

Biomedicinska primena DNKčipova• za bolje razumevanje i dijagnostifikovanje

kancera • efikasnost lekova - farmakogenetika

Page 23: genomika uvod VKMGE

Analiza regulacije genske ekspresije

• Složena “orkestracija” dogadjaja koji počinju vanćelijskim signalom i vode nakon kaskade dogadjaja porastu, ili padu sinteze jednog, ili više proteinskih molekula

• Bioinformatika se koristi na različitim koracima ovog procesa– analiza promotora uklučuje otkrivanje i studiju sekvence u regionu genoma koji

okružuje gen, a koji utiču na nivo do koga se taj region transkribuje u i-RNK

– Može se porediti genska regulacija: poredjenje microarray podataka sa različitih stupnjeva, ili stanja u razviću i životu nekog organizma, čime se formira hipoteza o genima uključenim u svakom od njih.

– kod jednoćelijskih organizama mogu se porediti podaci iz različitih stadijuma ćelijskog ciklusa u različitim stresnim uslovima (nedostatak ishrane, toplotani šok itd.) Na osnovu metode grupisanja podataka o toj ekspresiji odredjuje se koji geni se,na primer,eksprimiraju zajedno.

Page 24: genomika uvod VKMGE

Analiza somatskih mutacija i poredjenje sa polimorfizmima germinativne linije

• sekvenciranje može da identifikuje niz tačkastih mutacija u različitim genima

• Ovi podaci zahtevaju automatsko čitanje sekvenci i poredjenje sekvenci sa poznatim u humanom genomu, uključujući poznate polimorfizme germinativne linije

• Oligonukleotidni genski čipovi, uključuju komparativnu genomsku hibridizaciju i SNP čipovi, sposobni da vrše probe i do nekoliko stotina hiljada mesta kroz genom koriste se za identifikaciju viška ili manjka hromozoma na primer, u tkivu kancera.

• Hidden Markov model i change-point analysis metode razvijene su da razlikuju stvarne promene u broju kopija i “šuma” u podacima. Dalje metode bioinformatike se razvijaju da razumeju implikacije lezija koje se nalaze na primer u mnogim tumorima.

• Neke metode (e.g. Quantum 3.1 ) pogodne su za promenu proteinske sekvence na specifičnim mestima kroz alteracije amino kiselina i predvidjaju promene u bioaktivnosti nakon mutacija.

Page 25: genomika uvod VKMGE

Informatika i računarska evolutivna biologija

Informatika pomaže evolucionim biolozima na više načina:

• Da prate evoluciju velikog broja organizama merenjem promena na njihovim DNK, ne oslanjajući se samo na fizičke ili fiziološke observacije.

• Da porede genome, što omogućava izučavanje složenih evolucionih dogadjaja kao što su duplikacije gena, lateralni genski transfer itd.

• Da izgrade složene računarske populacione modele koji mogu predvidjati ishode promena genetičke strukture populacija kroz vreme.

Page 26: genomika uvod VKMGE

Komparativna genomika

• evolutivni dogadjaji na različitim

nivoima organizacije oblikuju

genomsku evoluciju:

– na najnižem nivou, tačkaste

mutacije odražavaju se na

nukleotide;

– na višem nivou, veliki

hromozomski segmenti prolaze

duplikaciju, lateralni transfer,

inverziju, transpoziciju, deleciju

ili inserciju;

– konačno, celi genomi su

uključeni u procese

hibridizacije, poliploidizacije i

endosimbioze, što često vodi

brzoj specijaciji.

Page 27: genomika uvod VKMGE
Page 28: genomika uvod VKMGE

• srž komparativne genomske analize je stvaranje veze izmedju gena (orthology analysis) u različitim organizmima.

Page 29: genomika uvod VKMGE

• intergenomske mapeomogućavaju praćenje evolutivnih procesa odgovornih za divergenciju genoma

• razvijanje matematičkih modela i algoritama (parsimony models,

Markov Chain Monte Carlo algorithms, Bayesian analysis) zaizučavanje složenosti genomske evolucije

Page 30: genomika uvod VKMGE

molekularna evolucija vs. populaciona genomika

• Molekularna evolucija ima za cilj analizu tipa promena makromolekulskih sekvenci medju vrstama kroz evoluciju

• Populaciona genomika, slično, primena populacione genetike na genomskoj skali, ali naglasak je na razlikama unutar vrsta

Page 31: genomika uvod VKMGE

procena biodiverziteta

• Biodiverzitet jednog ekosistema može se definisati kao ukupni genomski sastav odredjene sredine, svih prisutnih vrsta

• Baze podataka se koriste da bi se prikupila imena vrsta, opisi, distribucijagenetičke informacije, stanje i veličina populacija, potrebe staništa, interakcije medju vrstama.

• posebni softveri se koriste da pronadju, vizualiziraju i analiziraju informacije i omoguće komuniciranje medju istraživačima

• Kompjuterske simulacije, modeli, na primer za populacionu dinamiku, mogu da procene kumulativni genetički efekat i stanje genofonda, na primer u poljoprivredi ili konzervacionoj genetici.

• Cele sekvence DNK, genomi ugroženih vrsta, mogu se sačuvati zahvaljujući bioinformatici.

Page 32: genomika uvod VKMGE

Primena genomikeu poljoprivredi– sekvenciranje genoma kultivisanih biljaka i

domaćih životinja

– otkrivanje gena za poželjne osobine

– identifikacija patogena

Page 33: genomika uvod VKMGE

primena genomikeu medicini– identifikacija sekvenci i gena za predispiziciju na neka

oboljenja

– poboljšanje dijagnostike• Analize genske ekspresije preko čipova iz više tipova tumora

• Grupisanje obrazaca ekspresije prema tumorima

– Farmakogenomika• odredjivanje terapije prema genotipu

• Identifikacija varijabilnosti u odgovoru na terapije

Page 34: genomika uvod VKMGE

• SNP (polimorfizmi pojedinačnih nukleotida) mesta u genomu po kojima se osobe razlikuju u pojedinačnim nukleotidima

• DNK profilisanje - mapiranje, odredjivanje takvih mesta u genomu

• Baze podataka, upotreba u biomedicini, farmaciji

• neki SNP utiču na osobinu, neki su neutralni(markeri)

• SNP može biti u asocijaciji sa osobinom jer je statistički korelisan sa nekom uzročnom varijantom

http://learn.genetics.utah.edu/units/pharma/phsnipping/

molekul DNK

vezani SNP van genabez efekta na stvaranjei funkciju proteina

uzročni SNP u genu

nekodirajući SNP menja količinu stvorenog proteina

kodirajući SNP menja aminokiselinsku sekvencu

Page 35: genomika uvod VKMGE

osnovan 2002

• cilj: opisati zajednički obrazac variranja humanih DNK sekvenci, ili, napraviti haplotipsku mapu genoma čoveka

• identifikovati LD i distribuciju haplotipova u genomu

• ovo je od značaja za:– identifikaciju lokusa za složene osobine, kod čoveka, npr.

dijabetes, kancer, moždani udar, koronarna oboljenja, depresija, astma

– razumevanje populacione istorije ljudi koja se oslikava u različitosti i sličnosti

– za dizajn i analizu studija genetičkih asocijacija koje zavise od informacije o LD kroz genom – bitno je znati koliki su i gde su predački segmenti hromozoma da bi se koristili odgovarajući SNP markeri

http://hapmap.ncbi.nlm.nih.gov/

http://www.sanger.ac.uk/resources/downloads/

human/hapmap3.html

Page 36: genomika uvod VKMGE

Sumirani zaključci HapMap:

• sve 4 populacije pokazuju sličnu strukturu haplotipskih blokova sa jakim LD, sa slabim ili bez LD medju markerima susednih blokova.

• blokovi obuhvataju 67-87% genoma, a 13-33% analiziranih regiona pokazuju puno veću raznovrsnost i rasutost i razlike medju jedinkama

• Granice hap blokova su na sličnim pozicijama kroz genom

• Hap blokovi variraju po veličini ali tipično je da su 5-15kb, osim u afričkom uzorku (7,3%) usled većeg broja generacija od osnivačkog, predačkog genoma

– mnogo veći blokovi su gde nema rekombinacije, oko centromera ili u regionima koji su pod nedavnom jakom selekcijom

• Većina SNP varijanti je nastala retkim mutacijama (stopa oko 10-8 po nukleotidnom mestu po generaciji) na određenom hromozomu i tako je od početka u LD sa okolnim delom

• Humana genetička varijabilnost je ograničenija nego što se mislilo preko broja mogućih SNPs.

– četiri do šest haplotipa po bloku dovoljno da opiše sve hromozome.

Page 37: genomika uvod VKMGE

LD je opšti fenomen genoma čoveka. Dat je deo genoma u kome su hap blokovi sa D

= 1 odvojeni regionima u kojima se odigrala rekombinacija. Najveći blok ima 80 kb.

Page 38: genomika uvod VKMGE

http://science.bio.org/genomics.news.htmlhttp://www.genomenewsnetwork.org/http://www.ncbi.nlm.nih.gov/

Page 39: genomika uvod VKMGE

• To collect works that help us understand

genomics is not something apart from

ourselves but is ourselves

http://www.genomicart.org/offerings.htm