26
Mapiranje humanog genoma

Mapiranje humanog genoma

Embed Size (px)

Citation preview

Page 1: Mapiranje humanog genoma

Mapiranje humanog genoma

SADRŽAJ:

Page 2: Mapiranje humanog genoma

Mapiranje humanog genoma ......................................................................................... 2

Ključne teme .......................................................................................................................... 2

1.1. Uvod .................................................................................................................................. 2

1.2. STS- mjesta označena sekvencom: zajednička osobina za različite tipove mapa ........ 4

1.3. Genetske mape ................................................................................................................ 7

1.3.1 Markeri za mapiranje ...................................................................................................... 12

1.3.2 Opsežna genetička mapa ljudskog genoma ................................................................ 14

1.4 Fizičke mape ..................................................................................................................... 16

1.4.1 Klonske mape ................................................................................................................ 17

Literatura

1

Page 3: Mapiranje humanog genoma

Mapiranje humanog genoma

Ključne teme

Važnost genomskih mapa Mjesto označeno sekvencom (STS) Genetske mape

o Ključni koncept, LOD rezultati, informativne mejoze, faze, haplotip

o RFLP, minisatelitni i mikrosatelitni mapirajući markerio Genthon mapa

Fizičke mapeo Mape klonao Hibridne mape radijacijeo Mape STS sadržajao FISHo Dalekodosežne restrikcijske mape

Mape ekspresije Integracija genetskih mapa, fizičkih mapa i mapa ekspresije

1.1 Uvod

Građa detaljne mape humanog genoma je nedvojbeno bila jedan od najvažnijih razvoja u humanoj genetici tokom zadnjih par godina. Razlog je jednostavan: mape nam dozvoljavaju da pronađemo i izolujemo gene kada o njima nemamo nikakve druge informacije osim njihove lokacije. U zadnjih par godina geni odgovorni za mnoge od glavnih monogenskih poremećaja su izolovani pomoću pozicionog kloniranja. Osim toga, fokus istraživanja u humanoj genetici je pomjeren ka analizi složenih oboljenja. Detaljne mape omogućavaju jedini način pomoću kojeg geni, koji pridonose oboljenjima na koje se sumnja, mogu biti identifikovani i konačno karakterizovani.

Mape humanog genoma mogu imati različite oblike. Razlika među njima je bitna. Genetske mape su bazirane na učestalosti rekombinacija između genetskih markera za vrijeme mejoze. Genetski markeri su

2

Page 4: Mapiranje humanog genoma

osobine humanog genoma koji su varijabilni kod različitih individua. Mogu kontrolisati karakteristike fenotipa koje uključuju nasljedna oboljenja ili mogu biti promjenljiva osobina posmatranog genotipa pri čemu nemaju posljedice po fenotipu. Genetski markeri se slobodno rekombinuju za vrijeme mejoze, osim ako su locirani u istom regionu genoma i u tom slučaju se kaže da su vezani. Vezani markeri su skloni udruženom nasljeđivanju; što su bliže, veća je učestalost udruženog nasljeđivanja. Kada se koristeći referentni set neutralnih markera konstruisala detaljna genetska mapa, gen odgovoran za genetski poremećaj se mogao mapirati posmatrajući udruženo nasljeđivanje između oboljenja i referentnih markera. Ovdje uočavamo presudnu važnost genetskih mapa: one osiguravaju jedinu vezu između biološke realnosti i temeljnog genoma. U mnogim slučajevima, bez genetskih mapa nema saznanja koja inače slijede.

Lokacija gena na genetskoj mapi je važna samo u toj mjeri dok obezbjeđuje načine identifikacije i izolacije DNA sekvence koja formira gen. Ovo nam dozvoljava da izučavamo prirodu proteina kodiranog od strane gena i karakterišemo mutacije koje mogu utjecati na njegovu funkciju. Fizičke mape opisuju lokaciju DNA sekvence. Konstruisane su iscrtavanjem lokacije markera fizičkog mapiranja koji su bazirani na DNA sekvencama. Ako možemo uskladiti genetske i fizičke mape, onda nas genetska lokacija gena usmjerava ka DNA sekvenci koja izgrađuje gen.

Samo mali djelić DNA ustvari kodira proteine, pa često moramo istražiti veliku količinu nekodirajuće DNA da bismo našli gen koji tražimo. Ovdje nam u pomoć pristiže drugi oblik mapa. Geni su DNA sekvence koje se eksprimiraju tako što grade mRNA molekule. Ako iscrtamo porijeklo svih mRNA molekula, tada ćemo formirati mapu DNA sekvenci koje su eksprimirane. Kada genetske i fizičke mape identifikuju regiju genoma u kojoj se gen nalazi, tada našu pažnju možemo usmjeriti na one DNA sekvence koje su eksprimirane.

Genetske mape, fizičke mape i mape ekspresije se zajedno mogu koristiti za pronalaske gena. Slika 1.1 opisuje opšti proces iz kojeg se sa izučavanja segregacije genetskog poremećaja u nekoj porodici možemo usmjeriti na identifikaciju DNA sekvenci koje su promijenjene mutacijom. Sve ovo zavisi od mogućnosti usklađivanja ova tri različita formata mapa. U početku su različiti tipovi mapa bili bazirani na obilježjima koja nisu neophodno kompatibilna. Ključna prednost u konstruisanju genomskih mapa je razvoj markera nazvanog mjesto označeno sekvencom (STS eng. sequence tagged site) koji se može koristiti u sva tri tipa mapa. Jednom kada je lokacija u jednom tipu mapa definisana, njegova lokacija je takođe definisana i u druga dva tipa mapa.

3

Page 5: Mapiranje humanog genoma

Slika 1.1

Postoji drugi važan razlog za konstruisanje mapa. Prije nego humani

genom može biti sekvenciran, potrebno je sastaviti svu DNA u set naručenih klonova. Ovo je neophodno da bi bilo dozvoljeno sekvencioniranju da nastavi sistematski a ne haotično. Redoslijed samih klona je oblik mape. Mape klona su dosad bile konstruisane u vektore zvane gljivični vještački hromosomi (YACs eng. yeast artificial chromosomes) koji nose velike insercije DNA (~1Mb). Ovo je preveliko za sekvencioniranje, tako da će biti neophodno da se konstruišu nove biblioteke sa mnogo manjim insercijama. Mapa fizičkih oznaka će omogućiti da brže naručimo ove kolnove u pripremi za sekvencioniranje. Bili kako bilo, da bismo ovo uradili, fizička mapa mora biti detaljna. Prvi cilj Projekta Humani Genom je bilo konstruisanje mapa genoma. To je utvrdilo ciljeve za rješavanje ovih mapa. Ovo su STS mapa sa STS markerima razdvojenim na svakih 100kb i genetska mapa rezolucije 0,7cM. Kao što ćemo vidjeti, ovaj cilj za genetsku mapu je već postignut, a fizička mapa je skoro potpuna.

1.2 STS- mjesta označena sekvencom: zajednička osobina za različite tipove mapa

Markeri za mapiranje su obilježja čije su pozicije iscrtane da konstruišu različite tipove mapa. Kao što je već spominjano, važno je da različiti tipovi mapa mogu biti usklađeni jedan sa drugim. Međutim, markeri koji se koriste za jedan tip markiranja ne moraju se nužno koristiti i za drugi. Npr., genetski markeri moraju biti bazirani na osobinama koje su prirodno polimorfne. Segregacija oboljenja u porodici je genetski marker zato što su neki članovi oboljeli a neki ne. Međutim, sve dok gen zadužen

4

Page 6: Mapiranje humanog genoma

za oboljenje nije kloniran ne može biti ni korišten kao fizički marker. Fizički marker bi mogla biti DNA sekvenca čije prisustvo u kolnu ili lokacija na hromosomu može biti utvrđena. Međutim, ako je sekvenca ista kod svih individua, onda se ne može koristiti kao genetski marker.

Postoji očita potreba za markerom koji se može koristiti u različitim tipovima mapa. Lančana reakcija polimeraze (PCR eng. polymerase chain reaction) se koristi za stvaranje tipa fizičkog obilježja zvanog STS koji ispunjava zahtjeve. PCR amplificira DNA koristeći sintetičke oligonukleotide kao prajmere (slika 1.2). STS je rastegnuta DNA- oko 300pb u dužini. Kao što mu ime da naslutiti, sekvenca STS-a se koristi da označi veliku DNA molekulu iz koje je izvedena, tako da se DNA region može identifikovati kad god se pojavi. Slika 1.3 opisuje kako STS markeri mogu biti stvoreni i korišteni za naručivanje serije klonova. Nukleotidna sekvenca STS-a se koristi za označavanje sekvence dva sintetska oligonukleotida koji će se povezati u suprotnim smjerovima na svakom od krajeva STS-a. Prema tome, oni će amplificirati sekvencu ako se koriste kao prajmeri u PCR reakciji. Koristeći ove prajmere, PCR može biti korišten kao test za otkrivanje da li je sekvenca prisutna u određenom DNA uzorku.

Izvorno se koncept STS markera razvio za fizičko mapiranje jer je baziran na prepoznavanju sekvence. Međutim, naknadno je shvaćeno da STS može biti polimorfan sve dok su prajmeri bili namjenjeni da se prekale u konstantne regije predstavljajući neki vid polimorfizma u dužinu. Vidjet ćemo kako se mikrosateliti mogu koristiti za obezbjeđivanje polimorfnih STS-ova koji se koriste za genetsko mapiranje. STS-ovi se takođe mogu proizvesti od cDNA molekula kao i koristiti za obilježavanje sekvenci koje se eksprimiraju (EST eng. expressed sequence tag). Prema tome, STS obezbjeđuje tip markera koji je kompatibilan sa tri glavna formata mapa i tako im dozvoljava da se usklade sa poštovanjem jedan prema drugom.

5

Page 7: Mapiranje humanog genoma

6

PCR reakcija je oblik in vitro kloniranja koji se može koristiti za amplificiranje veoma malih količina DNA. Ovisi o DNA polimerazi iz termofilnih bakterija koja se može oduprijeti temperaturi od 95°C i ima temperaturni optimum od 72°C. DNA polimeraza može samo sintetisati novu DNA produžavajući 3΄-kraj prethodno egzistirajućeg prajmera. Ovo se koristi za ciljanje nove sinteze u regiji između mjesta gdje se dva prajmera vežu. U svakom ciklusu ishodišna DNA se denaturiše zagrijavanjem na 95°C, kaljenjem na prajmer na temperaturi od 52°C i zatim stavljanjem na inkubaciju na 72°C da bi polimeraza produžila prajmer koristeći ciljnu DNA kao šablon. Na slici je ciljna DNA prikazana plavom, a novosintetisana DNA zelenom bojom; strelice na svakoj DNA pokazuju u smjeru 3΄-kraja. Četri kompletna ciklusa su prikazana i može se vidjeti da je u svakom količina ciljne DNA udvostručena. Ukupno 30 ciklusa znači da količina DNA mala kao jedna molekula može biti amplificirana da proizvede količine DNA u mikrogramima. Ova reakcija se odvija u uređaju koji se može programirati da izvede cikluse određene od strane korisnika. Prajmeri se mogu bez muke sintetisati koristeći automatizovanu tehnologiju. Dužina prajmera je najčešće oko 20 baza; tačna dužina

Page 8: Mapiranje humanog genoma

Slika 1.2: PCR reakcija

Slika 1.3: M13 vektor, YAC i STS

7

Page 9: Mapiranje humanog genoma

Osim činjenice da osiguravaju zajednički marker za različite tipove mapa, postoje četri važne prednosti STS metodologije.

1. Dozvoljavaju DNA fragmentima različitog porijekla da budu pretraženi na postojanje zajedničke sekvence; npr., dva klona mogu biti upoređeni da se otkrije bili kakvo preklapanje među njima. Izvori DNA mogu biti u potpunosti različiti: spominjali smo kako su YAC klonovi i hibridni klonovi koji zrače forme fizičkog mapiranja koje obje koriste STS markere. Zbog ovoga ova dva tipa mapa se mogu udružiti jedan sa drugim.

2. Ako istraživači u jednom laboratoriju želi istražiti da li je STS prisutan u klonovima na kojim rade, oni ne moraju fizički nabaviti klon iz drugog laboratorija koji proizvodi STS. Umjesto toga koristi se sekvenca prajmera da sintetiše oligonukleotide koristeći širokodostupnu tehnologiju za automatsku sintezu. Nema potrebe da se fizički održavaju i distribuiraju stokovi DNA. Ovo rješava važno logističko pitanje održavanja i distribuiranja biblioteka klonova.

3. PCR procedura zahtijeva oba prajmera da se vežu na određenoj udaljenosti jedan od drugog kao i u tačnoj orijentaciji. Ovo umanjuje broj lažnih pozitiva koji se mogu pojaviti koristeći druge metode za usporedbu DNA molekula kao što je hibridizacija.

4. PCR test sam sebe daje za automatizaciju, dozvoljavajući velikom broju testova da bude obavljeno. Pošto je humani genom tako velik, ovo je bitno praktično razmatranje.

1.3 Genetske mape

Genetske mape su bazirane na redoslijedu markera za genetsko mapiranje i na genetskoj udaljenosti među njima mjerenoj putem učestalosti rekombinacija. Postoji veliki broj koncepata povezanih sa genetskim mapama, a koje treba da uzmemo u obzir prije nogo uđemo u raspravu o konstruisanju razumljive mape humanog genoma.

8

STS markeri: Hromosomska DNA se klonira slučajnim odabirom u M13 vektor koji dozvoljava da se lako odredi 300pb sekvence. Ta sekvenca se koristi za kreiranje PCR prajmera koji će amplificirati tu sekvencu kad god se pojavi. U početku su ove sekvence nepoznate i shodno s tim njihova lokacija i funkcija kodirana sekvencom je nepoznata. Međutim, možemo koristiti prajmere da testiramo da li je sekvenca prisutna u drugim tipovima klonova. U ovom primjeru YAC klonovi se pregledaju koristeći ove prajmere (YAC su specijalni vektori za kloniranje koji nose duge insercije). Pozitivan rezultat ukazuje da klon sadrži STS. Ako dva klona sadrže isti STS onda insercije koje oni nose se najvjerovatnije preklapaju. Na ovaj način možemo poredati klonove u nasumičnu biblioteku. Ovaj proces je detaljnije opisan u nastavku ovog poglavlja.

Page 10: Mapiranje humanog genoma

Mjere korištene u mapamaSve mape moraju imati mjernu ljestvicu. Mjera tj. jedinica humanih

genetskih mapa je centimorgan (cM). 1cM je definisan kao frakcija rekombinacije od 0,01. Odnosno, 1 od 100 gameta će biti rekombinovan, a ostalih 99 će imati roditeljsku konfiguraciju. Fizički, 1cM odgovara sekvenci između 0,7 i 1Mb, ali ne postoji invarijantan odnos između fizičke i genetske udaljenosti (vidi sliku 3.9 IZ SELMINOG DIJELA ubaci koja je).

Informativne i neinformativne mejozeDa bi se izmjerila učestalost rekombinacija između dva markera za

vrijeme mejoze, potrebno je da je mejoza informativna, tj. da je moguće da se uvidi razlika između roditeljskih i rekombinantnih hromosoma. Ovo zahtijeva da oba markera budu heterozigotna. Slika 1.4 opisuje ovaj slučaj.

Slika 1.4 Informativna mejoza i neinformativna mejoza. Lijevo: dva homologa hromosoma u diploidnoj ćeliji pred sami proces mejoze. Dva susjedna lokusa, svaki sa po dva alela, su locirani na ovim hromosomima. Desno: struktura haploidnih gameta koja je rezultat procesa mejoze. Gore: mejoza je neinformativna jer je jedan od lokusa homozigotan; nakon mejoze gamete će imati hromosome koji su identični bilo da je došlo do rekombinacije ili ne. Dolje: rekombinacija se desila u hromosomima koji se mogu razlikovati od nerekombinovanih hromosoma; za mejozu se zato kaže da je informativna.

9

Page 11: Mapiranje humanog genoma

FazaFaza ukazuje da li su određeni aleli na susjednim lokusima na istom

(cis) ili drugom hromosomu (trans). Npr., u informativnoj mejozi opisanoj na Slici 1.4 aleli A i 1 su u cis dok su aleli A i 2 u trans. Jasno je da je potrebno znati fazu da bismo znali koje posljedice mejoze predstavljaju rekombinantne hromosome, a koji predstavljaju roditeljske hromosome.

HaplotipHaplotip je set usko vezanih alela koji teže da budu nasljeđeni

zajedno tokom mejoze, tj. ne budu razdvojeni rekombinacijom („haplotip“ je skraćenica od „haploidni genotip“). U prethodnom primjeru postoje dva roditeljska haplotipa, A1 i B2. Haplotipovi se mogu sastojati od mnogo više nego dva alela. Generalno, aleli koji izgrađuju haplotip će biti nasljeđeni kao blok zato što njihova neposredna blizina takav učinak ima da je mala vjerovatnoća da će se razdvojiti rekombinacijom.

CEPH porodiceNedavno napravljene genske mape su konstruisane se setovima

referentnih porodica. Mormon porodice

Slika 1.5 Faza može biti razrađena u tri-generacijske porodice. Figura pokazuje segregaciju dva vezana lokusa svaki sa dva alela ( A/a and B/b ). U dvo-generacijskoj porodici lijevo, faza alela u individualnom II-1 je nepoznata; dakle ne može biti uspostavljena bilo da je progenitor u generaciji III naslijedio rekombinaciju ili roditeljski hromosom iz II-1. Genotip roditelja roditelja dozvoljava da faze alela u II-2 budu uspostavljenje. Ovo otkiva da li su individue u generaciji III naslijedile

10

Page 12: Mapiranje humanog genoma

roditeljske ili rekombinacijske hromosome. Vertikalne linije indiciraju faze alela.

Mormonske familije tipično su mnogo veće od normalnih, a dio mormonkse kulture je čuvanje detaljnih snimaka. Uzorci su korišteni da bi se upostavile trajne ćelijske linije, koje su čuvane u CEPH u Parizu. Svaka familija sadrži tri generacije sa 4 roditelja vaših roditelja, 2 roditelja i najmanje 6 djece. Tri generacije dozvoljavaju da se faze markera u roditeljskoj liniji uspostave. Segregacija markera u šestoro djece da se odrede rezultati mejoze u roditelja. Ove ćelijske linije omogućavaju neprocenjiv izvor referentnih pedigrea, koji su koristeni u mnogo različitih vrsta istraživanja u vezi sa mapiranjem humanog genoma.

LOD score analizeU eksperimentalnim organizmima, veliki broj progenitora iz gentickog

ukrštanja mogu biti ispitivani za mjerenja frekvencije rekombinacije. Očigledno, ovo nije moguće u humanim familijama. Ovaj problem se riješava specijalnim formama matematičkih analiza poznatih kao logaritam izgleda LOD rezultata. (Box LOD score analize) Rezultat LOD score analiza je numerička vrijednost koja mjeri odnos izgleda da su dva lokusa vezana na datoj rekombinaciji frakcije θ, poređena sa šansama da nisu vezani (θ= 0.5). Prag za deklarisanje povezivanja je LOD score od 3 ili više.Box LOD score analize

LOD score je definisan kao logaritam mogućih šansi (Z) posmatranog tako da ako su dva lokusa vezana sa rekombinacijskom frakcijom θ, šanse posmatranog ishoda da su vezani (θ= o.5).

Zx = šanse posmatranog rezulata ako je θ=x / šanse posmatranog rezultata ako je θ=o.5

LOD θ=x= log10 Zx

Kalkulacija je onda ponovljena koristeći različite vrijednosti θ. Kada je LOD score maximum, vrijednost θ se zove MLS. Najjednostavnija aplikacija Lod score analiza poredi dva markera, ali može biti prilagođena za analizu više lokusa. To je poznato kao „multipoint LOD score analysis“.

Statistička značajka

Prioritet posmatranja, šanse da su dva lokusa povezana je 1 od 50. To je poznato kao primarna mogućmost. Šanse da su oni vezani bazirane se na posmatranju i poznate su kao kondicionalne mogućnosti. To je ono što se mjeri LOD score analizama.Šanse da su lokusi vezani su produkti primarnih i kondicionalnih mogućnosti. Ovo je poznato kao posteriorna mogućnost. Konvencionalno, da bi rezultat bio prosuđivan statistički značajne šanse da bi bile istinite, treba biti jednak ili veći od 20:1. Tako je LOD score 3 (i.e. Z=1000:1)

11

Page 13: Mapiranje humanog genoma

potreban za statističku značajku jer:

Posteriorna mogućnost= prioritetna mogućnost x kondicionalna mogućnost

=1:50 x 1000:1 =20:1

Radni primjer

Pogledati treću generaciju pedigrea iz figure 3.4 i razmotriti genotipove djece u generaciji III. Da li su lokusi A i B vezani? Pretpostaviti da je moguće odrediti status oba alela i oba mjesta kako je pokazano na poleđini. Sva djeca moraju imati naslijeđen hromosom sa genotipom aB od roditelja II-2. Ostali hromosomi moraju doći od roditelja II-1 i mogu biti kategorisani kao rekombinantni (R) ili ne-rekombinantni (NR). Ustvari, u ovom primjeru svi se ne-rekombinantni. θ=0 ( lokusi su kompletno vezani)

Za svako dijete postoji 0.5 šanse za posmatrani genotip, jer dijeca naslijeđuju jedan ili dva hromosoma. Za cijelu familiju, šanse za posmatrani rezultat su 0.5 = 0.135Ako je θ= 0.5 (lokusi su vezani) : za svako dijete postoji 0.25 šansi za posmatrani genotip, jer postoje 4 genotipa i svaki je podjednako moguć. Za cijelu familiju šanse posmatranog su 0.25= 0.015625.

Zθ=0= 0.125/0.015625=8LODθ=0=0.9

Ako je θ=0.25 : za svako dijete šanse za posmatrani rezultat su0.5 x 0.75 = 0.375, jer šanse za naslijeđivanje ne-rekombinantnog hromosoma su 0.75 i postoje dva moguća hromosoma koja se mogu naslijediti. Za cijelu familiju šanse su 0.375= 0.053.

Ako je θ=0.5 ; Za svako dijete šanse za posmatrani rezultat su 0.5 x 0.75=o.0375, jer su šanse za naslijeđivanje ne-rekombinantnog

12

Page 14: Mapiranje humanog genoma

hromosoma 0.75 i postoje dva moguća hromosoma za naslijeđivanje. Za cijelu familiju, šanse posmatranog rezultata su 0.375=0.053.Ako je θ= 0.5: za cijelu familiju, šanse za posmatrani rezultat = 0.015625 (kao što je navedeno).

Kalkulacija je onda ponovljena a druge vrijednosti θ (0.1, 0.2, 0.3, itd ).

Iz ove ograničene kalkulacije zaključujemo da je MLS=0.9 kada je θ=0, i.e. aleli su izgleda vezani ali rezultat je manji od značajnog. Sad bi mogli uzeti račun rezultat iz drugih familija.

Šanse viđenja posmatranog rezultata u više od jedne familije je produkt šansi u individualnim familijama. Kako su LOD rezultati logaritamski oni iz različitih familija mogu biti direktno dodani zajedno. Ovaje primjer je idealiziran. Npr. faza i genotip su poznati u praksi, komplikovani matematički modeli su korišteni i moguće je izračunati LOD rezultate za važne situacije, npr. ako faza nije poznata ili je penetrantnost bolesti nekompletna. Problem je što su rezultati niži od očekivanog pa je više podataka potrebno da bi dobili značajne rezultate.

U gornjem primjeru, faza nije poznata (samo dvije generacije porodice u figuri 1.5 su dostupne) i tada MLS=0.62 kada je θ=0

Neobično je da će LOD rezultat 3 biti prikazan u jednoj familiji. Kako god, matematičke postavke testa pokazuju podatke iz broja familija koje su kombinovane. Parametar povezan za LOD rezultate je „maximalna sličnost rezultata“ MLS. Ovo je rezultat za najvjerovatnije seriju alternativa. Nor. MLS rezultat može biti izračunat od najviše rekombinacijskih frakcija (θ) uzmeđu dva markera. Ovo je nađeno promatrajući kalkulacije LOD rezultata, pretostavljajući različite vrijednosti θ svaki put. MLS također može biti izračunat kada su drugi parametri genetičkog modela varijabilni, tj. u stepenu posmatranja. U praksi, LOD rezultati i MLS vrijednosti su dobivene sa komparativnih analiza i posmatranih rezultata. Jedan popularan program za ovu svrhu je LIPED.

1.3.1 Markeri za mapiranje

Prva mapa humanog genoma je napravljena 1970. godine i bila je bazirana na vezivanju između markera kao što su enzimski polimofrizmi, genske bolesti, krvne grupe i drugi fenotipski karakteri koji su monogenski.

Vezivanje između takvih markera je bilo rijetko tako da je rezolucija mape uska i velika područja genoma nisu bila prikazana. Napredak u

13

Page 15: Mapiranje humanog genoma

konstrukciji humane genetičke mape je bio blokiran zbog nedostatka korisnih markera u vezi sa veličinom genoma.

Restrikcijski fragmenti dugih polimorfizama Napredak je došao 1980. sa shvatanjem da se mnoge sekvence u

genomu polimorfne na način da nemaju fenotipske efekte. Takvi markeri su nazvani neutralni molekularni polimorfizmi. Prvi takav marker koji je korišten nazvan je RFLP restrikcijski fragment dugog polimorfizma. Baziran je na prisustvu ili odsustvu meta za restrikcijski enzim, obično kao polimorfizam na jednom baznom paru (Slika 1.6 ).

RFLP dozvoljavaju konstrukciju kompresivne mape prvi put 1985. Ova mapa je imala ogroman uticaj na istraživanja humane genetike i bazirana je na kloniranju mnogih velikih lokusa za monogenske bolesti. RFLP markeri također predstavljaju važan alel za prenatalnu dijagnostiku, omogućavajući da lokus hromosomske bolesti označen da se prati segregacija u funkciji.

MinisatelitiProblem sa RFLP markerima je da po definiciji mogu biti samo dva

alela na lokusu, tj. restrikcijsko mjesto je prisutno ili odsutno. Maximalna proporcija individue u populaciji koja je heterozigotna je samo 50 %. Kako su genetički markeri informativni samo kada su heterozigotni, u mnogo slučajeva RFLP marker neće obezbijediti korisnu informaciju. U praksi, situacija je mnogo teža, jer je obično jedan alel manje prikladan i frekvencija heterozigota je manja od 50 %.

14

Page 16: Mapiranje humanog genoma

Slika 1.6 RFLP marker. Dijelovi DNA molekule od dva hromosoma različita od svakog drugog pojedinačnog baznog para, što rezultira gubitkom EcoRI pozicije jednog od hromosoma. Kada se dogodi digestija EcoRI, hormosom bez extra EcoRI mjestaproducira veći fragment nego drugi hromosom.

PIC (Polimorfni informacioni sadržaj): maximalna vrijednost alelnog markera je 0.375 (jer neke mejoze nisu informativne čak iako oba roditelja su heterozigoti). Minisatelitni i makrosatelitni markeri opisani dalje imaju mnogo veće PIC vrijednosti.

Mnogo korisniji tip markera je onaj koji je prethodno multialelni, tako da postoji mnogo veća šansa da će individue biti heterozigoti. Minisatelitni lokusi, također poznati kao VNTRs odgovaraju ovom kriteriju. Brojevi ponavljanja na lokusima su obično determinisani Southern hibridizacijom. Slika 1.7 ilustra kako segregacija VNTR može biti praćena u porodici.

Slika 1.7 Segregacija VNTR genetičkih markera u porodici. Dužina VNTR markera zavisi od broja ponovaka. To može biti prepoznato Southern blotom kotištenjem sekvenci jedinstvenih za minisatelitne probe. Genotipovi roditelja su prikazani u lijevim i desnim trakama. Javljaju se četiri alela na ovom lokusu koji se nasljeđuju po Mendelijanskom principu, svako dijete dobija po jedan alel od oba roditelja.Mikrosateliti

Minisateliti su uspješno korišteni u konstrukciji genetičkih mapa. Kako god njihova upotreba je ograničena njihovom distribucijom u genomu, kako imaju tendenciju smještaja blizu telomera. Southern blott procedura koja je potrebna je teška i skupa. PCr može biti korišten ali veličine nekih minisatelita otežavaju amplifikaciju.

Korisniji tip markera je mikrosatelit, koji je češći i zastupljeniji od VNTR-a. Mikrosatelit baziran na CA ponavljanjima je postao standard u konstrukciji genetičkih mapa. Dužina mikrosatelita je određena PCR-om, korištenjem prajmera kreiranih od okolnih jedinstvenih DNK sekvenci (Slika 1.8). Ovo ih čini specijalnom formom STS-a, koji omogućava da genetičke mape bazirane na mikrosatelitnim markerima budu usklađene sa različitim vrstama fizičkih mapa.

15

Page 17: Mapiranje humanog genoma

Slika 1.8 Segregacija mikrosatelitnih lokusa u porodici. Mikrosatelitni lokus je umnožen pomoću PCR reakcije sa prajmerima koji se vežu za jedinstvenu sekvencu s obje strane CA ponovaka. Veličina dobijenih fragmenata zavisi od broja CA ponovaka na svakom lokusu. Produkti PCR reakcije se odvajaju gel elektroforezom na poliakrilamidnom gelu, gdje se aleli razdvajaju po veličini. Na slici vidimo 4 različita alela na lokusu koji pokazuju Mendelijansko nasljeđivanje, svako dijete naslijedi po jedan alel od svakog roditelja.

1.3.2 Opsežna genetička mapa ljudskog genoma

Da bi bila korisna, genetička mapa mora biti opsežna i detaljna. Opsežna znači da se prostire duž cijelog genoma bez regiona koji nisu mapirani. Detaljna znači da je razlika između markera mala, tako da je lako uočiti vezu između markera i biološki relevantnih lokusa, kao što su oni koji dovode do poznatih poremećaja. Mikrosatelitni lokusi su korišteni da bi se konstruisala opsežna mapa ljudskog genoma, što predstavlja ispunjenje cilja postavljenog od strane Human Genome Project. Ova mapa, koju je konstruisala Genethon laboratorija u Parizu, se smatra definitivnom genetičkom mapom ljudskog genoma.

Genethon mapa se u potpunosti bazira na mikrosatelitnim markerima. Proces konstruisanja mape je počeo sa identifikacijom i sekvenciranjem 5 264 CA ponavljajućih lokusa. Genotip ovih lokusa je bio pronađen u članovima velikih CEPH porodica. Za mapiranje autosoma bile su ispitane 134 individue iz osam porodica, analizirajući ishod 186 mejoza. Mapiranje X hromosoma zahtjevalo je ispitivanje 20 porodica, 304 individue i 291 mejoza. Kada su dobijeni genotipovi markera, analizirali su ih prvo da bi utvrdili redoslijed markera, a onda i rastojanje između njih. To je postignuto upotrebom specijalnih kompjuterskih programa. Utvrđeno je da je 5 264 analiziranih markera određeno sa 2 335 pozicija. Redoslijed 2 032 od njih je u prednosti od 1000:1 u odnosu na altenativne redoslijede.

16

Page 18: Mapiranje humanog genoma

Jedan od najtežih i vremenski najzahtjevnijih koraka je bilo provjeravanje grešaka.

Dužina mape kod žena je 4 396 cM, a samo 2 769 cM kod muškaraca. Razlika je posljedica povećane stope rekombinacije u mejozi žena u odnosu na mejozu muškaraca. Prosječna dužina po polu je 3 699 cM. Dužina genetičkih mapa za pojedinačne hromosome je obično odraz njihove fizičke veličine. Mapa najdužeg, hromosoma 1, je 292 cM; dužina najmanjeg, hromosoma 21, je 58 cM.

Prosječna udaljenost između markera je 1.6 cM. Važno je razmotriti to kako su jednako markeri raspoređeni. Postoje još uvijek neki dijelovi genoma gdje nema mnogo markera, iako su oni u manjini. Na primjer, u 1% genoma, razlika između markera je preko 10 cM. U tom dijelu genoma se nalaze tri pozicije gdje je interval između susjednih markera 11 cM. Ovo bi moglo biti povezano sa velikom fizičkom udaljenosti između markera, iako bi takođe moglo biti povezano sa povećanom stopom rekombinacije u određenim regionima genoma. U suštini fizička mapa je pokazala da je bar dio udaljenosti povezan sa povećanom rekombinacijom. Nasuprot tome, bilo je mjesta gdje nije uočena međusobna rekombinacija između markera, ali su bili fizički razdvojeni sa nekoliko megabaza DNK.

Takva posmatranja ističu da mjerenjem udaljenosti genetičkih mapa može se pretpostaviti da stopa rekombinacije između dva markera zavisi samo od fizičke udaljenosti između njih. To zahtjeva postojanje konstantne frekvencije rekombinacije duž cijelog genoma. U praksi to nije moguće. Postoje rekombinacijska mjesta „hotspot“, gdje je rekombinacija češća i „coldspot“ gdje je rekombinacija rjeđa.

Formiranje detaljne i razumljive genetičke mape je prekretnica u humanoj genetici. To omogućava jedan bitan izvor informacija koje će biti korisne za brzu identifikaciju lokusa monogenskih bolesti, omogućava mapiranje gena koji imaju ulogu u nastanku poligenskih oboljenja i predstavlja okosnicu za provjeru autentičnosti fizičkih mapa. Setovi markera koji su jednako raspoređeni duž genoma se mogu nabaviti od biotehnoloških kompanija i oni se rutinski koriste za traženje gena od interesa.

Primjer slične genetičke mape konstruisane od strane Cooperative Human Linkage Centre je prikazana na Slici 1.9, koja pokazuje cjelokupan sastav hromosoma 5 na web stranici. Više detalja za bilo koji dio mape je omogućeno odabirom određenog hromosomskog intervala.

17

Page 19: Mapiranje humanog genoma

Slika 1.9 Genetička mapa hromosoma 18. Vertikalni histogram na lijevoj strani pokazuje broj markera u svakom hromosomskom intervalu, prikazanom u centru. Fizička lokacija odabranih markera detektovana FISH metodom je prikazana na citogenetičkoj mapi na desnoj strani. Mapa se može vidjeti na web stranici Cooperative Human Linkage Centre (http://www.chlc.org/HomePage.html).

1.4 Fizičke mape

Fizičke mape daju uvid u stvarnu lokaciju DNK sekvenci u genomu. Postoji određeni broj različitih načina pomoću kojih se ovo može postići.

Klonske mape su sastavljene od biblioteka preklapajućih klonova gdje je definisana veza svakog klona sa ostalim klonovima.

Radijacijske hibridne mape (RH) su bazirane na frekvenciji pomoću koje su markeri pronađeni na istom fragmentu DNK nakon što je genom fragmentiran zračenjem sa X-zracima.

Mape ekspresijskih sekvenci daju uvid u mjesta na genomu koja se nazivaju EST, koji se prevode u iRNK. U osnovi, ovaj tip mape je baziran na fizičkoj lokaciji gena. Treba zapamtiti da ove mape predstavljaju manje od 5% od ukupnog genoma.

STS mape daju uvid u lokaciju fizički mapiranih markera (STS). Široko rasprostranjene restrikcijske mape se baziraju na

poziciji ciljnih mjesta rijetkih restrikcijskih enzima koji se mogu odrediti pomoću gel elektroforeze.

FISH locira hromosomske pozicije kloniranih fragmenata DNK.

Oni se u osnovi preklapaju jer se za konstruisanje klonske mape, RH mape i EST mape koriste STS mape. Štaviše, kao što smo vidjeli posljednja forma genetičkih mapa se bazira na STS polimorfizmu. To znači da

18

Page 20: Mapiranje humanog genoma

možemo povezati sve ove mape, pa je moguće prelaziti sa jednog formata na drugi (Slika 1.10). Originalno, izraz „fizička mapa“ se najčešće koristi da opiše klonske mape, ali češće da opiše mape koje se baziraju na rasporedu STS markera. To ističe važnost STS-a u mapiranju. Oni se koriste za konstrukciju klonskih i RH mapa i mogu biti povezani sa ekspresijskim mapama baziranim na EST-u i genetičkim mapama baziranim na mikrosatelitima.

Slika 1.10 Različite vrste mapa mogu biti povezane pomoću STS sadržaja. Svaki STS je prikazan u obliku kruga; mikrosateliti bazirani na STS-u prikladni za genetičko mapiranje su prikazani plavom bojom. Gornji dio dijagrama pokazuje različite klonove ubačene korištenjem STS sadržaja. Klonovi su podijeljeni u dvije grupe nazvane kontigenti. Razmjera svakog kontigenta je prikazana osjenčenim linijama. Moguće je da se dva kontigenta preklapaju (tačkasta linija), ali da to nije detektovano od strane STS sadržaja. Preklapanje između kontigenata omogućava da STS-ovi budu ucrtani u STS mape (prikazano dve puta, na prvoj i četvrtoj liniji). Genetičke i RH mape su takođe bazirane na STS-u. Pojava krivih intervala u genetičkoj mapi je uzrokovana varijacijama u rekombinacijskoj frekvenciji. Genetičke i Rh mape služe kao okvir za klonske mape. U ovom primjeru, one pozicioniraju dva kontigenta jedan do drugog u nedostatku bilo kakvog fizičkog preklapanja detektovanog između njih.

1.4.1 Klonske mape

Originalni koncept klonskih mapa je bio da odrede vezu između klonova u genskoj biblioteci, determinacijom njihovih preklapanja. Grupa klonova čija je veza definisana na takav način, zove se kontigent (Slika 1.10). Preklapanje između klonova omogućava određivanje fizičke veze između dva nepreklapajuća klona jer se njihova udaljenost može odrediti kroz preklapanje klonova između njih. Savršena klonska mapa humanog genoma bi sadržala 24 kontigenta, jedan za svaki od 22 autosoma i po jedan za polne hromosome. U praksi, ovo je teško, odnosno nemoguće

19

Page 21: Mapiranje humanog genoma

postići jer uvijek postoje praznine gdje dva kontigenta ne mogu biti pridružena. Razlog može biti što se neki dijelovi genoma ne mogu klonirati pa ne postoje klonovi u biblioteci koji pokrivaju taj region, ili zato što preklapanje postoji, ali ne može biti prepoznato metodama koje detektuju preklapanja.

Literatura

Sudbery P. (1998); Human molecular genetics. Longman, England.

20