34
Organizácia ľudského genómu Ľudský genóm je súhrn genetickej informácie, Ľudský genóm je súhrn genetickej informácie, obsiahnutý v bunke. Má 2 zložky: obsiahnutý v bunke. Má 2 zložky: I. I. Jadrový genóm Jadrový genóm II. II. Mitochondriálny genóm Mitochondriálny genóm

Organizácia ľudského genómu

  • Upload
    hija

  • View
    71

  • Download
    0

Embed Size (px)

DESCRIPTION

Organizácia ľudského genómu. Ľudský genóm je súhrn genetickej informácie, obsiahnutý v bunke. Má 2 zložky: Jadrový genóm Mitochondriálny genóm. I. Jadrový genóm. celková dĺžka: 3200 Mb distribúcia: 24 rôznych lineárnych molekúl (22 typov autozómov a chromozómy X a Y) - PowerPoint PPT Presentation

Citation preview

Organizácia ľudského genómu

Ľudský genóm je súhrn genetickej informácie, Ľudský genóm je súhrn genetickej informácie, obsiahnutý v bunke. Má 2 zložky:obsiahnutý v bunke. Má 2 zložky:

I.I. Jadrový genómJadrový genóm

II.II. Mitochondriálny genómMitochondriálny genóm

I. Jadrový genómcelková dĺžka: celková dĺžka: 3200 Mb3200 Mbdistribúcia: distribúcia: 24 rôznych lineárnych molekúl 24 rôznych lineárnych molekúl (22 typov autozómov a chromozómy X a Y)(22 typov autozómov a chromozómy X a Y)3000 Mb 3000 Mb euchromatínueuchromatínu a 200 Mb a 200 Mb konštitutívneho heterochromatínukonštitutívneho heterochromatínu ((heterochromatín – permanentne kondenzované heterochromatín – permanentne kondenzované a transkripčne inaktívne oblasti)a transkripčne inaktívne oblasti)veľká veľká variabilitavariabilita v distribúcii obsahu DNA v v distribúcii obsahu DNA v jednotlivých chromozómochjednotlivých chromozómochtypy sekvenciítypy sekvencií1.1. Jednotkové sekvencie (Jednotkové sekvencie (~~55%)55%)2.2. Repetitívne sekvencie (Repetitívne sekvencie (~~45%)45%)

Obsah DNA v jednotlivých chromozómoch

Gény a súvisiace sekvencie

počet: počet: 25 – 30 tisíc25 – 30 tisíc– 90 – 95 % kódujúcich polypeptid90 – 95 % kódujúcich polypeptid– 5 – 10 % kódujúcich netranslatované RNA molekuly5 – 10 % kódujúcich netranslatované RNA molekuly– bezstavovce 14 – 20 tisíc, stavovce 25 – 30 tisícbezstavovce 14 – 20 tisíc, stavovce 25 – 30 tisíc

kódujúca časť predstavuje kódujúca časť predstavuje 1,5 % ľudského genómu1,5 % ľudského genómu

distribúcia génov: distribúcia génov: nerovnomerná nerovnomerná – heterochromatín neobsahuje gényheterochromatín neobsahuje gény– rozdiely aj vrámci euchromatickej časti genómu a rozdiely aj vrámci euchromatickej časti genómu a

medzi jednotlivými chromozómamimedzi jednotlivými chromozómami• vysoká hustota v subtelomerických obl.vysoká hustota v subtelomerických obl.• chr. 19 a 22 bohaté na gény chr. 19 a 22 bohaté na gény • chr. 18, X a Y chudobné na génychr. 18, X a Y chudobné na gény

Variabilná hustota génov: HLA oblasť a DMD

1Mb - ~ 70 génov

2,4Mb – 1 gén (dystrofín)

Charakteristika génov kódujúcich polypeptid

výrazná variabilita vo veľkosti: výrazná variabilita vo veľkosti: priemer 27 kbpriemer 27 kb– inzulín inzulín 1,4 kb1,4 kb vs. dystrofín vs. dystrofín 2,4 Mb2,4 Mb

výrazná variabilita v počte exónov: výrazná variabilita v počte exónov: priemer 9priemer 9– 0 0 (interferón) vs. (interferón) vs. 363363 (titín) (titín)

dĺžka exónov: dĺžka exónov: priemer 170 bppriemer 170 bp– 7,6 kb 7,6 kb exón 26 génu exón 26 génu ApoBApoB

dĺžka intrónov: dĺžka intrónov: enormná variabilta enormná variabilta (dlhé gény majú dlhé (dlhé gény majú dlhé intróny)intróny)– 0,5 kb0,5 kb ( (ββ-globín) vs. -globín) vs. 800 kb 800 kb (gén (gén WWOX)WWOX)

dĺžka polypetidu: dĺžka polypetidu: priemer 500 – 550 a. k.priemer 500 – 550 a. k.– najdĺhší: najdĺhší: 38 138 38 138 (titín)(titín)

gény v génoch (3 gény v intr. 26 génu pre NF1)gény v génoch (3 gény v intr. 26 génu pre NF1)prekývajúce sa gényprekývajúce sa gény

Dĺžka ľudských génov

krátke E1 I 1 E2 I 2 E3

1 – 10 kb

stredne dlhé

10 – 100 kb

dlhé

> 100 kb

Variabilita v dĺžke génov a v obsahu exónov

pod 10 kb 10-100 kb

nad 100 kb

Gény v rámci génu: gén pre NF typu 1 a 3 „vnútorné“ gény v intróne 26

Charakteristika génov kódujúcich polypeptid – pokr.

unikátne gény (single copy)unikátne gény (single copy)génové rodinygénové rodiny– vznikli duplikáciou unikátnych génovvznikli duplikáciou unikátnych génov– často majú rovnakú alebo podobnú funkciučasto majú rovnakú alebo podobnú funkciu– môžu vytvárať zhluky al. roztrúsené po celom môžu vytvárať zhluky al. roztrúsené po celom

genómegenóme– veľká časť genómu je tvorená génovými rodinamiveľká časť genómu je tvorená génovými rodinamiTypy génových rodín:Typy génových rodín:1.1. klasické génové rodinyklasické génové rodiny

– vykazujú vysokú sekvenčnú homológiuvykazujú vysokú sekvenčnú homológiu– evolučná aj funkčná príbuznosťevolučná aj funkčná príbuznosť

Charakteristika génov kódujúcich polypeptid – pkr.

2.2. génové rodiny s dlhými konzerovanými génové rodiny s dlhými konzerovanými doménamidoménami– gény s dôležitou funkciou vo vývine (gény s dôležitou funkciou vo vývine (PAX-, PAX-,

homeobox-homeobox-gény)gény)3.3. génové rodiny s krátkymi konzerovanými génové rodiny s krátkymi konzerovanými

motívami aminokyselínmotívami aminokyselín– nemusia byť homologické na úrovni DNA, ale nemusia byť homologické na úrovni DNA, ale

majú spoločnú všeobecnú funkciu – RNA majú spoločnú všeobecnú funkciu – RNA helikázy, DEAD box a pod.helikázy, DEAD box a pod.

4.4. génové super rodinygénové super rodiny– malá sekvenčná homológiamalá sekvenčná homológia– spoločné štrukturálne charakteristiky – HLA gényspoločné štrukturálne charakteristiky – HLA gény

Príklady tandemových génových rodín

α-globín: 16p13.3

β-globín: 11p15.5

rastový hormón: 17q23

albumín: 4q12

Histónová génová rodina

Ľudské RNA gény

~3000 RNA génov = 10% genómu

Hlavné triedy RNA – rRNA

• 18S, 5S a 5,8Sr RNA: súčasť cytopl. ribozómov– tRNA: 22 typov mt tRNA; 49 typov cytoplazm. tRNA (497

génov; väčšina z nich na chromozómoch 1 a 6 v génových rodinách)

– snRNA: U1, U2, U4 a i.: súčasti spliceosomov• 16SrRNA, 23SrRNA: súčasť mt ribozómov

– snoRNA: asi 100 rôznych typov; účasť na rRNA processingu

• Iné RNA triedy

• Telomerázové RNA: súčasť telomerázy,

• Antisense RNA: mnoho typov, asociované s imprintingom

• MicroRNA: krátke (22nt), regulácia translácie, ~200 génov

Pseudogény v ľudskom genóme

• nefunkčné kópie génov (neexprimujú sa): „mŕtve konce“ evolúcie génov – ale aj zdroj evolučných inovácií

• celkový počet cca 20 000

Typy:

• bežné (konvenčné, neupravené) Ψgény:

•väčšinou v tandeme s génom

•obsahujú exóny aj intróny

•vznik: nehomologický c-o

• upravené Ψgény: disperzne v genóme

•obsahujú len sekvencie exónov

•vznik: reverzná transkripcia

Pseudogény v ľudskom genóme – pokr.

•exprimované neupravené

•prechodné štádium, gén už nie je funkčný ale exprimuje sa, napr. θ-globin

•exprimované upravené

•pseudogén sa včlení do blízkosti promótora

•pseudogén vzniknutý z génu s vnútorným promótorom

•skrátené gény, génové fragmenty

•pravdepodobný vznik nehomologický crossing-over al. nehomologická výmena sesterských chromatíd

Vznik upraveného pseudogénu reverznou transkripciou z mRNA transkriptu

Repetitívne sekvencie

tvoria 45 % ľudského jadrového genómutvoria 45 % ľudského jadrového genómuTriedy:Triedy:

nízko repetitívne: nízko repetitívne: do 100 repetíciído 100 repetíciístredne repetitívne: stredne repetitívne: 100 – 10 000100 – 10 000 vysoko repetitívne: vysoko repetitívne: nad 10 000nad 10 000

Typy:Typy:tandemovo usporiadanétandemovo usporiadanérozptýlenérozptýlené

databáza: www.girinst.org

Repetitívne sekvencie – pokr.

Tandemové repetitívne sekvencieTandemové repetitívne sekvencie1.1. satelitná DNAsatelitná DNA2.2. minisatelitná DNAminisatelitná DNA3.3. mikrosatelitná DNA mikrosatelitná DNA

Satelitná DNASatelitná DNA (nie je totožná so satelitmi chromozómov)(nie je totožná so satelitmi chromozómov)skladá sa z dlhých blokov tandemových opakovaní (100 kb až skladá sa z dlhých blokov tandemových opakovaní (100 kb až niekoľko Mb)niekoľko Mb)tvorí väčšiu časť heterochromatínu v oblasti centromértvorí väčšiu časť heterochromatínu v oblasti centromérhlavné triedyhlavné triedy

αα-satelitná (alfoidná) DNA-satelitná (alfoidná) DNAdĺžka opakovania: dĺžka opakovania: 171 bp171 bpcentromerická oblasť všetkých chromozómovcentromerická oblasť všetkých chromozómovtvorí 3 – 5 % DNA obsahu chromozómutvorí 3 – 5 % DNA obsahu chromozómumá významnú úlohu vo funkcii centromérymá významnú úlohu vo funkcii centroméry

Repetitívne sekvencie – pokr.

ββ-satelitná DNA-satelitná DNA

dĺžka opakovania: dĺžka opakovania: 68 bp68 bp

centromerická oblasť chromozómov 1, 9, 13, 14, 15, 21, 22 centromerická oblasť chromozómov 1, 9, 13, 14, 15, 21, 22 a Ya Y

satelitná DNA 1satelitná DNA 1

dĺžka opakovania: dĺžka opakovania: 25 – 48 bp25 – 48 bp

bohatá na ATbohatá na AT

centromerická oblasť chromozómov a iných heterochrom. centromerická oblasť chromozómov a iných heterochrom. oblastíoblastí

satelitná DNA 2 a 3satelitná DNA 2 a 3

dĺžka opakovania: dĺžka opakovania: 5 bp5 bp

výskyt pravdepodobne na všetkých chromozómochvýskyt pravdepodobne na všetkých chromozómoch

Repetitívne sekvencie – pokr.

Minisatelitná DNAMinisatelitná DNAstredne dlhé (0,1 – 20 kb) dlhé bloky tandemových opakovanístredne dlhé (0,1 – 20 kb) dlhé bloky tandemových opakovaníroztrúsené po veľkej časti nukleárneho genómuroztrúsené po veľkej časti nukleárneho genómuznáme 2 triedy:známe 2 triedy:1.1. hypervariabilná minisatelitná DNA (VNTR)hypervariabilná minisatelitná DNA (VNTR)

dĺžka opakovania:dĺžka opakovania: 9 – 24 bp 9 – 24 bpmôžu mať spoločnú základnú („core“) sekvenciumôžu mať spoločnú základnú („core“) sekvenciulokalizácia predovšetkým v blízkosti telomérlokalizácia predovšetkým v blízkosti telomér

2.2. telomerická minisatelitná DNAtelomerická minisatelitná DNA3 – 20 kb 3 – 20 kb tandemových opakovaní tandemových opakovaní dĺžka opakovania 6 bp (TTAGGG)dĺžka opakovania 6 bp (TTAGGG)lokalizácia v teloméroch všetkých chromozómovlokalizácia v teloméroch všetkých chromozómovpriama zodpovednosť za telomerickú funkciupriama zodpovednosť za telomerickú funkciu

Repetitívne sekvencie – pokr.

Mikrosatelitná DNA Mikrosatelitná DNA ((SShort hort TTandem andem RRepeats – epeats – STRSTR))

alebo aj (alebo aj (SSimple imple SSequence equence RRepeats – epeats – SSRSSR))krátke (do 0,1 kb) bloky tandemových opakovaníkrátke (do 0,1 kb) bloky tandemových opakovaní

roztrúsené po celom genóme (tvoria asi 2 % genómu)roztrúsené po celom genóme (tvoria asi 2 % genómu)

dĺžka opakovania: dĺžka opakovania: menej ako 10 bpmenej ako 10 bp

najčastejšie sú dinukleotidové opkovania CA/TG (CG/GC najčastejšie sú dinukleotidové opkovania CA/TG (CG/GC sú zriedkavé)sú zriedkavé)

tri- a tetranukleotidové sú zriedkavejšie ale zato tri- a tetranukleotidové sú zriedkavejšie ale zato veľmi veľmi polymorfnépolymorfné (mapovanie génov, kriminalistika, nepriama (mapovanie génov, kriminalistika, nepriama dg. a pod.)dg. a pod.)

vznik: prekĺznutie vlákien pri replikáciivznik: prekĺznutie vlákien pri replikácii

význam: zatiaľ neznámyvýznam: zatiaľ neznámy

Repetitívne sekvencie – pokr.

Roztrúsené opakovania Roztrúsené opakovania – tvoria cca 43 % ľ. g.– tvoria cca 43 % ľ. g.• takmer všetky r. o. sú odvodené od takmer všetky r. o. sú odvodené od transpozónovtranspozónov

Podľa dĺžky opakovania sa deliaPodľa dĺžky opakovania sa delia1.1. SINE – SSINE – Short hort IInterspersed nterspersed NNuclear uclear EElements (100 – 400 bp)lements (100 – 400 bp)

• AluAlu rodina rodina• dĺžka opakovania: dĺžka opakovania: 280 bp280 bp• je špecifická pre primátov (identifikácia úsekov DNA je špecifická pre primátov (identifikácia úsekov DNA

ľudského pôvodu)ľudského pôvodu)• počet kópií 1,2 mil. (1 kópia na 3 kb) počet kópií 1,2 mil. (1 kópia na 3 kb) • 10,7 % ľudského genómu10,7 % ľudského genómu

• ešte známe ešte známe MIRMIR (450 000 kópií) a (450 000 kópií) a MIR3MIR3 (85 000 kópií) (85 000 kópií)

Repetitívne sekvencie – pokr.

2.2. LINE – LLINE – Long ong IInterspersed nterspersed NNuclear uclear EElements (20 % genómu)lements (20 % genómu)• LINE1 (L1)LINE1 (L1) – 6,1 kb (600 000 kópií) – 6,1 kb (600 000 kópií)

• kóduje 2 proteínykóduje 2 proteíny• 60 – 100 L1 je schopných aktívnej transpozície60 – 100 L1 je schopných aktívnej transpozície

(a môžu zapríčiniť dedičné ochorenie, napr. HA)(a môžu zapríčiniť dedičné ochorenie, napr. HA)• tvorí 17 % ľudského genómutvorí 17 % ľudského genómu

• ešte sú známe ešte sú známe LINE2LINE2 (370 000 kópií) a (370 000 kópií) a LINE3 LINE3 (44 000)(44 000)

3.3. LTR transpozóny LTR transpozóny ((LLong ong TTerminal erminal RRepeats) – 8,5 % ľ. g.epeats) – 8,5 % ľ. g.• ERV ERV ((EEndogenous ndogenous RRetrivral etrivral SSequences)equences)

4.4. DNA transpozóny DNA transpozóny - 3 % ľudského genómu - 3 % ľudského genómu• nie sú aktívne u človeka (transpozónové fosílie)nie sú aktívne u človeka (transpozónové fosílie)

Chrom. lokalizácia hlavných tried repetitívnych sekvencií

Štruktúra Alu-sekvencie a úplnej L1 sekvencie

Ľudský mitochondriálny genóm

počet kópií v bunke: 100 – 100 000počet kópií v bunke: 100 – 100 000– term. diferencované kožné bunky – bez mtDNAterm. diferencované kožné bunky – bez mtDNA– oocyty – 100 000 (spermie – niekoľko 100)oocyty – 100 000 (spermie – niekoľko 100)

jedna cirkulára dvojvláknová molekulajedna cirkulára dvojvláknová molekula

dĺžka: dĺžka: 16 569 bp16 569 bp (známa kompletná sekvencia – 1981) (známa kompletná sekvencia – 1981)– ťažký reťazec (H) – bohatý na Gťažký reťazec (H) – bohatý na G– ľahký reťazec (L) – bohatý na Cľahký reťazec (L) – bohatý na C– D slučka – krátka trojvláknová oblať (7S DNA)D slučka – krátka trojvláknová oblať (7S DNA)

segregácia pri bunkovom delení – náhodnásegregácia pri bunkovom delení – náhodná

dedičnosť – matroklinná (matrilineárna)dedičnosť – matroklinná (matrilineárna)

replikácia: separátna na H a L reťazcireplikácia: separátna na H a L reťazci– najprv H reťazec (začiatok v D-slučke)najprv H reťazec (začiatok v D-slučke)– L reťazec – až po replikácii 2/3 H reťazcaL reťazec – až po replikácii 2/3 H reťazca

Ľudský mitochondriálny genóm – pokr.

transkripcia:transkripcia:– promotor pre obidve vlákna v D slučkepromotor pre obidve vlákna v D slučke– prebieha súčasne na obidvoch vláknach v opačnom smere prebieha súčasne na obidvoch vláknach v opačnom smere

ako replikáciaako replikácia– je kontinuálna, t.j. vzniká veľký multigénový transkriptje kontinuálna, t.j. vzniká veľký multigénový transkript

mitochondriálny genetický kód:mitochondriálny genetický kód:– mierne sa líši od nukleárnehomierne sa líši od nukleárneho

• je 60 kodónov (v nukleárnom genóme 61)je 60 kodónov (v nukleárnom genóme 61)• 4 stop kodóny - 2 totožné s nukl. g. UAA, UAG a 2 odlišné 4 stop kodóny - 2 totožné s nukl. g. UAA, UAG a 2 odlišné

AGA a AGG (kódujú arginín v nukl. g.)AGA a AGG (kódujú arginín v nukl. g.)• UGA kóduje triptofan v mt. – v nukl. g. je to stop k.UGA kóduje triptofan v mt. – v nukl. g. je to stop k.

mt gény:mt gény: celkový počet celkový počet 3737– 2828 na H vlákne, na H vlákne, 99 na L vlákne na L vlákne – 1313 kóduje polypeptid, kóduje polypeptid, 2222 tRNA a tRNA a 22 rRNA rRNA

Ľudský mitochondriálny genóm – pokr.

– väčšina mt polypeptidov je kódovaných nukleárnym g.väčšina mt polypeptidov je kódovaných nukleárnym g.– mt genóm je extrémne kompaktný (93 % kódujúce sekv.)mt genóm je extrémne kompaktný (93 % kódujúce sekv.)

• len D slučka neobsahuje kódujúce sekv.len D slučka neobsahuje kódujúce sekv.– gény neobsahujú intrónygény neobsahujú intróny– vyskytujú sa prekrývajúce sa gényvyskytujú sa prekrývajúce sa gény– susediace gény separované väčšinou len 1 – 2 bázamisusediace gény separované väčšinou len 1 – 2 bázami– niektorým génom chýba terminačný kodónniektorým génom chýba terminačný kodón

Ľudská mtDNA

bohatý na G

bohatý na C

ND – NADH dehydrogenáza (7)

ATP – ATPáza (2, čiast. prekryv)

CO – cytochróm c oxidáza (3)

CYB – cytochróm B (1)

Čiastočný prekryv dvoch mt génov: ATPáza 6 a ATPáza 8

Porovnanie jadrového a mt genómu

jadrovýjadrový mitochondriálnymitochondriálny

veľkosť 3200 Mb 16,6 kb

počet rôznych molekúl

23 (XX) /24 (XY) jedna

molekúl v bunke 46 (v diploidnej b.) 100 až 100 000

počet génov ~30 - 35 000 37

hustota génov ~1/100 kb 1/0,45 kb

repetitívna DNA >50% 0%

transkripcia monocistronická polycistronická

intróny vo väčšine génov chýbajú

% kódujúcej DNArekombinácia

dedičnosť

<1,5%min. 1 c-o / chrom. /

meiózamendelistická

~93%chýba

maternálna

Všeobecný prehľad genómu

1

2

3

4

5

Jadrový genóm

repetitívne sekv. – transpoz.

heterochromatín

iné nekonzervované

vysoko konzervované nekód.

kódujúce

45%

6,6%

44%

3%1,5%

kódujúce

vysoko konz

nekonz

mtDNA

93%

5% 2%

Organizácia ľudského genómu

25-30000 génov