Upload
qamar
View
40
Download
0
Embed Size (px)
DESCRIPTION
Genetické metody v zoologii počítačová část II Radka Storchová. DATABÁZE. PROGRAMY. Primární databáze DNA sekvencí GenBank (Amerika) EMBL (Evropa) DDBJ (Japonsko). BLAST Na stránkách NCBI, Ensembl BLAT Na stránkách USCS - PowerPoint PPT Presentation
Citation preview
Genetické metody v zoologii Genetické metody v zoologii
počítačová část II
Radka Storchová
DATABÁZE
Primární databáze DNA sekvencí
GenBank (Amerika) EMBL (Evropa) DDBJ (Japonsko)
Databáze genů
Entrez GeneRefSeq
Databáze genových expresních dat
UniGeneGEO
Databáze genomů
NCBIEnsemblUCSC Genome Browser
Důležité odkazy
PROGRAMY
BLASTNa stránkách NCBI, Ensembl
BLATNa stránkách USCS
Primer3 – navrhování primerůhttp://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www.cgi
In Silico PCR
NCBI - http://www.ncbi.nlm.nih.gov/ tam najdu skoro vše: GenBank, Entrez Gene, UniGene, MapViewer, BLAST…
ENSEMBL - http://www.ensembl.org/Genome Browser, BLAST
USCS – http://genome.ucsc.edu/Genome Browser, BLAT, In Silico PCR
Úloha 1
• Z jakého organismu pochází tato sekvence?
• Jaké je taxonomické zařazení tohoto organismu?
>krasna neznama 1CAAATATCTGGAGGTATGGAAAAGGGCAGGGAAGTCTCAGTGTCTGATGTGTARTGAATGTGTGCAAGAC AGCTATGTGAGAGTTGTGCTTTTATTTACTGATGGCTAGTTGGATTCCAGTGAACTCTCCCTCAAGTCCA AGGTCTGTGTGTACAAGCAGGAGGCACAGAAAGGGCTCATGGTATGCAAATGGTATGTGAATATCCAAGT TTAGATTTCCCATTCCAAACACCACACACAGTCTGACCAAGCCTTGACAGCAATAAACCAGCCCATGCAG CCTATGCATGCCTGGAAAACTGTATTATATAAGGATTGTCAGTGACTGGACACAAGGGACATACAATTTT AGAGTAAGCCCTGTAGGATCCATTGGAGACCAAGACCCATAAAACTAAGTGTTATACAAACACAGGGCAT GWATTTGCAGTCTTAATGGCTGTGAGGCAGACAAAAAATGGGAGGGGCCATGGTTTACTCAAGGTCATAA AGCAGATCAGCATCAGAGCTAGGGATAGAGCCCAGTGTTTCTGCCTAGCCAGGCTCCTTGCATACTAGAC CTCACTGTCTCTCCAAAGGCTGCAGGAAGGGCTACCAAATTAGCTCGGAGATATTTCCAGGCTCTGCAAC CTATTTCTTAGTCTGGCTTTTCTGAAAATAAACCTTGAGTGTCCCTTCAGTTTTTCTTTCTCTCTTTTCC TTCCTCACAGTTCATTTCT
Návod: K identifikaci sekvence použijeme program BLAST. Taxonomické zařazení můžeme zjistit pomocí Entrez Taxonomy.
Výsledek: Vranule bělokrká (Picathartes gymnocephalus)
cellular organisms; Eukaryota; Fungi/Metazoa group; Metazoa; Eumetazoa; Bilateria; Coelomata; Deuterostomia; Chordata; Craniata; Vertebrata; Gnathostomata; Teleostomi; Euteleostomi; Sarcopterygii; Tetrapoda; Amniota; Sauropsida; Sauria; Archosauria; Aves; Neognathae; Passeriformes; Picathartidae; Picathartes
• Existují nějaké známé sekvence této kachny?
• V jaké části genomu leží (autosomy, pohlavní chromosomy, mitochondrie)?
Úloha 2
Návod: Sekvence hledáme v základních databázích nukleotidových sekvencí GenBank/EMBL/DDBJ. Stačí zadat latinský název druhu.
Pokud u sekvence není napsaná lokalizace v genomu, můžeme ji zkusit „blastovat“ na genom kura domácího (v databázi osekvenovaných genomů ENSEMBL). Všichni ptáci, stejně jako savci, mají stejný obsah genů na pohlavním chromosomu Z/X. Naopak geny na autosomech jsou u jednotlivých skupin na různých chromosomech.
Výsledek:Polák kaholka (Aythya marila )
AY082413 Aythya marila beta fibrinogen gene, intron 7 (autosomální gen)AY112947 Aythya marila mitochondrial D-loop, partial sequence (mitochondriální sekvence)
Úloha 3
>krasna neznama 2MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKVAEY TNKGDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKN RIIPPHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNK MQTLTQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPE ESEFAVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPD ISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEI LREMTHSWPTPLTSMHTAGHSEQSTFSIPGQESQHLTPGFTLQKWNDPTTRASTKSVSFK SMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNPVNPPLATPQPPPAVQA SGGSGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDKWLNKVTSQ NKSFICGQNETPMETISLPPPIIQPMEVQMKVKTNASQVPAEPKERPLLSLIREKARPRP TQKIPETKALKHKLSTTSETVSQRTIGKKQPKKVEKNTSTDEFTWPKPNITSSTPKEKES VELHDPPRGRNKATAHKPAPRKEPRPNIPLAPEKKKYRGPGKIVPKSREFIETDSSTSDS NTDQEETLQIKVLPPCIISGGNTAKSKEICGASLTLSTLMSSSGSNNNLSISNEEPTFSP IPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPGHSSLHAAPAKPDHKETATKPKRQTA VTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEATTICLLPPCISPAPPHKPPNTRENNS SRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNGPFGQDKNIAMTGQITSTKPKRTEGK FCATFKGISVNEGDTPKKASSATITVTNTAIATATVTATAIVTTTVTATATATATTTTTT TTISTITSTITTGLMDSSHLEMTSWAALPLLSSSSTNVRRPKLTFDDSVHNADYYMQEAK KLKHKADALFEKFGKAVNYADAALSFTECGNAMERDPLEAKSPYTMYSETVELLRYAMRL KNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKKDHAMKYSRSLMEYFKQNASKVAQIP SPWVSNGKNTPSPVSLNNVSPINAMGNCNNGPVTIPQRIHHMAASHVNITSNVLRGYEHW DMADKLTRENKEFFGDLDTLMGPLTQHSSMTNLVRYVRQGLCWLRIDAHLL
• Jaký gen kóduje tento protein?• Z jakého organismu pochází?• Zjistěte sekvenci mRNA (kolik má exonů a intronů) a genomovou sekvenci.• Zjistěte pozici genu v genomu.• V jakých tkáních je tento gen exprimovaný?• Jaké jsou jeho funkce, projevy?
Návod: Pomocí BLAST identifikujeme sekvenci a její původ.
Informace o sekvenci a funkci mRNA a příslušné genomové sekvence naleznete např. v databázi Entrez Gene. Další info v databázi ENSEMBL.
Informace o expresi genu v databázi UniGene.
Informace o funkci a projevech genu v databázi PubMed či OMIM.
Výsledky:Jedná se o gen AFF2 známý také jako FMR2. Způsobuje syndrom fragilního chromosomu X, jedné z nejčastějších příčin mentální retardace u lidí.
Úloha 4
Zjistili jsme, že úsek na chromosomu X, mezi markery DXMit76 a DXMit110, způsobuje neplodnost hybridních samců u dvou poddruhů myši domácí.
Zjistěte jaké geny v této oblasti leží a odhadněte, který z těchto genů by mohl sterilitu způsobovat.
Mus musculus musculus M. m. domesticus
F1 hybrid: STERILNÍ
Návod:Seznam genů lze vyexportovat v databázi NCBI (přes Map Viewer), Ensembl (přes BioMart) či USCS. Porovnejte výsledky.
>seq01CCACCAACAGACAGAGCAAA>seq02ACTTTTTAACTGAGTCACCACAAGC>seq03GAATTACAGGCATGCGTCCT>seq04AGACAGACGTGATCCTGCCT>seq05GAACCGCAAGTCATGAATCA>seq06TGGAGGTCAGGAATCAAACA>seq07AAAAGGATTGCAGGGACTACTG>seq08GGTGCCTACCATGCACAATT>seq09TTTCCATTTCCTCTTTTATTGTCC>seq10CTACAAGGGAAAACCTCAGGG
Úloha 5
Dostali jste 10 myších sekvencí. Zjistěte, jejich polohu v genomu. Jaký program k tomu použijete?
Návod: Lze použít BLAST, ale protože hledáme úplně stejné sekvence můžeme použít i BLAT. Srovnej výstupy z obou programů.
Úloha 6
Chcete osekvenovat gen STYX, který leží na chromosomu X v oblasti, která je odpovědná za sterilitu samců (viz úloha 4), abyste zjistili, jestli neobsahuje mutaci způsobující sterilitu . Tento gen má ale v genomu několik kopií. Zjistěte, kde leží a čím se liší. Navrhněte primery specifické pro gen na chromosomu X.Návod: K nalezení kopií genu Styx použijte program BLAT nebo BLAST. Porovnejte alignmenty jednotlivých kopií. Navrhněte primery v programu Primer3 a pomocí In Silico PCR zjistěte, jestli amplifikují pouze kopii na chromosomu X.
Výsledek: 3 kopie. Na chr 14 zdrojový gen s devíti exony. Na chr 7 a X jsou retrogeny bez intronů.
Zjistěte, kdy došlo k retropozici genu STYX na chr 7 a chr X. Která retropozice je starší? Vyskytují se i u potkana?
Výsledek: Retrogen na chr 7 starší, přítomen i u potkana. Retrogen na chr X mladší, není přítomen u potkana.
chr 7 chr X
chr14