16
Jiří Vondrášek Ústav organické chemie a biochemie AV ČR Bioinformatika podzimní škola výpočetní chemie, Praha 2006

Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

  • Upload
    devlin

  • View
    64

  • Download
    0

Embed Size (px)

DESCRIPTION

Bioinformatika pod zimní škola výpočetní chemie, Praha 2006. Jiří Vondrášek Ústav organické chemie a biochemie AV ČR. bioinformatika. Informatika nad biologickými molekulami (daty). Bioinformatika extrahuje molekulární informační systém pro molekulární biologii. - PowerPoint PPT Presentation

Citation preview

Page 1: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

Jiří VondrášekÚstav organické chemie a biochemie AV ČR

Bioinformatikapodzimní škola výpočetní chemie, Praha 2006

Page 2: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

Aplikace: teoriebiotechnologiefarmaciemedicínagenetické inženýrství

Informatika nad biologickými molekulami (daty).

Bioinformatika extrahuje molekulární informační systém pro molekulární biologii.

Bioinformatika je konceptualizovaná molekulární biologie (ve smyslu fyzikálně chemickém) na níž je aplikována informatika (odvozená od matematické informatiky a statistiky).

bioinformatika

Page 3: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

experimentálnídata

počítačováanalýza

strukturovanádata

(databáze),hypotézy

sekvence

geny

kontigy

funkce

metabolismus

(vše)

struktura

bioinformatika

Page 4: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

velikosti genomů

Mycoplasma genitalium 0.58 Mbp

Escherichia coli 4.6 Mbp

Saccharomyces cerevisiae16 chr. 11.2 Mbp

Arabidopsis thaliana 5 chr. 115.4 Mbp

Drosophila melanogaster5 chr. ~137.0 Mbp

Homo sapiens 24 chr. ~ 3.3 Gbp

Page 5: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

centrální dogma molekulární genetiky

reverznítranskripce

DNA RNA proteintra

nskrip

ce

transla

cereplikace

informace funkce

Page 6: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

DNA

geny

evoluční vztahy mezi geny aorganizmy

funkce

proteinystruktura

Page 7: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

sekvence

Page 8: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

>jana (4797 nt)GAATTCGCCGCGGGGCTGCGCATCACCGATGCCGCCACCATCGAGATCGTCGAGATGGTACTGGCCGGCTCGATCAACAAGCAGCTCGTCGGCTACATCAACGAAGCGGGCGGCAAGGCCGTCGGCCTGTGCGGCAAGGACGGCAACATGGTGTCCGCCACCAAGGCGACGCGCACCATGGTCGATCCGGATTCGCGGATCGAAGAGGTGATCGACCTCGGTTTCGTCGGCGAGCCGGAGAAGGTCGACCTCACCCTGCTCAACCAGCTGATCGGCCACGAGTTGATCCCGGTGCTGGCGCCGCTGGCGACCTCCGCGTCGGGCCAGACCTTCAACGTCAATGCCGACACCTTTGCAGGTGCGGTTGCCGGTGCGCTGCGGGCCAAGCGCCTGCTGCTGCTGACCGACGTGCCGGGCGTGCTCGACCAGAACAAGAAGCTGATCCCCGAACTGTCGATCAAGGATGCCCGCAAGCTGATCGCAGACGGCACCATCTCGGGCGGCATGATCCCCAAGGTCGAGACCTGCATCTACGCGCTCGAACAGGGCGTCGAAGGCGTCGTCATCCTCGACGGCAAGGTCCCGCACGCAGTGCTGCTCGAATTGTTCACCAACCAGGGCACCGGCACGCTGATCCACAAGTGATGCGAGGCTGCGGCGACAACATCCGTCATGGCCGGGCTCGTCCCGGCCATCCACGTCTTTCCGGCGGTTTTCTCAGCAAGACGTGGATGCCCGGCACAAGGCCGGGCATGACGGGGTGGAGATCGCGCGCCCTCGCCGCCATTGTCACCACCCTCGCCCTCACCTCCGCCGCCCACGCCGACCTCAAGCTCTGCAACCGCATGAGCTACGTGGTCGAGACGGCGATCGGGGTCGATTCCAACGGCACCACCGCCTCGCGCGGATGGCTGCGGATTGATCCGGCGCAATGCCGGGTCGTGGTGCAAGGCGCGCTCAACGCCGACCGCATCATGCTGAATGCCCGCGCGCTGGCGGTGTACGGCGTCTCGCCGCTGCCGCAGAACGGCACTGACCGGCTGTGCATTGCCGAAGACAATTTCGTCATCGCCGCCGCGCGGCAATGCCGCGGCGGCCAAACGCTCGCCGCCTTCACCGAGATCAAGCCCACCGACACCGAGGACGGCAACAAGATCGCTTATCTGGCGGAAGACTCCGGCTACGACGACGAACAGGCCAAACTCGCCGCGATCCAGCGGCTGCTGGTGATCGCCGGTTACGACGCCTCGCCGATCGACGGCGTCGACGGCCCGAAGACGCAGGCCGCGCTGTCCGCCTTCCTCAAGAGCCGAGGCCTGAAGCCCGAGATCGTCGATGCGCCGGATTTCTTCGACGTGATGATCAAGGCAGTGCAGCAGCCGTCCGGCAGCGGGCTGACCTGGTGCAACGACACCAAGTACAAGATCATGGCGGCCGTCGGCGAAGACGACGGCAAGACTGTCACCAGCCGCGGCTGGTACGGTGTTGCGCCCGGCCAATGCCTGCGCCCCGACCTCGGCGCACAGCCGAAGCGGGTGTTCAGCTTCGCCGAAGCGGTCGACGGCAGCGGCAGGCCGGTGACCATCAAGGGCCGTGCGCTGAACTGGGGCGGCGGCGTGACGCTGTGCACGCGTGACAGCAAGTTCGAGATCGGCGAGCAAGGCGATTGCGCGGCGCGCGGCCTCGCCGCCACCGGCTTCGCCGCCGTCGATCTCAGTAGCGGCAAGACATTGAGGTTGTCCGCCCCATGATGCAGCTCGGCAAACGCGGCTTCGATCACGTCGAGACCTGGGTGTTCGATCTCGACAACACGCTGTACCCGCATCACCTCAACCTATGGCAGCAGGTCGATGCGCGGATCCGCGACTTCGTCGCCGACTGGCTGAAGGTTTCGCCGGAAGAAGCCTTCCGTATCCAGAAGGATTACTACAAGCGCTACGGCACCACGATGCGCGGGATGATGACCGAGCACGGCGTTCACGCCGACGACTACCTGGCTTATGTCCACGCCATCGACCATTCGCCGCTGCAGCCGAATCCGGCGATGGGCGATGCGATCGAGCGACTGCCGGGCCGCAAGCTGATCCTGACCAACGGCTCGACCGCCCATGCGGGCAAGGTGCTGGAGCGGCTCGGCATCGGCCATCATTTCGAGGCGGTGTTCGACATCATTGCGGCCGACCTCGAGCCGAAGCCGGCGCCGCAGACCTACCGCCGTTTTCTCGATCGCCATGGTGTCGACCCGGCCCGCGCCGCGATGTTCGAAGACCTCGCCCGCAACCTCACCGTGCCGCACCAGCTCGGCATGACCACCGTGCTGGTGGTGCCTGACGATAGCCAGGACGTGGTCCGCGAAGATTGGGAGCTTGAAGGCCGCGACGCCGCCCACGTCGATCACGTGACTGATGATTTGACAGGGTTCTTGGGGAAGCTGAGTTCGCTGTAGGCCGGGGACGCCTCCCAAGCGTCAATCGTCATCGCCGCCGGATGCAAGGCGGCTAGGTATTGCGGAGCGCTCGCGATCTTCCGTCCAATGCCCTGGGATACTGGATCGCCCGGACGAGCCGGGCGACGACGTTGAAGAGAGATGACGTGGCGTCACCACATCCCCCGCCGTCATCGCCCGCGCAGGCGGGCGATGACTTGGCGGACGGGGCGGCGCCTTGACTCCGACCCGGCGAATCCGGACAACACTCCGCAAAACTCTCCCTGAAATCAGCCTCCCAAGGACCCGTCGATGCCGCTCACCGCCCTGGAATCTACCATCAACGCCGCTTTCGACGCGCGCGACACCGTTACCGCGGCGACGCAGGGCGAGATTCGTCAGGCCGTCGAGGATGCGCTCGATCTGCTCGACCAGGGCAAGGTGCGGGTGGCGCGGCGCGACGACTCCGGCGCCTGGACGGTCAATCAGTGGCTGAAGAAAGCAGTGCTGCTGTCGTTCCGGCTCAACGACATGGGCGTGATCGCCGGCGGCCCGGGCGGCGCCAACTGGTGGGACAAGGTGCCGTCGAAGTTCGAGGGCTGGGGTGAGAACCGCTTCCGCGAGGCCGGCTTCCGCGCCGTGCCGGGCCGATCGTCGCGCGTCGGCCTTTATCGCCAAGACGCGGTACTGATCCGTCCTTCGTCAATCTCGGCGCTTACGTCGATGAAAGCACCATGGTCGAACACCTGGGCGACCGTCGGCTCCTGCGCCCAGATCGGCAAGCGCGTGCACATCTCCGGCGGTGCCGGCATCGGCGGCGTGCTCGAGCCGCTGCAGGCCGGCCCGGTGATCATCGAGGACGACTGCTTCATCGGCGCCCGCTCCGAAGTCGCCGAAGGCGTGATCGTGCGCAAGGGTGCGGTGCTGGCGATGGGCGTTTTCCTCGGCGCCTCGACCAAGATCGTCGACCGCGAGACCGGCGAAATCTTCGTCGGCGAAGTGCCGGAATATGCCGTGCTGGTGCCCGGCACCCTGCCCGGCAAGCCGATGAAGAACGGCGCCCCCGGCCCAGCCACCGCCTGCGCGGTGATCGTCAAGCGCGTCGACGAGCGCACCCGTTCCAAGACCTCGATCAACGAATTGCTGCGGGACTGACACCTGTAGGAGGCGCGAATGGACTGGACCACGCTGTTCTTCAGCTTTCGAGGTCGGATCAATCGCGCCAAATACTGGCTGGTCGGACTGATCTACGTCGCCGCCTGGATGG ….

sekvence

Page 9: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

Co lze v DNA najít?

strukturní a organizační elementyevoluční vztahygenypromotory a další řídící elementy„cizí“ DNA

všeobecná analýza

Page 10: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

geny

Jak najít geny?

Page 11: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

LeucinRhodobacter capsulatus

antikodón počet % CUA 3 <1 CUC 119 16 CUG 458 60 CUU 157 20 UUA 0 0 UUG 27 3

Escherichia coli

% 4 9 52 10 11 13

geny

Page 12: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

geny

Page 13: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

alignment

Jaké proteiny geny kódují?

Page 14: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

PSI-BLASTHMMER

SSEARCHBLITZ

FASTABLAST

Dot plot1:1

n:n

nClustalWMultAlign

1:n

Dot plot

SSEARCH ftp://ftp.virginia.edu/pub/fastaBLITZ ... http://www.ebi.ac.uk

alignment

Page 15: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

PSI-BLASTHMMER

SSEARCHBLITZ

FASTABLAST

Dot plot1:1

n:n

nClustalWMultAlign

1:nFASTA http://www.ebi.ac.ukBLAST http://ncbi.nlm.nih.gov/blast

alignment

Page 16: Bioinformatika pod zimní škola výpočetní chemie, Praha 2006

PSI-BLASTHMMER

SSEARCHBLITZ

FASTABLAST

Dot plot1:1

n:n

nClustalWMultAlign

1:n

PSI-BLAST http://ncbi.nlm.nih.govHMMER

ClustalWMultAlign

alignment