38
Bioinformatika hledání významu biologických dat Marian Novotný Friday, April 24, 15

Bioinformatika - natur.cuni.cz

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Bioinformatika - natur.cuni.cz

Bioinformatika

hledání významu biologických dat

Marian NovotnýFriday, April 24, 15

Page 2: Bioinformatika - natur.cuni.cz

2

– sběr biologických dat

– archivace biologických dat

– organizace biologických dat

– interpretace biologických dat

Bioinformatika

Friday, April 24, 15

Page 3: Bioinformatika - natur.cuni.cz

3

Biologové sbírají data

– Carl Linné (1707-1778) - sbíral, archivoval a organizoval data

– středověké botanické zahrady - již v 16. a 17. století - dovoz, produkce a výměna rostlin

Friday, April 24, 15

Page 4: Bioinformatika - natur.cuni.cz

4

Jaká biologická data se sbírají?

– organismy– měření, vážení– sekvence– 3D struktury– interakce– příbuzenské

vztahy– genomické

mapování– expresní profily– ....

Friday, April 24, 15

Page 5: Bioinformatika - natur.cuni.cz

5

Data mění biologii

Friday, April 24, 15

Page 6: Bioinformatika - natur.cuni.cz

6

Kde se data berou?

Friday, April 24, 15

Page 7: Bioinformatika - natur.cuni.cz

7

Lidský genom

– kompletní sekvence lidské DNA

– 3.2 Gb dat

– ~20 000 genů

–1 SNP na 1300 nukleotidů -> 3 000 000 nukleotidů rozdíl mezi dvěma jedinci

Friday, April 24, 15

Page 8: Bioinformatika - natur.cuni.cz

7

Lidský genom

– kompletní sekvence lidské DNA

– 3.2 Gb dat

– ~20 000 genů

–1 SNP na 1300 nukleotidů -> 3 000 000 nukleotidů rozdíl mezi dvěma jedinci

Friday, April 24, 15

Page 9: Bioinformatika - natur.cuni.cz

8

Rychlost sekvenování

Friday, April 24, 15

Page 10: Bioinformatika - natur.cuni.cz

9

Cena sekvenování lidského genomu

2001 2007 2015

Friday, April 24, 15

Page 11: Bioinformatika - natur.cuni.cz

10

osekvenované lidské genomy v roce 2014 228k x 3x109 bazí= 7x1014 bazí

genom všech občanů ČR 10m x 3x109 = 3x1016 bazí

100 000 genomes - UKcelá populace - Faorské ostrovy

velké skupiny obyvatel - Finsko, Island, Německo, Španělsko

Sekvenování a data

Friday, April 24, 15

Page 12: Bioinformatika - natur.cuni.cz

11

1pb dat = 1000 000 000 000 000

Friday, April 24, 15

Page 13: Bioinformatika - natur.cuni.cz

12

– 1PB hudby v mp3 formátu by hrál 2000 let

– velikost paměti lidského mozku je asi 2.5 PB dat

– Google zpracoval v roce 2009 okolo 24 PB dat denně

– EBI má nyní kapacitu 60 PB dat

– CERN do roku 2012 nashromáždil 200 PB dat

Friday, April 24, 15

Page 14: Bioinformatika - natur.cuni.cz

13

DNA databáze ENA

Friday, April 24, 15

Page 15: Bioinformatika - natur.cuni.cz

14

1973-19992000-20072008-20112012-20142015

108 124 struktur

Databáze 3D struktur

Friday, April 24, 15

Page 16: Bioinformatika - natur.cuni.cz

14

11%

32%

29%

27%

1%1973-19992000-20072008-20112012-20142015

108 124 struktur

Databáze 3D struktur

Friday, April 24, 15

Page 17: Bioinformatika - natur.cuni.cz

15

Data nedávají odpovědi

Jak využít dostupná data k našemu prospěchu?

Friday, April 24, 15

Page 18: Bioinformatika - natur.cuni.cz

16

– bioinformatika v medicíně

– bioinformatika v zemědělství

– bioinformatika v průmyslu

Friday, April 24, 15

Page 19: Bioinformatika - natur.cuni.cz

17

Bioinformatika v medicíně

Friday, April 24, 15

Page 20: Bioinformatika - natur.cuni.cz

18

Friday, April 24, 15

Page 21: Bioinformatika - natur.cuni.cz

19

Friday, April 24, 15

Page 22: Bioinformatika - natur.cuni.cz

20

Ras onkogen

–jeden z ortologů malé GTPázy Ras

–molekulární přepínač

–mutován v 20 % lidských nádorů

–mutován až v 90 % případů u specifických typů nádorů

Friday, April 24, 15

Page 23: Bioinformatika - natur.cuni.cz

21

Až 25% případů nádorů plic má mutaci G12C v K-Ras

–obtížně zasažitelný léky

–hladký povrch

–zastupitelnost ortologů

–mutace glycinu činí protein konstitutivně aktivní

–vývoj inhibitoru mutace G12C -> personalisovaná medicína

Friday, April 24, 15

Page 24: Bioinformatika - natur.cuni.cz

22

Identifikace pathogena z buněčné odpovědi

Friday, April 24, 15

Page 25: Bioinformatika - natur.cuni.cz

22

Identifikace pathogena z buněčné odpovědi

Friday, April 24, 15

Page 26: Bioinformatika - natur.cuni.cz

22

Identifikace pathogena z buněčné odpovědi

Friday, April 24, 15

Page 27: Bioinformatika - natur.cuni.cz

23

Bioinformatika a zemědělství

Friday, April 24, 15

Page 28: Bioinformatika - natur.cuni.cz

24

– rýže, pšenice, kukuřice, cukrová třtina

–rajče, banán, jahoda, víno

–dodnes asi 90 druhů rostlin

–kráva, ovce, treska

–kuře, prase

Sekvenování významných plodin a zvířat

Friday, April 24, 15

Page 29: Bioinformatika - natur.cuni.cz

25

Cíle

–zvýšit odolnost plodin i živočichů vuči stresu abiotickému (sucho, salinita) i biotickému (škůdci, pathogeny)

–zvýšit produkci

–snížit náklady

Friday, April 24, 15

Page 30: Bioinformatika - natur.cuni.cz

26

Jahoda

– jen 250 let stará plodina

– malý genom (240 MB)

– >33,000 genů

– 681 “jahodích” genů - vůně, chuť

Friday, April 24, 15

Page 31: Bioinformatika - natur.cuni.cz

27

Rychle se vyvíjející geny

Friday, April 24, 15

Page 32: Bioinformatika - natur.cuni.cz

28

Bioinformatika a průmysl

Friday, April 24, 15

Page 33: Bioinformatika - natur.cuni.cz

29

Těžba ropy

– část ropných ložisek je vždy nevytěžitelná

–vysoká viskozita neumožnuje vytažení ropy

– Microbial Enhanced Oil Recovery (MEOR) - technika manipulace s mikrobiálními kulturami ložisek

–in silico identifikace vhodných genů a kmenů bakterií k redukci nevytěžitelných zásob

Friday, April 24, 15

Page 34: Bioinformatika - natur.cuni.cz

30

Shrnutí

–metodické pokrokry v biologii vedou k explozi dostupných dat

–uložení a zpracování těchto dat je obrovskou výzvou

–data jsou základem experimentů

– využití těchto dat je naprosto nepředstavitelné bez zapojení informatických přístupů

–bioinformatika je využívána již dnes v medicíně, zemědělství i průmyslu

– pociťujeme však nedostatek kvalifikovaných odborníků, kteří mohou dát dostupným biologickým datům smysl

– rutinní sekvenování lidí dále zvýší potávku po bioinformaticíchFriday, April 24, 15

Page 35: Bioinformatika - natur.cuni.cz

31

Biology faces a quantum leap into the incomprehensible

“In the past, we have seen biological explanations as commonsense. They have explained how genes direct the manufacture of proteins or account for the appearance of disease through the behaviour of bacteria and viruses. But such simplicity is likely to disappear in the near future.” Paul Nurse (http://www.youtube.com/watch?v=Te8bXviniIA)

Friday, April 24, 15

Page 36: Bioinformatika - natur.cuni.cz

32

děkuji za pozornost

Friday, April 24, 15

Page 37: Bioinformatika - natur.cuni.cz

33

Friday, April 24, 15

Page 38: Bioinformatika - natur.cuni.cz

34

Friday, April 24, 15