59
15 апреля 2019 Алексей Константинович Шайтан, к.ф.-м.н. Понятние геномики, структурная геномика, функциональная геномика, фармакогеномика, популяционная геномика, сравнительная геномика, эволюционная геномика. История геномных технологий. Структуры эукариотических и прокариотических геномов. Ортология, паралогия, синтения, COGs (clusters of orthologous groups). Геном человека. Генетические вариации. Понятие гаплотипа и гаплогруппы. Геномные проекты: геном человека, 1000 Genomes, Epigenomics Roadmap, ENCODE, 4D nucleome, TCGA, ICGC. GWAS исследования, связь генотип- фенотип. Заболевания наследуемые по Менделю и комплексные заболевания. Базы данных dbSNP, OMIM, ClinVar. Геномные браузеры. Демонстрация браузера Ensembl. Геномика Лекция №22 Сайт курса: http://intbio.org/bioinf2018 -2019

Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

15 апреля 2019

Алексей Константинович Шайтан, к.ф.-м.н.

Понятние геномики, структурная геномика, функциональная геномика, фармакогеномика, популяционная геномика, сравнительная геномика,

эволюционная геномика. История геномных технологий. Структуры эукариотическихи прокариотических геномов. Ортология, паралогия, синтения, COGs (clusters of

orthologous groups). Геном человека. Генетические вариации. Понятие гаплотипа и гаплогруппы. Геномные проекты: геном человека, 1000 Genomes, Epigenomics

Roadmap, ENCODE, 4D nucleome, TCGA, ICGC. GWAS исследования, связь генотип-фенотип. Заболевания наследуемые по Менделю и комплексные заболевания.

Базы данных dbSNP, OMIM, ClinVar. Геномные браузеры. Демонстрация браузера Ensembl.

ГеномикаЛекция №22

Сайт курса: http://intbio.org/bioinf2018-2019

Page 2: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Геномика

2

• Гено́м — совокупность наследственного материала, заключенного в клетке организма.

• Геномика – изучение строения, работы, функций генов и геномов.• Геномика тесно связана с биоинформатикой и технологиями

секвенирования.• Func.onal genomics is a field of molecular biology that aTempts to make

use of the vast wealth of data given by genomic and transcriptomic projects (such as genome sequencing projects and RNA sequencing) to describe gene (and protein) funcaons and interacaons.

• Compara.ve genomics is a field of biological research in which the genomic features of different organisms are compared.

• Popula.on genomics is the large-scale comparison of DNA sequences of populaaons.

• Metagenomics is the study of geneac material recovered directly from environmental samples

• Pharmacogenomics is the study of how genes affect a person’s response to drugs.

• Structural genomics seeks to describe the 3-dimensional structure of every protein encoded by a given genome.

Page 3: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Омиксные технологии

3

• Транскриптомика

• Протеомика

• Метаболомика

• Эпигеномика

• Липидомка

• Гликомика

• Omics aims at the collective characterization and quantification of pools of

biological molecules that translate into the structure, function, and dynamics

of an organism or organisms.

Page 4: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Развитие представлений о ДНК

4

Friedrich Miescher

1869

Phoebus Levene

~1919

НиколайКонстантинович

Кольцов

1927 1935

1947

Erwin ChargaffErwin Schrödinger

1944 1953 1957 1958 1966

НиколайВладимирович

Тимофеев-Ресовский

Max DelbrückKarl Zimmer

1943

OswaldAvery

https://www.dna-worldwide.com/resource/160/history-dna-timeline

Page 5: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Секвенирование ДНК/РНК

5

1964 1967 1975 1977

FrederickSanger

1983

А.А. Баев(1904 - 1994)

Баев А.А., Венкстерн Т.В., Мирзабеков А.Д., Крутилина А.И., Ли Л., Аксельрод В.Д. 1967. Первичная структура валиновой транспортной РНК1 пекарских дрожжей. Молекулярная биология, 1(5), 754

Robert Holley

alanine tRNA

1977

геном бактериофага φX174 (5386bp)

«plus and minus

method» for DNA

sequencing

Метод Сэнгерадля

секвенированияДНК

PCR

Kary Mullis

Page 6: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Прогресс в секвенировании

6

1986 1990 1995

Lloyd Smith

Applied biosystems 370A DNA sequencer

Dye-terminator method

ABI PRISM 370096 образцов*16 раз за день

Начало проекта геном человека.План: 15 лет, $3

млрдА также:

M. capricolumE. coli

C. elegansS. cerevisiae

1988

Francis Collins

1998

геномHaemophilus

Influenzae1,830,137bp

Craig Venter

Celera Genomics

enters genome race

1996

Page 7: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Проект геном человека: методы и подходы

7

BACs= bacterial artificial

chromosomes ~150 Kb

Physical map

Needed!

https://www.nature.com/scitable/topicpage/dna-sequencing-technologies-key-to-the-human-828

'BAC-by-BAC' approach

Page 8: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Проект геном человека: методы и подходыСоздание физической карты генома

8

Fingerprinting BACs

FISHhttps://www.nature.com/articles/35057157

Page 9: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Проект геном человека: методы и подходы

9

Page 10: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Проект геном человека: методы и подходыSequence-Tagged Sites (STS)

10

https://www.ncbi.nlm.nih.gov/dbSTS/STS is a relatively short, easily PCR-amplified sequence (200 to 500 bp) which can be specifically amplified by PCR and detected in the presence of all other

genomic sequences and whose location in the genome is mapped.

Olson M et al. A common language for physical mapping of the human genome. Science. 1989 Sep 29;245(4925):1434-5https://genome.cshlp.org/content/1/2/77.full.pdf

Page 11: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Генетические маркеры

11

• When STS loci contain genetic polymorphisms, they become valuable genetic markers, i.e. loci which can be used to distinguish individuals.

• A genetic marker is a gene or DNA sequence with a known location on a chromosome that can be used to identify individuals or species.

https://www.ncbi.nlm.nih.gov/probe

Page 12: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Генетические маркерыДНК-дактилоскопия (DNA profiling)

12

В России 3 декабря 2008 года Госдума приняла Федеральный закон «О государственной геномной

регистрации в Российской Федерации»[19]. По этому закону создана федеральная база данных ДНК,

содержащая информацию об осуждённых за тяжкие и особо тяжкие преступления, за преступления

против половой неприкосновенности, а также о неопознанных трупах и о биологических следах,

изъятых с мест совершения преступлений. Оператором базы данных является МВД России.

Page 13: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Проект геном человека

13https://www.genome.gov/11006943/human-genome-project-completion-frequently-asked-questions/

Page 14: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

NGS starts

14

2008454 Life Sciences4 months$1.5 mln

Page 15: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Где посмотреть на геном?

15https://www.ncbi.nlm.nih.gov/projects/genome/guide/human/

https://www.ncbi.nlm.nih.gov/genome/

Page 16: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

16https://www.ncbi.nlm.nih.gov/genome/51

Где посмотреть на геном?

Page 17: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

17

Центромернаяобласть

Где посмотреть на геном?

Page 18: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Понятие Сборки генома и версии

18

Последняя версия GRCh38.p13

p=patchPatch releases do not change chromosome coordinates

Page 19: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Понятие Сборки генома и версии

19

Page 20: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Понятие Сборки генома

20

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4702866/https://www.ncbi.nlm.nih.gov/assembly/help/

Page 21: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Где посмотреть и скачать сборку генома?

21

https://www.ncbi.nlm.nih.gov/assembly/

Page 22: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Где посмотреть и скачать сборку генома?

22

https://www.ncbi.nlm.nih.gov/assembly/

Page 23: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Где посмотреть и скачать сборку генома?

23

https://www.ncbi.nlm.nih.gov/assembly/

Page 24: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Где посмотреть и скачать сборку генома?

24

AGP-файлы описывают сборку

Page 25: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Был ли геном секвенирован на 100%?

25

• Только эухроматическая часть• Проблемы с повторами• Проблемы со структурным полиморфизмом

https://www.ncbi.nlm.nih.gov/grc/help/faq/ https://doi.org/10.1371/journal.pcbi.1003628

3,234.83 Mb (Mega-basepairs) per haploid genome

Page 26: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Аннотация геномов

26

1992

dbESTExpressed

Sequence Tags database

https://www.ncbi.nlm.nih.gov/dbEST/

• Структурная аннотация – разбивка генома на гены.• Функциональная аннотация – функции генов, экспрессия, регуляция.• Возможны чисто вычислительные алгоритмы поиска генов.• Поиск открытых рамок считывания (ORF), поиск гомологов• Важную роль играли/играют Expressed Sequence Tags (EST) и

данные RNAseq• Понятие complementary DNA, cDNA, кДНК.

Page 27: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Аннотация геномов

27

• RNAseq данные помогают в аннотации геномов

Page 28: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Аннотация геномов

28

• Формат GFF, GFF3

Page 29: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Аннотация геномов, автоматические пайплайны

29

NCBI Eukaryotic Genome Annotation Pipeline

Page 30: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Аннотация геномовОсновные ресурсы/проекты по аннотации

30https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4339237/

UCSC annotation

Consensus Coding Sequence (CCDS) Project

Page 31: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Геномы других организмов

31

Аксолотльмексиканской амбистомы32 Гб – секвенирован в 2018

Page 32: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Геномы других организмов

32

Page 33: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Сравнительная/эволюционная геномикаОртологи, паралоги, COGs, синтения

33

Page 34: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Сравнительная/эволюционная геномикаCOGs=Clusters of Orthologous Groups

34

Page 35: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Сравнительная/эволюционная геномикаСинтения

35

Synteny between human and mouse chromosomes. Colors indicate homologous regions. For instance, sequences homologous to mouse chromosome 1 are primarily on human chromosomes 1 and 2, but also 6,8, and 18. The X chromosome is almost completely syntenic in both species

synteny -- the conservation of blocks of order within two sets of chromosomes that are being compared with each other.

Page 36: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Проекты постгеномной эры

36

Вариация ДНК в популяции

Что значит ДНК и как она

работает?

Связь генотипа, фенотипа и

заболеваний

Соматические мутации

Метагеномика

2008-2012

Секвенированиеживых

организмов

dbGAPGWASПерсонифицированная медицина

dpSNPOMIMClinVar

2003-

Page 37: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Проекты постгеномной эры

Вариация ДНК в популяции

2008-2012

Page 38: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

dbSNP

Вариация ДНК в популяции

https://www.ncbi.nlm.nih.gov/snp

Page 39: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

dbSNP

Вариация ДНК в популяции

https://www.ncbi.nlm.nih.gov/snp

Page 40: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

dbSNP

Вариация ДНК в популяции

Page 41: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

ClinVAR

Page 42: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

OMIM

Page 43: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Гаплотипы

43

A haplotype (haploid genotype) is a group of alleles in an organism that are inherited together from a single parent.

Genetic linkage is the tendency of DNA sequences that are close together on a chromosome to be inherited together during the meiosis phase of sexual reproduction.

Page 44: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

GWAS

44

Genome-wideassociationstudy

Page 45: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

dpGAP

45

https://www.ncbi.nlm.nih.gov/gap

Page 46: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Мутации

46

Page 47: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Мутации

47

Page 48: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

TCGA, ICGC, COSMIC

48

Page 49: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

TCGA, ICGC, COSMIC

49

Page 50: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

cBioPortal

50

Page 51: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

SNPedia

51

Page 52: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Предсказание эффекта мутаций

52

Page 53: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

53

Page 54: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

54https://science.sciencemag.org/content/337/6099/1159

Page 55: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

3D геномика, методы 3C, Hi-C и др.

55

Page 56: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Структура генома человека и вариации

56

4 to 5 million SNPs in a person's genome

99% identity of the aligned sequence96% identity between whole genomes

Page 57: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Геномные браузеры

57

http://www.ensembl.org

http://ensemblgenomes.org

https://www.ncbi.nlm.nih.gov/genome/gdv/

https://genome.ucsc.edu

Page 58: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Структура гена, понятие транскрипта, кДНК

58

Page 59: Геномика Лекция №22intbio.org/bioinf2019-2020/2018-19_lecture22_genomics.pdf · 2020-04-25 · регистрации в Российской Федерации»[19]

Демонстрация ENSEMBL

59

Рецепторы горького вкуса в капустеген TAS2R38

Рецептор вкуса умамиген TAS1R3