28
Функции Введение А.Б.Рахманинова (27 февраля, 1 марта 2006г.)

Функции Введение

Embed Size (px)

DESCRIPTION

Функции Введение. А.Б.Рахманинова (27 февраля, 1 марта 2006г.). Давайте помнить цель. gcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgactta - PowerPoint PPT Presentation

Citation preview

Page 1: Функции Введение

Функции

Введение А.Б.Рахманинова

(27 февраля,1 марта 2006г.)

Page 2: Функции Введение

gcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgacttaggtcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtacacaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattaccaacggtgcgggctgacgcgtacaggaaacacagaaaaaagcccgcacctgacagtgcgggctttttttttcgaccaaaggtaacgaggtaacaaccatgcgagtgttgaagttcggcacatcagtggcaaatgcagaacgttttctgcgtgttgccgatattctggaaagcaatgccaggcaggggcaggtggccaccgtcctctctgcccccgccaaaatcaccaaccacctggcgatgattgaaaaaaccattagcggccaggatgctttacccaatatcagcgatgccgaacgtatttttgccgaacttttgacgggactcgccgccgcccagccggggttcccgctggaattgaaaactttcgtcgatcaggaatttgcccaaataaaacatgtcctgcatggcattagtttgttggggcagtgcccggatagcatcaacgctgcgctgatttgccgtggcgagatgtcgatcgccattatggccggcgtattagaagcgcgcggtcacaacgttactgttatcgatccggtcgaaaaactgctggcagtggggcattacctcgaatctaccgtcgatattgagtccacccgccgtattgcggcaagccgcattccggctgatcacatggtgctgatggcaggtttcaccgccggtaatgaaaaaggcgaactggtggtgcttggacgcaacggttccgactctgctgcggtgctggctgcctgtttacgcgccgattgttgcgagatttggacggacgttgacggggtctatacctgcgacccgcgtcaggtgcccgatgcgaggttgttgaagttgtcctaccaggaagcgatggagctttcctacttcggcgctaaagttcttcacccccgcaccattacccccatcgcccagttccagatcccttgcctgattaaaaataccggaaatcaagcaccaggtacgctcattggtgccagccgtgatgaagacgaattaccggtcaagggcatttccaatctgaataacatggcaatgttcagcgtttctggtccggggatgaaagggatcggcatggcggcgcgcgtctttgcagcgatgtcacgcgcccgtatttccgtggtgctgattacgcaatcatcttccgaatacagcatcagtttctgcgttccacaaagcgacttgcgagctgaacgggcaatgcaggaagagttctacctggaactgaaagaaggcttactggagccgctggcagtgacggaacggctggccattatctcggtggtaggtgatggtagcaccttgcgtgggatctcggcgaaattctttgccgcactggcccgcgccaatatcaacattgtcgccattgctcagggatcttctgaacgctcaatctctgtcgtggtaaataacgatgatgccactggcgtgcgcgttactcatcagatgctgttcaataccgatcaggttatcgaagtgtttgtgattggcgtcggtggcgttggcggtgcgctgctggagcaactgaagcgtcagcgctggctgaagaataaacatatcgacttacgtgtctgcggtgttgccaactcgaaggctctgctcaccaatgtacatggccttaatctggaaaactggcaggaagaactggcgcaagaagagccgtttaatctcgggcgcttaattcgcctcgtgaaagaatatcatctgctgaacccggtcattgttgactgcacttccagccaggcagtggcggatcaatatgccgacttgcgcgaaggtttccacgttgtcacgccgaacaaaaaggccaacacctcgtcgatggattactaccatcagttgcgttatgcggcggaaaaatcgcggcgtaaattcctctatgacaccattggggctggattaccggttattgagaacctgcaaaatctgctcaatgcaggtgatgaattgatgaagttctccggcattctttctggttcgctttcttatatcttcggcaagttagaaggcatgagtttctccgaggcgaccacgctggcgcgggaaatgggttataccgaaccggacccgcgagatgatctttctggtatggatgtggcgcgtaaactattgattctcgctaaacgggacgtgaactggagctggcggatattgaaattgaacctgtgctgcccgcagagtttaacgccgagggtgatgttgccgcttttatggcgaatctgtcacaactcgacgatcttgccgcgcgcgtggcgaaggcccgtgatgaaggaaaagttttgcgctatgttggcaatattgatgaagatggcgtctgccgcgtgaagattgccgaagtggatggtaatgatccgctcaaagtgaaaaatggcgaaaacgccctggccttctatagccactattatcagccgctgccgttggtactgcgcggatatggtgcgggcaatgacgttacagctgccggtgtctttgatctgctacgtaccctctcatggaagttaggagtctgacatggttaaagtttatgccccggcttccagtgccaatatgagcgtcgggtttgatgtgctcggggcggcggtgacacctgatggtgcattgctcggagatgtagtcacggttgaggcggcagagacattcagtctcaacaacctcggacgctttgccgataagctgccgtcagaaccacgggaaaatatcgtttattgctgggagcgtttttgccaggaactgggtaagcaaattccagtggcgatgaccctggaaaagaatatgccgatcggttcgggcttaggctccagtgcctgttcggtggtcgcggcgatggcgatgaatgaacactgcggcaagccgcttaatgacactcgtttgctggctttgatgggcgagctggaaggccgtatctccggcagcattcattacgacaacgtggcaccgtgtctcggtggtatgcagttgatgatcgaagaaaacgacatcatcagccagcaagtgccagggtttgatgagtggctgtgggtgctggcgtatccggggattaaagtctcgacggcagaaagggctattttaccggcgcagtatcgccgccaggattgcattgcgcacgggcgacatctggcaggcttcattcacgcctgctattcccgtcagcctgagcttgccgcgaagctgatggatgttatcgctgaaccctaccgtgaacggttactgccaggcttccggcaggcgcggcaggcggtcgcggaaatcggcgcggtagcgagcggtatctccggctccggcccgaccttggctctgtgtgacaagccggaaaccgcccagcgcgttgccgactggttgggtaagaactacctgcaaaatcaggaaggttttgttcatatttgccggctggatacggcgggcgcacgactggaaaactaaatgaaactctacaatctgaaagatcacaacgagcaggtcagctttgcgcaagccgtaacccaggggttgggcaaaaatcaggggctgttttttccgcacgacctggaattcagcctgactgaaattgatgagatgctgaagctggattttgtcacccgcagtgcgaagatcctctcggcgtttattggtgatgaaatcccacaggaaatcctggaagagcgccgcgcggcgtttgccttcccggctccggtcgccaatgttgaaagcgatgtcggttgtctggaattgttccacgggccaacgctggcatttaaagatttcggcggtcgctttatggcaatgctgacccatattgcgggtgataagccagtgaccattctgaccgcgacctccggtgataccggagcggcagtggctcatgctttctacggtttaccgaatgtgaaagtggttatctatccacgaggcaaaatcagtccactgcaagaaaaactgttctgtacattgggcggcaatatcgaaactgttgccatcgacggcgatttcgatgcctgtcaggcgctggtgaagcagtttgatgatgaagaactgaaagtggcgctagggttaaactcggctaactcgattaacatcagccgtttgctggcgcagatttgctactactttgaagctgttgcgcagctgccgcaacgcgcaaccagctggttgtctcggtgccaagcggaaacttcggcgatttgacggcgggtctgctggcgaagtcactcggtctgccggtgaaacgttttattgctgcgaccaacgtggataccgtgccacgtttcctgcacgacggtcagtggtcacccaaagcgactcaggcgacgttatccaacgcgatggacgtgagtcagccgaacaactggccgcgtgtggaagagttgcgccgcaaaatctggcaactgaaagagctgggttatgcagccgtggatgatgaaaccacgcaacagacaatgcgtgagttaaaagaactgggctacacttcggagccgcacgctgtagcttatcgtgcgctgcgtgatcagttgaatccaggcgaatatggcttgttcctcggcaccgcgcatccggcgaaatttaaagagagcgtggaagcgattctcggtgaaacgttggatccaaaagagctggcagaacgtgctgatttacccttgctttcacataatctgcccgccgattttgctgcgttgcgtaaattgatgatgaatcatcagtaaaatctattcattatctcaaggccgggtttgcttttatgcagcccggcttttttatgaagaaattatggagaaaaatgacagggaaaaaggagaaattctcaataaatgcggtaacttagagattaggattgcggataacaaccgccgttctcatcgagtaatctccggatatcgacccataacgggcaatgataaaaggagtaacctgtgaaaaagatgcaatctatcgtactcgcactttccctggttctggctcccatggcagcacaggctgcggaaattacgttagtcccgtcagtaaaattacagataggcgatcgtgataatcgtggctattactgggatggaggtcactggcgcgaccacggc

Мы хотим знать,

что закодировано в геномах, как это работает, каким образом это возникло

Давайте помнить цельДавайте помнить цель

Page 3: Функции Введение

EMBLNumber of entries(current 68 109 539)http://www3.ebi.ac.uk/Services/DBStats/

TrEMBLNumber of entries(current 2 618 388 entries )

Swiss-Prot Number of entries (current 208 005 entries ) http://au.expasy.org/sprot

Page 4: Функции Введение

Как узнают функцию белка или гена?

• Эксперимент – прямой и генетический

ждите спецкурсов и практикумов

• Компьютерная аннотация —

задача поиска ортологов, ….. ждите лекции М.С.Гельфанда

- - - - - - - - - - - поиск гомологов- - - - - - - - -

• Сообщение хотите верьте, хотите нет

Page 5: Функции Введение

A Summary of the E. coli Chromosome(Gene Type Distribution),

data from http://genprotec.mbl.edu/overview.html

Updated January 26th, 2006

Page 6: Функции Введение

Основные биоинформатические базы данных

Основные БД последовательностей: EMBL, GeneBank, UniProt, SwissProt.

Производные PFAM,PROSITE, INTERPRO, dbEST, dbSNP…….

БД 3D-структур: PDB. Производные SCOP, CATH, RNABase…..

БД и энциклопедии, в которых подробно описаны функции генов и их продуктов : KEGG, BIOCYC, ENZYME, TC-DB, REACTOME…….

Онтологии : GO, OBO, HUGO......

Page 7: Функции Введение

Функции

I. Онтологии

А.Б.Рахманинова(27 февраля,

1 марта 2006г.)

Page 8: Функции Введение

Функции каких объектов?

Page 9: Функции Введение

Как понимать «гены и их продукты»

? Сколько записей

в SWISS-Prot?

Ген

альтернативный сплайсинг у эукариот

mRNA Белок 1

Зрелые rRNA и tRNA

mRNA

mRNA

Белок 2

Белок 3

mRNAАктивный

процессинг+модификация

ферментБелок

Процессинг и/или РТМ

Page 10: Функции Введение

Что такое "Функция"?Что такое "Функция"?( что хочется знать о функции молекулярной машины)( что хочется знать о функции молекулярной машины)

• Где? Локализация (место в организме, клетке,

комплексе)

• Зачем? Предназначение, роль в организме (клетке)

• Как?

Тип молекулярного механизма

• С чем? Тип рабочего тела (специфичность)

Page 11: Функции Введение

Например

LacY_Ecoli

• Клеточная мембрана

• Транспорт сахаров в бактериальную клетку

• Симпорт H+/сахар

• Лактозный транспортер

LDH_Ecoli

• Цитоплазма

• Анаэробный гликолиз

• Оксидоредуктаза, донор – группа –CH-OH, акцептор – НАД+

• D-Лактатдегидрогеназа

Page 12: Функции Введение

Почему полезно указывать все?

Малатдегидрогеназа, EC 1.1.1.37

(S)-malate + NAD+ = oxaloacetate + NADH + H+

Цикл Кребса

Гликонеогенез

MDHC_YEAST в цитоплазме

DHM_YEAST в матриксе митохондрий

MDHP_YEAST в пероксисомах

Глиоксилатный путь

Зачем дрожжам 3 фермента с ID43-50% ??

Page 13: Функции Введение

1. Один белок и много функций

1.1

1.2. цитохром с окислительное фосфорилирование индукция апоптоза

2. Одна функция и много белков

2.1. Ортологичный ряд алькогольдегидрогеназ 2.2. Аналогичные ферменты.

Функция — не физический объект, не ген и не белок

TRPC_ECOLI

ЕС 4.1.1.48 ЕС 5.3.1.24

Page 14: Функции Введение

Где искать описание функции• Краткое описание функций одного белка и ссылки на

другие ресурсы см.

• Краткое описание функций семейств белков и доменов

см. в и

• Подробное описание функций генов и их продуктов см в энциклопедиях, таких как или

• Подробное описание отдельных классов функций и соответствующих белков см. в специализированных БД,

таких как ENZYME , , ...

Page 15: Функции Введение
Page 16: Функции Введение

Самая простая, но обычная проблема

2-фосфо-D-глицерат<=> фосфоенолпируват + H2O

1. Сколько разных функций?

phosphopyruvate hydratase, 2-phosphoglycerate dehydratase, enolase

2. Как найти то, что непонятно, как называется ? tricarboxylic acid cycle=TCA cycle=Krebs cycle=Citrate cycle=citric acid cycle

BioCyc знает «TCA cycle» и «tricarboxylic acid cycle» KEGG понимает «Citrate cycle» и «TCA cycle» и «Reductive carboxylate cycle» . -=-

Гемоглобин есть в BioCyc и KEGG, но обе базы не понимают “oxygen transport”

Page 17: Функции Введение
Page 18: Функции Введение

Цели GO (Gene Ontology )• Создание концепции классификации

наших биологических знаний о • Молекулярных функциях (Function) (Как? С чем?)

Например, carbohydrate binding или ATPase activity

• Биологических процессах (Process) (Зачем?) Например, митоз или биосинтез пуринов

• Клеточных компонентах (Component) (Где?) Например, ядро или холофермент РНК-полимераза II

• Создание общего языка, применимого для всех организмов.

• Создание формальной терминологии для аннотации генов и сравнении информации о разных видах.

Page 19: Функции Введение

Что такое GO ?

1. 3 независимых словаря терминов1. Molecular Function (Как? С чем?)

2. Biological Process (Зачем?)

3. Cellular Component (Где?)

2. Термины имеют определение и перечень синонимов.

3. Термины в пределах одной онтологии связаны отношениями "_is_a", "_is_part_of" или "has part_of"

4. Термины имеют стандартные идентификаторы.

Page 20: Функции Введение

tricarboxylic acid cycle

Accession: GO:0006099

Ontology: biological_process

Synonyms:

exact: citric acid cycle

exact: Krebs cycle

exact: TCA cycle Definition: A nearly universal metabolic pathway in which the acetyl group of

acetyl coenzyme A is effectively oxidized to two C02 and four pairs of electrons are transferred to coenzymes. The acetyl group combines with oxaloacetate to form citrate, which undergoes successive transformations to isocitrate, 2-oxoglutarate, succinyl-CoA, succinate, fumarate, malate, and oxaloacetate again, thus completing the cycle. In eukaryotes the tricarboxylic acid is confined to the mitochondria. See also glyoxylate cycle.

Page 21: Функции Введение

Аннотация GO для HBB_HUMAN (UniProt)

1. Ген или продукт ассоцируется из одним или несколькими терминами из всех трех онтологий.

2. Термины имеют код обоснования аннотации

Page 22: Функции Введение

DAG —ориентированный ациклический граф

• отношение "is_part_of":

"A is part of B" означает, что А — часть В, но В необязательно содержит А.

• отношение "_is_a": "A is B" означает, что А — частный случай В;

Page 23: Функции Введение

Evidence CodesEvidence Codes• IDA Inferred from Direct Assay• TAS Traceable Author Statement • IMP Inferred from Mutant Phenotype• IGI Inferred from Genetic Interaction• IPI Inferred from Physical Interaction• RCA Inferred from Reviewed Computational Analysis• ISS Inferred from Sequence Similarity• IEP Inferred from Expression Pattern

• NAS Non-traceable Author Statement• IEA Inferred from Electronic Annotation• IC Inferred by Curator

• ND No biological Data available

Page 24: Функции Введение

Статистика GO

• Biological process terms 9805• Molecular function terms 7076• Cellular component terms 1574

• Genomes with annotation* 30• Annotated gene products

Total 1 618 739 Electronic only 1 460 632 Manually curated 158 107

______________________________________* Excludes annotations from UniProt, which represent 261 annotated

proteomes.

http://www.ebi.ac.uk/GOA/

Page 25: Функции Введение
Page 26: Функции Введение

Есть и другие онтологии, например,

exon,promoter, binding_site, non_canonical_splice_site,stop_codon. pseudogene

Page 27: Функции Введение

http://obo.sourceforge.net/main.htm

Page 28: Функции Введение

Резюме• Функциональная аннотация геномов — задача

биоинформатики

• Существуют энциклопедии, где можно узнать о функциях генов и их продуктов, например, BioCyc.

• Полное описание функции — это ответы на вопросы "где?", "зачем?", "как?“, "с чем?“.

• GO — перспективный подход к• разработке общего языка (решение проблема

синонимов),• разработке формализованного описания

функций, общего для всех организмов.