15
Сравнительная геномика регуляторных и метаболических систем М. Гельфанд ИППИ РАН Отчетная конференция программы «Моекулярная и клеточная биология» Апрель 2009

Сравнительная геномика регуляторных и метаболических систем

Embed Size (px)

DESCRIPTION

Сравнительная геномика регуляторных и метаболических систем. М. Гельфанд ИППИ РАН. Отчетная конференция программы «Моекулярная и клеточная биология» Апрель 2009. Вторичные структуры РНК, регулирующие альтернативный сплайсинг генов дрозофилы. - PowerPoint PPT Presentation

Citation preview

Page 1: Сравнительная геномика регуляторных и метаболических систем

Сравнительная геномика регуляторных и

метаболических систем

М. Гельфанд

ИППИ РАН

Отчетная конференция программы «Моекулярная и клеточная биология»

Апрель 2009

Page 2: Сравнительная геномика регуляторных и метаболических систем

Вторичные структуры РНК, регулирующие

альтернативный сплайсинг генов дрозофилы

• Консервативные комплементарные последовательности на концах интронов– по 150 нт. с обоих концов интрона– консервативность минимум в 7 из 12 геномов

• максимум 3 различия

– стабильные (потенциально) спаренные участки

• минимум 9 комплементарных пар оснований• минимум 2 пары GC • максимум 1 пара GU

• 202 интрона, содержащих такие последовательности (сковородки)

Page 3: Сравнительная геномика регуляторных и метаболических систем

Статистический анализ• Контроль: случайные концы интронов

– уровень ложных предсказаний 6±4% – при более мягких параметрах интронов-

сковородок намного больше, но уровень шума также растет.

• Свойства:– среди интронов-сковородок более 50%

альтернативных (в среднем 17%)– у интронов-сковородок более слабые

акцепторные сайты сплайсинга – среди сковородок больше длинных интронов– среди генов со сковородками много генов,

экспрессирующихся в клетках нервной системы, особенно ионных каналов

Page 4: Сравнительная геномика регуляторных и метаболических систем

CG33298АТФаза, участвующая в транслокации фосфолипидов.Альтернативные донорные сайты => альт. С-концы.

Page 5: Сравнительная геномика регуляторных и метаболических систем

AtrophinКорепрессор транскрипции, деацетилаза гистонов.Новый альтернативный акцепторный сайт.

Page 6: Сравнительная геномика регуляторных и метаболических систем

NmnatНикотинамид мононуклеотид аденилилтрансфераза.Альтернативные донорные сайты => альт. С-концы.

Page 7: Сравнительная геномика регуляторных и метаболических систем

Аналогичные структуры в других геномах

149 10 1311 12box1a box2a box1b box2b

SF1149 10 1311 12

box1a box2a box1b box2b

SF1

H. sap. CCTCCACCG gtgagcctg-ggggc...atggatgtggatggcaacattgttcttccgggatctcag...cataacccgaagaacaatgttgccactagg...aggaaatgctctcacgtag TCTCTCATGT R. mac. CCTCCACCG gtgagcctg-agggc...atggatgtgaatggcaacattgttcttccgggatctcag...cattaccagaagaacaatgttgccactagg...gggaaatgctctcacgtag TCTCTCATGT P. tro. CCTCCACCG gtgagcctg-ggggc...atggatgtggatggcaacattgttcttccgggatctcag...cataacccgaagaacaatgttgccactagg...aggaaatgctctcacgtag TCTTTCATGT M. mus. CCACCACCG gtgagccct-gggac...gtggatatagctggcaacattgtttttctgggatgtctg...catagtcagaagaacaatgttgccaccagg...aggaaatgctctcacgtag TCTCTCATGT R. nor. CCACCACCG gtgagccct-gggac...gtagatgtagctggcaacattgtttttctgggatgtctg...catagtcagaagaacaatgttgccaccagg...aagaaatgctctcatgtag TCTCTCATGT C. fam. CCTCCACCG gtgagtttcagttgc...acagacatggctggcaacattgttcttccgg-ataccag...catagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT F. cat. CCTCCCCCG gtgagtttcaggggc...gcggacgtggctggcaacattgttcttccgg-acgtcag...cagagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT B. tau. CCTCCGCCG gtgagtttcgggagg...gtggacatggccggcaacattgttctttcgggccatcag...cacagccgaaagaacagtgttgccgccaga...gggaa-tgctctcacgtag TCTCTCATGT E. cab. CCTCCACCG gtgagcttcaggggc...atggacatggctggcaacattgttctttggggatgtcag...catagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT M. dom. CCACCGCCG gtgagtgtcaggcgc...acggtccct-tgggcaacattgttctcccggatcgtccg...gcggtgtgagagagcaatgttgccatccgc...gggaaatgctctcacgtag TCTCTCATGT ** ** *** ***** * ************ * ** * * *** ** ******* * *** ******** **** *** ******

exon 9 exon 10box 1a box 1b

H. sap. CCTCCACCG gtgagcctg-ggggc...atggatgtggatggcaacattgttcttccgggatctcag...cataacccgaagaacaatgttgccactagg...aggaaatgctctcacgtag TCTCTCATGT R. mac. CCTCCACCG gtgagcctg-agggc...atggatgtgaatggcaacattgttcttccgggatctcag...cattaccagaagaacaatgttgccactagg...gggaaatgctctcacgtag TCTCTCATGT P. tro. CCTCCACCG gtgagcctg-ggggc...atggatgtggatggcaacattgttcttccgggatctcag...cataacccgaagaacaatgttgccactagg...aggaaatgctctcacgtag TCTTTCATGT M. mus. CCACCACCG gtgagccct-gggac...gtggatatagctggcaacattgtttttctgggatgtctg...catagtcagaagaacaatgttgccaccagg...aggaaatgctctcacgtag TCTCTCATGT R. nor. CCACCACCG gtgagccct-gggac...gtagatgtagctggcaacattgtttttctgggatgtctg...catagtcagaagaacaatgttgccaccagg...aagaaatgctctcatgtag TCTCTCATGT C. fam. CCTCCACCG gtgagtttcagttgc...acagacatggctggcaacattgttcttccgg-ataccag...catagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT F. cat. CCTCCCCCG gtgagtttcaggggc...gcggacgtggctggcaacattgttcttccgg-acgtcag...cagagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT B. tau. CCTCCGCCG gtgagtttcgggagg...gtggacatggccggcaacattgttctttcgggccatcag...cacagccgaaagaacagtgttgccgccaga...gggaa-tgctctcacgtag TCTCTCATGT E. cab. CCTCCACCG gtgagcttcaggggc...atggacatggctggcaacattgttctttggggatgtcag...catagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT M. dom. CCACCGCCG gtgagtgtcaggcgc...acggtccct-tgggcaacattgttctcccggatcgtccg...gcggtgtgagagagcaatgttgccatccgc...gggaaatgctctcacgtag TCTCTCATGT ** ** *** ***** * ************ * ** * * *** ** ******* * *** ******** **** *** ******

exon 9 exon 10box 1a box 1b

H. sap. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccacccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA R. mac. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA P. tro. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccacccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA M. mus. GGCAGCAAA gtgagtgga-atattttgggcttgtgggggtgggtgggatgtgggcta....--aggacagccccgcccgcccgccccccaccaccgtaca...ggcttctttactaccccag ATACGACGA R. nor. GGCAGCAAA gtgagtgaa-atattttgggcttgtgggggtgggtgggttgtgggctg....ccaggacagccccgcccgcccgccccc-accaccgtgca...ggcttctttactaccccag ATACGACGA C. fam. GGCAGCAAA gtgagtgga-atattttgggcttgtgggggtgggtggga--tgaagag....ccaggacagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA F. cat. GGCAGCAAG gtgagt-ga-atattttgggctgtggggggtgggtgggat-tgggggt....ccaggaccgccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA B. tau. GGCAGCAAA gtgagtgga-atattttgggctggtgggggtgggtgggat-tgggggg....ccaggaccaccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA E. cab. GGCAGCAAA gtgagtgga-atattttgggctcctgggggtgggtgggt--cgggggg....ccaagacagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA M. dom. GGCAGCAAA gtgagtagagacttcctggtcgtggggccatgggtggggggcggcac-....--cccttcccccaggacagcctccccgccctgatataac...ggcttctttaccaccccag ATACGACGA ******** ****** * * * *** * ** ******** *** * * ** **** * * *********** ******* *********

exon 13box 2a box 2bexon 12H. sap. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccacccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA R. mac. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA P. tro. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccacccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA M. mus. GGCAGCAAA gtgagtgga-atattttgggcttgtgggggtgggtgggatgtgggcta....--aggacagccccgcccgcccgccccccaccaccgtaca...ggcttctttactaccccag ATACGACGA R. nor. GGCAGCAAA gtgagtgaa-atattttgggcttgtgggggtgggtgggttgtgggctg....ccaggacagccccgcccgcccgccccc-accaccgtgca...ggcttctttactaccccag ATACGACGA C. fam. GGCAGCAAA gtgagtgga-atattttgggcttgtgggggtgggtggga--tgaagag....ccaggacagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA F. cat. GGCAGCAAG gtgagt-ga-atattttgggctgtggggggtgggtgggat-tgggggt....ccaggaccgccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA B. tau. GGCAGCAAA gtgagtgga-atattttgggctggtgggggtgggtgggat-tgggggg....ccaggaccaccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA E. cab. GGCAGCAAA gtgagtgga-atattttgggctcctgggggtgggtgggt--cgggggg....ccaagacagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA M. dom. GGCAGCAAA gtgagtagagacttcctggtcgtggggccatgggtggggggcggcac-....--cccttcccccaggacagcctccccgccctgatataac...ggcttctttaccaccccag ATACGACGA ******** ****** * * * *** * ** ******** *** * * ** **** * * *********** ******* *********

exon 13box 2a box 2bexon 12

C. Ele. ACTGGAAGAA gtaagata...acgacgcacgatccaaatagtttcttgcactcattt...aaattccag caagggactatttggttcgcggcatcaaagagagcatgcggattgcag GAGGAGCAGC C. Bri. ACAGGGAGGA gtaagttt...accacgcacgaaccaaatagtttcttgcactctccc...aaattccag caagggactatttggttcgcggcatcaaggaaagcatgcggattgcag GAGGAGCCGC C. Bre. ACGGGAAGAA gtaagaat...tgcacgcacgaaccaaatagtttcttgcatccgaat...aa-ttccag caagggactatttggttcgaggcatcaaagagagcatgcggattgcag GAGGCGCCGC C. Rem. ACGGGAAGAA gtaagagt...tgcacgcacgaaccaaatagtttcttgcacccatac...atattccag caagggactatttggttcgaggcatcaaagaaagcatgcggattgcag GAGGTGCCGC C. Jap. ACAGGAAGAA gtaaggcg...tttctgcacgagccaaatagtttcttgcacccagtt...aaattccag caagggactatttggttcgcagcatcaaagagagcatgcggattgcag GAGGGGCGGC ** ** ** * ***** ****** ***************** * * ****** ******************* ******* ** **************** **** ** **

exon 10 exon 11box 1 box 2C. Ele. ACTGGAAGAA gtaagata...acgacgcacgatccaaatagtttcttgcactcattt...aaattccag caagggactatttggttcgcggcatcaaagagagcatgcggattgcag GAGGAGCAGC C. Bri. ACAGGGAGGA gtaagttt...accacgcacgaaccaaatagtttcttgcactctccc...aaattccag caagggactatttggttcgcggcatcaaggaaagcatgcggattgcag GAGGAGCCGC C. Bre. ACGGGAAGAA gtaagaat...tgcacgcacgaaccaaatagtttcttgcatccgaat...aa-ttccag caagggactatttggttcgaggcatcaaagagagcatgcggattgcag GAGGCGCCGC C. Rem. ACGGGAAGAA gtaagagt...tgcacgcacgaaccaaatagtttcttgcacccatac...atattccag caagggactatttggttcgaggcatcaaagaaagcatgcggattgcag GAGGTGCCGC C. Jap. ACAGGAAGAA gtaaggcg...tttctgcacgagccaaatagtttcttgcacccagtt...aaattccag caagggactatttggttcgcagcatcaaagagagcatgcggattgcag GAGGGGCGGC ** ** ** * ***** ****** ***************** * * ****** ******************* ******* ** **************** **** ** **

exon 10 exon 11box 1 box 2

9 11 1210box1

box2

C39B10.2

9 11 1210box1

box2

9 11 1210box1

box2

C39B10.2

10 позвоночных

5 нематод

Page 8: Сравнительная геномика регуляторных и метаболических систем

Т-боксы

• 805 Т-боксов в 96 бактериальных геномах

• Необычные структуры– Т-боксы II типа,

регуляция трансляции (Actinobacteria)

– двойные– полуторные

Page 9: Сравнительная геномика регуляторных и метаболических систем

Реконструкция эволюционной истории

Дупликации, изменения специфичности

Page 10: Сравнительная геномика регуляторных и метаболических систем

Положительный отбор в альтернативно

сплайсируемых областях генов человека

Тест МакДональда-Крейтмана: сравнение полиморфизмов (человек) и зафиксированных замен (человек-шимпанзе)

25-35% позиций в минорных альтернативных областях эволюционируют под влиянием положительного отбора – это первый такой пример (раньше были только отдельные гены)

Page 11: Сравнительная геномика регуляторных и метаболических систем

Новый класс бактериаль-ных транс-портеров: универсальное «заряжающее устройство» + специфи-ческие компоненты (иногда способные к независимой работе)

Page 12: Сравнительная геномика регуляторных и метаболических систем

Другие исследования• Регуляция транскрипции у бактерий

– Метаболизм NAD (протеобактерии)– Катаболищм жирных кислот и разветвленных аминокислот

(протеобактерии)– Синтез метионина и цистеина (стрептококки)– Ответ на радиационный стресс (дейнококки)– Дыхание (гагмма-протеобактерии)– SOS-ответ (гамма-протеобактерии)– Системы рестрикции-модификации

• Моделирование– Модель поиска фактором транскрипции участков связывания в

ДНК– Модель эволюции участков связывания факторов транскрипции

• Функциональная аннотация – другие объекты– Участки начала репликации– Системы синтеза низкомолекулярных микроцинов– РНК-переключатели в метагеномах

• Альтернативный сплайсинг– Консервативность альтернативных экзон-интронных структур в

геномах млекопитающих– Ошибки сплайсинга и мутации, затрагивающие сайты

сплайсинга

Page 13: Сравнительная геномика регуляторных и метаболических систем

Публикации

• 2007– Chem. Rev. (22.8)– Proc. Natl. Acad. Sci. USA

(9.6)– Nucleic Acids Res. (6.9)– Molecular Microbiology (5.5)– J. Mol. Biol. (4.5)– 2 × BMC Genomics (4.2)– 3 × BMC Evol. Biol. (4.1)– Appl. Environ. Microbiol. (4.0)– FEMS Microbiol Lett. (2.3)– Biometals (2.2)– 4 × Мол. биология (0.8)– PLoS ONE (-)

• 2008– Am. J. Hum. Genet. (11.0)– Nucleic Acids Res (6.9)– RNA (5.8)– Brief. Bioinform. (4.4) – BMC Genomics (4.2)– BMC Evol. Biol. (4.1)– Physics of Life Rev. (-)

• 2009– 2 × Nucleic Acids Res. (6.9)– Structure (5.2)– BMC Genomics (4.2)– 2 × J Bacteriology (4.0)

Page 14: Сравнительная геномика регуляторных и метаболических систем

Участники

• А.А.Миронов (АС – РНК, положительный отбор)

• Д.Д.Первушин (РНК и АС)• А.Г.Витрещак (Т-боксы)• Д.А.Родионов

(транспортеры)

• В.Е.Раменский, ИМБ (АС – положительный отбор)

• V.Raker, Барселона (РНК и АС – эксперимент)

• A.Osterman, Сан Диего (транспортеры)

• T.Eitinger, Берлин (транспортеры)

• А.Голанд• С.Денисов• Е.Ермакова• Ф.Еникеева• А.Е.Казаков• Г.Ковалева• Ю.Коростелев• Е.Курмангалиев• П.Мазин• Р.Нуртдинов• Е.Пермина• Д.Равчеев• А.Б.Рахманинова• С.Родионова• В.Сорокин• Е.Ставровская• Е.Храмеева• О.Цой

• Другие проекты программы МКБ:– И.И.Артамонова, ИОГен (CRISPR)– К.В.Северинов, ИБГ (фаги,

микроцины, Р-М системы)

Page 15: Сравнительная геномика регуляторных и метаболических систем