Upload
jada-valencia
View
58
Download
6
Embed Size (px)
DESCRIPTION
Сравнительная геномика регуляторных и метаболических систем. М. Гельфанд ИППИ РАН. Отчетная конференция программы «Моекулярная и клеточная биология» Апрель 2009. Вторичные структуры РНК, регулирующие альтернативный сплайсинг генов дрозофилы. - PowerPoint PPT Presentation
Citation preview
Сравнительная геномика регуляторных и
метаболических систем
М. Гельфанд
ИППИ РАН
Отчетная конференция программы «Моекулярная и клеточная биология»
Апрель 2009
Вторичные структуры РНК, регулирующие
альтернативный сплайсинг генов дрозофилы
• Консервативные комплементарные последовательности на концах интронов– по 150 нт. с обоих концов интрона– консервативность минимум в 7 из 12 геномов
• максимум 3 различия
– стабильные (потенциально) спаренные участки
• минимум 9 комплементарных пар оснований• минимум 2 пары GC • максимум 1 пара GU
• 202 интрона, содержащих такие последовательности (сковородки)
Статистический анализ• Контроль: случайные концы интронов
– уровень ложных предсказаний 6±4% – при более мягких параметрах интронов-
сковородок намного больше, но уровень шума также растет.
• Свойства:– среди интронов-сковородок более 50%
альтернативных (в среднем 17%)– у интронов-сковородок более слабые
акцепторные сайты сплайсинга – среди сковородок больше длинных интронов– среди генов со сковородками много генов,
экспрессирующихся в клетках нервной системы, особенно ионных каналов
CG33298АТФаза, участвующая в транслокации фосфолипидов.Альтернативные донорные сайты => альт. С-концы.
AtrophinКорепрессор транскрипции, деацетилаза гистонов.Новый альтернативный акцепторный сайт.
NmnatНикотинамид мононуклеотид аденилилтрансфераза.Альтернативные донорные сайты => альт. С-концы.
Аналогичные структуры в других геномах
149 10 1311 12box1a box2a box1b box2b
SF1149 10 1311 12
box1a box2a box1b box2b
SF1
H. sap. CCTCCACCG gtgagcctg-ggggc...atggatgtggatggcaacattgttcttccgggatctcag...cataacccgaagaacaatgttgccactagg...aggaaatgctctcacgtag TCTCTCATGT R. mac. CCTCCACCG gtgagcctg-agggc...atggatgtgaatggcaacattgttcttccgggatctcag...cattaccagaagaacaatgttgccactagg...gggaaatgctctcacgtag TCTCTCATGT P. tro. CCTCCACCG gtgagcctg-ggggc...atggatgtggatggcaacattgttcttccgggatctcag...cataacccgaagaacaatgttgccactagg...aggaaatgctctcacgtag TCTTTCATGT M. mus. CCACCACCG gtgagccct-gggac...gtggatatagctggcaacattgtttttctgggatgtctg...catagtcagaagaacaatgttgccaccagg...aggaaatgctctcacgtag TCTCTCATGT R. nor. CCACCACCG gtgagccct-gggac...gtagatgtagctggcaacattgtttttctgggatgtctg...catagtcagaagaacaatgttgccaccagg...aagaaatgctctcatgtag TCTCTCATGT C. fam. CCTCCACCG gtgagtttcagttgc...acagacatggctggcaacattgttcttccgg-ataccag...catagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT F. cat. CCTCCCCCG gtgagtttcaggggc...gcggacgtggctggcaacattgttcttccgg-acgtcag...cagagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT B. tau. CCTCCGCCG gtgagtttcgggagg...gtggacatggccggcaacattgttctttcgggccatcag...cacagccgaaagaacagtgttgccgccaga...gggaa-tgctctcacgtag TCTCTCATGT E. cab. CCTCCACCG gtgagcttcaggggc...atggacatggctggcaacattgttctttggggatgtcag...catagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT M. dom. CCACCGCCG gtgagtgtcaggcgc...acggtccct-tgggcaacattgttctcccggatcgtccg...gcggtgtgagagagcaatgttgccatccgc...gggaaatgctctcacgtag TCTCTCATGT ** ** *** ***** * ************ * ** * * *** ** ******* * *** ******** **** *** ******
exon 9 exon 10box 1a box 1b
H. sap. CCTCCACCG gtgagcctg-ggggc...atggatgtggatggcaacattgttcttccgggatctcag...cataacccgaagaacaatgttgccactagg...aggaaatgctctcacgtag TCTCTCATGT R. mac. CCTCCACCG gtgagcctg-agggc...atggatgtgaatggcaacattgttcttccgggatctcag...cattaccagaagaacaatgttgccactagg...gggaaatgctctcacgtag TCTCTCATGT P. tro. CCTCCACCG gtgagcctg-ggggc...atggatgtggatggcaacattgttcttccgggatctcag...cataacccgaagaacaatgttgccactagg...aggaaatgctctcacgtag TCTTTCATGT M. mus. CCACCACCG gtgagccct-gggac...gtggatatagctggcaacattgtttttctgggatgtctg...catagtcagaagaacaatgttgccaccagg...aggaaatgctctcacgtag TCTCTCATGT R. nor. CCACCACCG gtgagccct-gggac...gtagatgtagctggcaacattgtttttctgggatgtctg...catagtcagaagaacaatgttgccaccagg...aagaaatgctctcatgtag TCTCTCATGT C. fam. CCTCCACCG gtgagtttcagttgc...acagacatggctggcaacattgttcttccgg-ataccag...catagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT F. cat. CCTCCCCCG gtgagtttcaggggc...gcggacgtggctggcaacattgttcttccgg-acgtcag...cagagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT B. tau. CCTCCGCCG gtgagtttcgggagg...gtggacatggccggcaacattgttctttcgggccatcag...cacagccgaaagaacagtgttgccgccaga...gggaa-tgctctcacgtag TCTCTCATGT E. cab. CCTCCACCG gtgagcttcaggggc...atggacatggctggcaacattgttctttggggatgtcag...catagccgaaagaacagtgttgccaccagg...gggaaatgctctcacgtag TCTCTCATGT M. dom. CCACCGCCG gtgagtgtcaggcgc...acggtccct-tgggcaacattgttctcccggatcgtccg...gcggtgtgagagagcaatgttgccatccgc...gggaaatgctctcacgtag TCTCTCATGT ** ** *** ***** * ************ * ** * * *** ** ******* * *** ******** **** *** ******
exon 9 exon 10box 1a box 1b
H. sap. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccacccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA R. mac. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA P. tro. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccacccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA M. mus. GGCAGCAAA gtgagtgga-atattttgggcttgtgggggtgggtgggatgtgggcta....--aggacagccccgcccgcccgccccccaccaccgtaca...ggcttctttactaccccag ATACGACGA R. nor. GGCAGCAAA gtgagtgaa-atattttgggcttgtgggggtgggtgggttgtgggctg....ccaggacagccccgcccgcccgccccc-accaccgtgca...ggcttctttactaccccag ATACGACGA C. fam. GGCAGCAAA gtgagtgga-atattttgggcttgtgggggtgggtggga--tgaagag....ccaggacagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA F. cat. GGCAGCAAG gtgagt-ga-atattttgggctgtggggggtgggtgggat-tgggggt....ccaggaccgccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA B. tau. GGCAGCAAA gtgagtgga-atattttgggctggtgggggtgggtgggat-tgggggg....ccaggaccaccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA E. cab. GGCAGCAAA gtgagtgga-atattttgggctcctgggggtgggtgggt--cgggggg....ccaagacagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA M. dom. GGCAGCAAA gtgagtagagacttcctggtcgtggggccatgggtggggggcggcac-....--cccttcccccaggacagcctccccgccctgatataac...ggcttctttaccaccccag ATACGACGA ******** ****** * * * *** * ** ******** *** * * ** **** * * *********** ******* *********
exon 13box 2a box 2bexon 12H. sap. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccacccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA R. mac. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA P. tro. GGCAGCAAA gtgagtaga-atattttgggcttgtgggggtgggtggga--tgggggt....catcaccagccccgcccacccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA M. mus. GGCAGCAAA gtgagtgga-atattttgggcttgtgggggtgggtgggatgtgggcta....--aggacagccccgcccgcccgccccccaccaccgtaca...ggcttctttactaccccag ATACGACGA R. nor. GGCAGCAAA gtgagtgaa-atattttgggcttgtgggggtgggtgggttgtgggctg....ccaggacagccccgcccgcccgccccc-accaccgtgca...ggcttctttactaccccag ATACGACGA C. fam. GGCAGCAAA gtgagtgga-atattttgggcttgtgggggtgggtggga--tgaagag....ccaggacagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA F. cat. GGCAGCAAG gtgagt-ga-atattttgggctgtggggggtgggtgggat-tgggggt....ccaggaccgccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA B. tau. GGCAGCAAA gtgagtgga-atattttgggctggtgggggtgggtgggat-tgggggg....ccaggaccaccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA E. cab. GGCAGCAAA gtgagtgga-atattttgggctcctgggggtgggtgggt--cgggggg....ccaagacagccccgcccgcccgccccccaccaccgtacc...ggcttctttaccaccccag ATACGACGA M. dom. GGCAGCAAA gtgagtagagacttcctggtcgtggggccatgggtggggggcggcac-....--cccttcccccaggacagcctccccgccctgatataac...ggcttctttaccaccccag ATACGACGA ******** ****** * * * *** * ** ******** *** * * ** **** * * *********** ******* *********
exon 13box 2a box 2bexon 12
C. Ele. ACTGGAAGAA gtaagata...acgacgcacgatccaaatagtttcttgcactcattt...aaattccag caagggactatttggttcgcggcatcaaagagagcatgcggattgcag GAGGAGCAGC C. Bri. ACAGGGAGGA gtaagttt...accacgcacgaaccaaatagtttcttgcactctccc...aaattccag caagggactatttggttcgcggcatcaaggaaagcatgcggattgcag GAGGAGCCGC C. Bre. ACGGGAAGAA gtaagaat...tgcacgcacgaaccaaatagtttcttgcatccgaat...aa-ttccag caagggactatttggttcgaggcatcaaagagagcatgcggattgcag GAGGCGCCGC C. Rem. ACGGGAAGAA gtaagagt...tgcacgcacgaaccaaatagtttcttgcacccatac...atattccag caagggactatttggttcgaggcatcaaagaaagcatgcggattgcag GAGGTGCCGC C. Jap. ACAGGAAGAA gtaaggcg...tttctgcacgagccaaatagtttcttgcacccagtt...aaattccag caagggactatttggttcgcagcatcaaagagagcatgcggattgcag GAGGGGCGGC ** ** ** * ***** ****** ***************** * * ****** ******************* ******* ** **************** **** ** **
exon 10 exon 11box 1 box 2C. Ele. ACTGGAAGAA gtaagata...acgacgcacgatccaaatagtttcttgcactcattt...aaattccag caagggactatttggttcgcggcatcaaagagagcatgcggattgcag GAGGAGCAGC C. Bri. ACAGGGAGGA gtaagttt...accacgcacgaaccaaatagtttcttgcactctccc...aaattccag caagggactatttggttcgcggcatcaaggaaagcatgcggattgcag GAGGAGCCGC C. Bre. ACGGGAAGAA gtaagaat...tgcacgcacgaaccaaatagtttcttgcatccgaat...aa-ttccag caagggactatttggttcgaggcatcaaagagagcatgcggattgcag GAGGCGCCGC C. Rem. ACGGGAAGAA gtaagagt...tgcacgcacgaaccaaatagtttcttgcacccatac...atattccag caagggactatttggttcgaggcatcaaagaaagcatgcggattgcag GAGGTGCCGC C. Jap. ACAGGAAGAA gtaaggcg...tttctgcacgagccaaatagtttcttgcacccagtt...aaattccag caagggactatttggttcgcagcatcaaagagagcatgcggattgcag GAGGGGCGGC ** ** ** * ***** ****** ***************** * * ****** ******************* ******* ** **************** **** ** **
exon 10 exon 11box 1 box 2
9 11 1210box1
box2
C39B10.2
9 11 1210box1
box2
9 11 1210box1
box2
C39B10.2
10 позвоночных
5 нематод
Т-боксы
• 805 Т-боксов в 96 бактериальных геномах
• Необычные структуры– Т-боксы II типа,
регуляция трансляции (Actinobacteria)
– двойные– полуторные
Реконструкция эволюционной истории
Дупликации, изменения специфичности
Положительный отбор в альтернативно
сплайсируемых областях генов человека
Тест МакДональда-Крейтмана: сравнение полиморфизмов (человек) и зафиксированных замен (человек-шимпанзе)
25-35% позиций в минорных альтернативных областях эволюционируют под влиянием положительного отбора – это первый такой пример (раньше были только отдельные гены)
Новый класс бактериаль-ных транс-портеров: универсальное «заряжающее устройство» + специфи-ческие компоненты (иногда способные к независимой работе)
Другие исследования• Регуляция транскрипции у бактерий
– Метаболизм NAD (протеобактерии)– Катаболищм жирных кислот и разветвленных аминокислот
(протеобактерии)– Синтез метионина и цистеина (стрептококки)– Ответ на радиационный стресс (дейнококки)– Дыхание (гагмма-протеобактерии)– SOS-ответ (гамма-протеобактерии)– Системы рестрикции-модификации
• Моделирование– Модель поиска фактором транскрипции участков связывания в
ДНК– Модель эволюции участков связывания факторов транскрипции
• Функциональная аннотация – другие объекты– Участки начала репликации– Системы синтеза низкомолекулярных микроцинов– РНК-переключатели в метагеномах
• Альтернативный сплайсинг– Консервативность альтернативных экзон-интронных структур в
геномах млекопитающих– Ошибки сплайсинга и мутации, затрагивающие сайты
сплайсинга
Публикации
• 2007– Chem. Rev. (22.8)– Proc. Natl. Acad. Sci. USA
(9.6)– Nucleic Acids Res. (6.9)– Molecular Microbiology (5.5)– J. Mol. Biol. (4.5)– 2 × BMC Genomics (4.2)– 3 × BMC Evol. Biol. (4.1)– Appl. Environ. Microbiol. (4.0)– FEMS Microbiol Lett. (2.3)– Biometals (2.2)– 4 × Мол. биология (0.8)– PLoS ONE (-)
• 2008– Am. J. Hum. Genet. (11.0)– Nucleic Acids Res (6.9)– RNA (5.8)– Brief. Bioinform. (4.4) – BMC Genomics (4.2)– BMC Evol. Biol. (4.1)– Physics of Life Rev. (-)
• 2009– 2 × Nucleic Acids Res. (6.9)– Structure (5.2)– BMC Genomics (4.2)– 2 × J Bacteriology (4.0)
Участники
• А.А.Миронов (АС – РНК, положительный отбор)
• Д.Д.Первушин (РНК и АС)• А.Г.Витрещак (Т-боксы)• Д.А.Родионов
(транспортеры)
• В.Е.Раменский, ИМБ (АС – положительный отбор)
• V.Raker, Барселона (РНК и АС – эксперимент)
• A.Osterman, Сан Диего (транспортеры)
• T.Eitinger, Берлин (транспортеры)
• А.Голанд• С.Денисов• Е.Ермакова• Ф.Еникеева• А.Е.Казаков• Г.Ковалева• Ю.Коростелев• Е.Курмангалиев• П.Мазин• Р.Нуртдинов• Е.Пермина• Д.Равчеев• А.Б.Рахманинова• С.Родионова• В.Сорокин• Е.Ставровская• Е.Храмеева• О.Цой
• Другие проекты программы МКБ:– И.И.Артамонова, ИОГен (CRISPR)– К.В.Северинов, ИБГ (фаги,
микроцины, Р-М системы)