Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
МОДЕЛЬ 7.
Гомологи, Ортологи и Парологи.
Поиск исчезнувших или возникших генов:
регенерация тканей, развитие конечного мозга,
долгожительство, неотения и т.д.
наши дни
время послед. общегопредка видов 1 и 2
Г1 Г2 Г3⋯ ~ ⋯ ~ ⋯ ~ ⋯
Г1 Г2⋯ ~ ⋯ ~ ⋯
Г1⋯ ~ ⋯
ГЕН⋯ — ⋯
ВИД 1 ВИД 2
← относит сохранение
← изменение
← дупликация
Г0⋯ — ⋯
Г1⋯— ⋯
Г5 Г1⋯ ≈ ⋯ ~ ⋯
Г2 Г1⋯ ~ ⋯ ~ ⋯
× Г1⋯ ⋯ ~ ⋯потеря →
перенос →
видообразование →
дупликация →
Кстати, каким был LUCA?
Важно строить сценарий
эволюции (=какие эвол
события случились.
Биологически ортологи происходят в результате эволюцион-
ного события – видообразования (бывшего когда-то): в тот
момент весь геном разошёлся и затем каждый ген менялся по
своему. Гены-ортологи находятся в разных видах. Они отчасти
похожи по последовательности.
Бывают и другие эволюционные события, также приводящие к
похожести генов/белков. А именно, в том же самом виде ген
дуплицируется и каждая копия развивается по своему, обра-
зуются in-паралоги (=паралоги). Гены-паралоги находятся в
одном виде. Они также похожи по последовательности.
Ортологи и Парологи имеют разное происхождение; они отли-
чаются по функции!, хотя можно ожидать, что и в какой-то
мере сходны по ней.
Например, разные паралоги экспрессируются (читаются) в
разных условиях, в разных тканях, на разных этапах развития
организма, имеют разную экспрессию (уровни чтения) и т.д.
Ортологи и Паралоги (гены, белки) похожи (=гомологич-
ны) в какой-то мере по последовательности после вырав-
нивания. Пример на следующем слайде.
Orthologs and Paralogs are two types of homologous sequences.
Orthology describes genes in different species that derive from a
common ancestor. Orthologous genes may or may not have the
same function. Paralogy describes homologous genes within a
single species that diverged by gene duplication.
Пример паралогов, ортологов и гомологов:
Принципиально: всё это – умозрительные описания.
Как фактически определять:
кто есть ортологи и кто паралоги???!---------------------------------------------------------------------------------------------------------------
О другом:
ещё важное эволюционное событие – образование
out-паралогов (=горизонтальных переносов).
Ещё типы эволюционных событий:
потери и возникновения генов,
деление гена на части и объединение генов вместе
Таблицы ортологов и паралогов для многих видов
имеются в базе Ensembl, но это один из вариантов их
определения.
Мы это умеем делать и по другому: реконструкцией по
дереву хромосомных структур
ИЛИ даже ещё по другому при решении задачи о
потери генов, которая будет рассматриваться ниже.
Важнейшее понятие – «тот же самый» ген (= соответст-
вие генов в разных видах, =ортологичность). Оно часто
определяется по близости нуклеотидных последователь-
ностей после их выравнивания (двух или нескольких).
Часто учитывается ещё расположение интронов в
генах.
Или: по близости после выравнивания аминокислотных
последовательностей, кодируемых этими генами белков.
Но оказывается близости генов недостаточно для
решения вопроса, тот же ли это самый ген.
Что такое «тот же самый» ген (=белок)?
Итак, ген Х' – «тот же самый» в b, что и Х из а, если Х' и Х
не только похожи по последовательности, но в окрестнос-
тях Х' и Х фиксированного размера имеются: 2 гена около
Х соот-но похожих на 2 гена около Х' («свидетели» для Х).
[Наличие свидетелей называется синтенией: это – сохра-
нение совместной локализации генов у разных видов.]
В ходе эволюции переносы генов по хромосоме (трансло-
кации) могут лишить Х свидетелей или наоборот создать
их; в результате чего происходит потеря/возникновение
синтении.
Для эукариотических геномов мы не различаем направле-
ния генов (т.е. цепи ДНК) и расположения свидетелей.
Если в последовательности по некоторым
признакам похожей на ген много стопов-кодонов,
то это псевдоген!
У человека имеется псевдоген SMPD5P и ген
Smpd3. А у мыши оба они гены.
Каково их соответствие у человека и мыши
(не пользуясь именами)?
Свидетели помогают ответить на вопрос,
см. след слайд.
Ген Smpd5 мыши соответствует псевдогену SMPD5P челове-
ка (показан серым). Выравнивание локусов, содержащих эти
ген и псевдоген Smpd5 у мыши и человека. Сохранился сосе-
дний ген Oplah, как и другие гены-соседи.
Аналогичны и экзоны. На рисунках экзоны – толстые прямоу-
гольники
Выравнивание локусов, содержащих гены Smpd3 у мыши и
человека с сохранением соседних генов Slc7a6os и Prmt7.
Кроме того, в генах Smpd3 сохранились многие экзоны и
интроны.
Гены мыши Smpd5 (ENSMUSG00000071724) и Smpd3
(ENSMUSG00000031906) – паралоги, кодирующие белок
сфингомиелиназа (работающий в нейтральной среде).
Наибольшая экспрессия гена Smpd5 наблюдается в семенни-
ках, а у гена Smpd3 – во многих тканях, включая головной
мозг. [Сфингомиелиназа участвует в образовании пор из
церамида, через которые в синаптическую цель освобождают-
ся нейромедиаторы (Alessenko, 2013).]
Человек «после» мыши: у человека сохранился только ген
Smpd3, а на месте гена Smpd5 расположился псевдоген, не
кодирующий белок. Потеря гена Smpd5, а не его паралога
Smpd3, определяется по соседям= по геномному контексту =
по синтении.
[У мыши ген Smpd5 расположен на хромосоме 15, а ген Smpd3
– на хромосоме 8.]
Понятие синтении имеет несколько сходных трактовок, мы
рассмотрим одну из них.
Задача: для гена Х из вида а решить, сохранился ли он в
виде b; нужно среди многих его гомологов в виде b
найти ген Y с учётом свидетелей =сохранения
соседей = синтении у Х; при этом хорошо бы учесть
паралоги Х в а и Y в b.
Зачем?
Идея: найти гены Х в виде а, которые в период жизни а
и около того были, а после этого времени утратили-
сь! Сам этот момент выбирается на шкале времени.
Для этого проверяется «двухвидовое» условие :
а
b
Но как определять ортологи?
выбирается вид а, который называется базисным
(например, лягушка или мышь).
В нём перебираются все белок кодирующие гены Х и для
текущего X в указанном другом виде b проверяется:
в b имеется ген X', похожий по последовательности на X;
а в окрестности X радиуса r имеется р различных генов-
свидетелей, например, Y и Z, у которых имеются
хорошие гомологи Y' и Z' в окрестности X' радиуса r'.
Это условие называется двухвидовым.
Итак, один из наших алгоритмов основан на:
Гены, утраченные в связи с ослаблением
регенеративной потенции и развитием конечного мозга
у плацентарных (=высших млекопитающих),
у млекопитающих против более ранних видов,
у амниот против анамниот (амфибий и рыб)
(см. слайд 14 –
там можно выбрать, где провести границу).
Роль генов Ag1, Ras-dva1 и Noggin4 в регенерации?
=амниоты
Ag1, Ras-dva1 и Noggin4 вызывают экспрессию регулятора (гена
FoxG1) вентральной (верхняя) области конечного мозга. Нервная
пластинка – зачаток ЦНС. Pallium – кора головного мозга.
контроль
FoxG1 ингибирует развитие дорсальной (задней) области конечного
мозга. Можно предположить: исчезновение Ag1, Ras-dva1 и Noggin4 у
предков высших позвоночных привело к снижению уровня
экспрессии FoxG1, что, стимулировало развитие дорсальной области
конечного мозга.
Подавление генов Ag1, Ras-dva1 или Noggin4 у эмбриона шпорцевой
лягушки вызывает ингибирование экспрессии гена FoxG1 и стимулирует
деление клеток, что приводит к увеличению размеров конечного мозга.
развитие
Эти данные согласуются с гипотезой о том, что исчезновение генов Ag1, Ras-
dva1 и Noggin4 у предков высших позвоночных могло быть одной из причин
увеличения у них дорсальной области конечного мозга.
Итак, ищем гены Х лягушки, представленные у рыб, но
утраченные (в той или иной мере) эволюционно выше.
Отбор только по сходству последовательностей
(по гомологии) недостаточен:
ближайшиегомологи
ближайшиегомологи
Отбор по гомологии с учётом свидетелей лучше:
Трёхвидовое условие: а – базисный вид (лягушка),
b – соседний к а вид (рыба), с – высший вид (homo):
а
b
c
Отрицание трёхвидового условия для поиска
утраченных генов:
ген Х со свидетелями не представлен «вверх»
(иначе – достаточно двухвидового условия), но Х
представлен в базисном виде а (лягушке) и ген U –
«заменитель» Х в рыбе b и U представлен «вверх» в
с (например, в человеке или морской свинки).
Пример – на след слайде с – морская свинка.
ENSGACG00000007608
ENSGACP00000010090
fzd9b
Cavia
porcellus
Xenopus
tropicalis
Gasterosteus
aculeatus
ENSCPOG00000011826
ENSCPOP00000018492
FZD9
ENSXETG00000023966
ENSXETP00000051708
sfrpx
нет синтении с
млекопитающими
BBH
9.0E-104
BBH
4.0E-100
…23967
…51709
LRTOMT
…23968
…51710
folr1
…7832
…10380
LRTOMT
…7809
…10359
FOLR1
…174
…151
SERPINE1
…1746
…1577
ACHE
…7161
…9482
serpini1
…7230
…9613
BCHE
BBH
0
3.0E-59
3.0E-23
BBH
0
scaffold 30
groupI
GL174277.1
Трёхвидовое условие через BLAST
Ген ENSXETG00000023966 (sfrpx) потерян у птиц и плацен
млекопитающих, но имеет «заменителя» – ген fzd9b у рыбы
Gasterosteus aculeatus (трёхиглой колюшки), который
представлен как FZD9 у морской свинки Cavia porcellus (при
определённом понимании связей =стрелок).
Показан локус в геноме лягушки – базисный вид:
Этот ген сохранился у черепахи Pelodiscus sinensis,
лягушки, рыб. Он содержит богатый цистеином
экстрацеллюлярный домен (C6 box), типичный для
рецептора MuSK.
Гены, утраченные у видов с высокой
продолжительностью жизни (ПЖ)
и с подобными особенностями
Выполнен поиск генов мыши, которые сохранились
с учётом геномной синтении у грызунов или кролика,
а также у приматов с малой ПЖ, но пропали у голого
землекопа, дамарского пескороя, человека,
человекообразных обезьян и капуцина,
т.е. у видов с относительно высокой ПЖ.
Присутствие гена хотя бы у двух приматов
существенно, чтобы исключить гены, специфичные
для грызунов – родственников мыши.
Видовая продолжительность жизни (ПЖ) в годах
для некоторых видов с учётом их размера
Знак – показывает утрату найденных у мыши генов.
Знак + наличие этих генов. Сами гены не приведены.
Вид ПЖ
серая крыса 3,8 +
сирийский хомячок 3,9 +
домовая мышь 4 +
европейский кролик 9 +
дамарский пескорой 15,5 –
голый землекоп 32 –
Вид ПЖ
галаго Гарнетта 15,7 +
филиппинский долгопят 16 +
серый мышиный лемур 18,2 +
обыкновенная игрунка 22,8 +
белощёкий хохлатый гиббон 44,1 –
белоплечий капуцин 54,8 –
бонобо 55
суматранский орангутан 58 –
шимпанзе 59,4 –
западная равнинная горилла 60,1 –
человек разумный 122,5 –
Многие гены мыши, потерянные
у видов с высокой ПЖ, в
наибольшей степени
экспрессируются в семенниках.
Данные об экспрессии генов
приведены в базе данных
Expression Atlas
https://www.ebi.ac.uk/gxa/home
Но небольшой уровень экспрессии найденных генов
обычно наблюдается во многих органах. Эти гены
могут быть потенциально опасны, если соответству-
ющие белки накапливаются в течение длительного
времени. При этом онкологические и нейродегенера-
тивные заболевания развиваются достаточно
медленно, чтобы не оказывать существенного
воздействия на молодые организмы.
[Иными словами, можно предполагать обнаружение
новых примеров антагонистической плейотропии,
т.е. противоположных фенотипических эффектов
одного гена (Williams 1957).]
Ещё один ген Wap из нашей таблицы кодирует whey
acidic protein (WAP). Этот белок впервые описан в
молозиве коров (Bezkorovainy 1965). WAP в небольшом
количестве присутствует в молоке мышей и составляет
значительную долю белка в молоке кроликов. WAP
ингибирует рост бактерий Staphylococcus aureus, а
также ингибирует пролиферацию mammary epithelial
cells (Seki et al. 2012).
Возможно, потеря этого гена у видов с высокой ПЖ
связана с увеличением продолжительности кормления
детёнышей молоком.