Понятие (множественного) выравнивания

Preview:

DESCRIPTION

Понятие (множественного) выравнивания. ФББ МГУ, 2014г. Аксянов Е.А. Что такое выравнивание?. Дано 4 последовательности Найти общие мотивы. VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA - PowerPoint PPT Presentation

Citation preview

Понятие(множественного)

выравниванияФББ МГУ, 2014г.

Аксянов Е.А.

Выравнивания – 2014 2

• Что такое выравнивание?

Выравнивания – 2014 3

Дано 4 последовательностиНайти общие мотивы

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Выравнивания – 2014 4

Дано 4 последовательностиНайти общие мотивы

VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

ВНИМАНИЕ: в белке разрывов нет, нарисованное тут пустое

место – это на самом деле пептидная связь!

Выравнивания – 2014 5

Выравнивание – это способ изобразить

предполагаемое сходство последовательностей

Выравнивания – 2014 6

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?

Выравнивания – 2014 7

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Может ли такое сходство быть результатом случайности?

LNAMVLVATLRYKKLRQPLNYILVNVSFGGFLLCIFSVFPVFVASCN LNAMVLVATLRYKKLRQPLNYILVNVSFGGFLLCIFSVFPVFVASCN

Биологический смысл выравнивания

Может ли такое сходство быть результатом случайности?

Возьмем из банка первуюпопавшуюся последовательность ...

Выравнивания – 2014 8

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Может ли такое сходство быть результатом случайности?

Возьмем из банка вторуюпопавшуюся последовательность ...

CIIVVLQSKNSDIYMTVKEQSDIVHGIMSQCVLMKNVSRPCIIVVLQSKNSDIYMTVKEQSDIVHGIMSQCVLMKNVSRP

Биологический смысл выравнивания

Выравнивания – 2014 9

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Может ли такое сходство быть результатом случайности?

НЕТ! Можно повторить этот опыт со многими последовательностями, и почти нигде мы не найдем таких мотивов.

Это ЖЖЖ неспроста!

Биологический смысл выравнивания

Выравнивания – 2014 10

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Сходство последовательностей обычно свидетельствует об общности происхождения – гомологии. Все эти последовательности – гомологи, – то есть все они произошли от общего предка.

Можете предположить последовательность предка?

VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...

Биологический смысл выравнивания

Выравнивания – 2014 11

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Вообще говоря, судить об общем предке по 4м последовательностям нельзя. Но если взять много гомологичных последовательностей, то наши суждения будут надежнее!

VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...

Биологический смысл выравнивания

Выравнивания – 2014 12

Биологический смысл выравнивания

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Идентичные аминокислоты(тут замен, наверное, не было)

Похожие участки(в некоторых

позициях были замены)

Гэп (gap), то естьпептидная связь!(тут были вставки

или делеции)

Выравнивания – 2014 13

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Если взять много гомологичных последовательностей, то наши суждения будут надежнее!

Консервативные участки – это те, которые не изменились (или мало изменились – зависит от определения) в ходе эволюции.

VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...

Биологический смысл выравнивания

Если взять много гомологичных последовательностей, то наши суждения будут надежнее!

Неконсервативные участки менялись быстрее.

Если взять много гомологичных последовательностей, то наши суждения будут надежнее!

Гэпы соотвествуют вставкам или делециям (инделям). Не всегда можно уверенно сказать, чему именно.

Выравнивания – 2014 14

Участки выравнивания,где много совпадений

соответствуют консервативным

(медленно эволюционирующим)

участкам последовательностей

Выравнивания – 2014 15

Совпадение (match) аминокислот может

означать, что в данной позиции сохранилась

предковая последовательность

Выравнивания – 2014 16

Несовпадение (mismatch) аминокислот может

означать, что в данной позиции произошли

замены

Выравнивания – 2014 17

Гэпы соответствуют вставкам или делециям (вместе они называются

инделями)

Выравнивания – 2014 18

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?• Как изобразить выравнивание?

Выравнивания – 2014 19

Обычно выравнивание выглядит так

Раскраска – BLOSUM62

Выравнивания – 2014 20

Или так …

Раскраска – ClustalX

Выравнивания – 2014 21

Или так …

~1400 последовательностей, - почти в каждой позиции найдется какая-нибудь вставка хотя бы в одной

последовательности

Выравнивания – 2014 22

LOGO и консенсус

RqdIAxxlGlTrETVsRxLxБольшие буквы – почти консервативные позиции, Маленькие – менее консервативные позиции,х – неконсервативная позиция

(Эти обозначения в разных программах могут отличаться)

Выравнивания – 2014 23

Существуют разные способы изображения

выравнивания – различные раскраски,

консенсусные последовательности, LOGO

Выравнивания – 2014 24

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное

выравнивание?

Выравнивания – 2014 25

Пример хорошего выравнивания

Выравнивания – 2014 26

Пример плохого выравнивания

Выравнивания – 2014 27

Некоторые участки выравниваются хорошо, другие - плохо

Выравнивания – 2014 28

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

Эти аминокислоты навернякапроизошли от одной предковой

Выравнивания – 2014 29

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

И эти тоже

Выравнивания – 2014 30

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

А эти – вряд ли. Почему?

Выравнивания – 2014 31

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

Ответ: участки выравнивания (не отдельные колонки), со значительным сходством свидетельствуют об общности

происхождения

Выравнивания – 2014 32

Выравнивание или его участок, на котором много гэпов и мало совпадений

не имеет никакого биологического смысла

Выравнивания – 2014 33

Участки с большим количеством совпадений и маленьким числом гэпов соответствуют гомологии

между участками последовательностей

Выравнивания – 2014 34

В таких участках консервативные колонки соответствуют гомологии

между буквами

Выравнивания – 2014 35

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное

выравнивание?• Что свидетельствует о гомологии целых

последовательностей, отдельных участков и аминокислот?

Выравнивания – 2014 36

Гомология целых последовательностей, отдельных участков и аминокислот

БлокиБлок?Есть гомология

между буквами

КластерЕсть гомология

между участками

Выравнивания – 2014 37

Гомология целых последовательностей, отдельных участков и аминокислот

Тут гомологичны некоторые, но не все последовательности

Выравнивания – 2014 38

Гомология целых последовательностей, отдельных участков и аминокислот

1. Последовательности гомологичны целиком, т.к. есть относительно неплохое выравнивание по всей длине последовательностей.

2. Есть блоки без гэпов и высоким процентом консервативных позиций – там можно говорить о гомологии между отдельными аминокислотами. В том числе о гомологии между аминокислотам в неконсервативных позициях!

3. Есть короткие участки с гэпами между блоками. Можно говорить о гомологии между короткими фрагментами и длинными кластерами блоков.

4. Некоторые участки части последовательностей могут быть гомологичны, даже есть на данном участке выравнивания нет гомологии между всеми последовательностями.

Выравнивания – 2014 39

Три причины, по которым можно сделать вывод об общности происхождения участков из двух разных последовательностей:

1. Эти участки формируют консервативный блок в выравнивании.

2. Эти участки небольшого размера находятся между двумя консервативными блоками.

3. Это длинные участки, где наблюдается значительное сходство между этими двумя последовательностями

Выравнивания – 2014 40

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

Еще раз: совпадение отдельных букв может быть (и, скорее всего, является) случайностью. А вот совпадение или значительное сходство мотивов из 5-10 аминокислот (тем более, - протяженных доменов, длиной в десятки или сотни а.к.) не может объясняться случайными причинами.

Ищите в выравнивании длинных похожие участки. Выравнивание между ними имеет биологический смысл.

Выравнивание, где сходства между длинными участками нет, бессмысленно.

Выравнивания – 2014 41

Выравнивания. Термины• Выравнивание – сопоставление аминокислот из разных

последовательностей.• Колонка, последовательность.• Гомология – общность происхождения. Если

выравнивание построено правильно, то аминокислоты, расположенные в одной колонке, гомологичны.

• Консервативность – сильное сходство между последовательностями.

• Гэп – условное обозначение для всятавки или делеции. Никакого разрыва полипептидной цепи в последовательности, конечно, нет.

• Позиция в выравнивании (номер колонки), позиция в последовательности. Не путать!

Выравнивания – 2014 42

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное

выравнивание?• Что свидетельствует о гомологии целых

последовательностей, отдельных участков и аминокислот?

• Означает ли отсутствие достоверного выравнивания отсутствие гомологии?

Выравнивания – 2014 43

Пример плохого выравнивания

Выравнивания – 2014 44

Пример плохого выравнивания

1 2 3 4

Правомерно ли говорить о гомологии аминокислот в колонке 2? 3? 4?

НЕТ! Эти участки совершенно несходны.

Вопросы:Программа Muscle сумела построить выравнивание. Гомологичны ли последовательности?

НЕТ! Программа всегда что-нибудь построит.

Выравнивания – 2014 45

Пример плохого выравнивания

1 2 3 4

Правомерно ли говорить о гомологии аминокислот в колонке 2? 3? 4?

НЕТ! Эти участки совершенно несходны.

Правомерно ли говорить о гомологии аминокислот в колонке 1?

НЕТ! Это – очевидная случайность (участок вокруг этой колонки неконсервативен).

Выравнивания – 2014 46

Пример плохого выравнивания

1 2 3 4

Ни одна из колонок выравнивания не несет информации о родстве последовательностей. Значит, они неродственны?

НЕТ! Эти последовательности гомологичны. Это следует из

1. Структурного сходства (хотя и слабого).2. Общности функций.3. Сходства доменной архитектуры (это – С-концевые

домены α-амилаз).

Выравнивания – 2014 47

Вот, кстати, их “структурное” выравнивание.Между последовательностями нет ничего общего.Тоже одна консервативная колонка.

Выравнивания – 2014 48

Гомология между последовательностями может быть настолько

слабой, что ее невозможно обнаружить при помощи

выравнивания.

Выравнивания – 2014 49

Похожие последовательности обычно гомологичны

(но бывают исключения!).Непохожие

последовательности обычно негомологичны

(но бывают исключения!).

Recommended