49
Понятие (множественного) выравниван ия ФББ МГУ, 2014г. Аксянов Е.А.

Понятие (множественного) выравнивания

Embed Size (px)

DESCRIPTION

Понятие (множественного) выравнивания. ФББ МГУ, 2014г. Аксянов Е.А. Что такое выравнивание?. Дано 4 последовательности Найти общие мотивы. VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILA VLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILA - PowerPoint PPT Presentation

Citation preview

Page 1: Понятие (множественного) выравнивания

Понятие(множественного)

выравниванияФББ МГУ, 2014г.

Аксянов Е.А.

Page 2: Понятие (множественного) выравнивания

Выравнивания – 2014 2

• Что такое выравнивание?

Page 3: Понятие (множественного) выравнивания

Выравнивания – 2014 3

Дано 4 последовательностиНайти общие мотивы

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTALAPSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISALAPSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Page 4: Понятие (множественного) выравнивания

Выравнивания – 2014 4

Дано 4 последовательностиНайти общие мотивы

VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

VLSGGTTMYPGIADRMQKEITAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

ВНИМАНИЕ: в белке разрывов нет, нарисованное тут пустое

место – это на самом деле пептидная связь!

Page 5: Понятие (множественного) выравнивания

Выравнивания – 2014 5

Выравнивание – это способ изобразить

предполагаемое сходство последовательностей

Page 6: Понятие (множественного) выравнивания

Выравнивания – 2014 6

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?

Page 7: Понятие (множественного) выравнивания

Выравнивания – 2014 7

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Может ли такое сходство быть результатом случайности?

LNAMVLVATLRYKKLRQPLNYILVNVSFGGFLLCIFSVFPVFVASCN LNAMVLVATLRYKKLRQPLNYILVNVSFGGFLLCIFSVFPVFVASCN

Биологический смысл выравнивания

Может ли такое сходство быть результатом случайности?

Возьмем из банка первуюпопавшуюся последовательность ...

Page 8: Понятие (множественного) выравнивания

Выравнивания – 2014 8

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Может ли такое сходство быть результатом случайности?

Возьмем из банка вторуюпопавшуюся последовательность ...

CIIVVLQSKNSDIYMTVKEQSDIVHGIMSQCVLMKNVSRPCIIVVLQSKNSDIYMTVKEQSDIVHGIMSQCVLMKNVSRP

Биологический смысл выравнивания

Page 9: Понятие (множественного) выравнивания

Выравнивания – 2014 9

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Может ли такое сходство быть результатом случайности?

НЕТ! Можно повторить этот опыт со многими последовательностями, и почти нигде мы не найдем таких мотивов.

Это ЖЖЖ неспроста!

Биологический смысл выравнивания

Page 10: Понятие (множественного) выравнивания

Выравнивания – 2014 10

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Сходство последовательностей обычно свидетельствует об общности происхождения – гомологии. Все эти последовательности – гомологи, – то есть все они произошли от общего предка.

Можете предположить последовательность предка?

VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...

Биологический смысл выравнивания

Page 11: Понятие (множественного) выравнивания

Выравнивания – 2014 11

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Вообще говоря, судить об общем предке по 4м последовательностям нельзя. Но если взять много гомологичных последовательностей, то наши суждения будут надежнее!

VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...

Биологический смысл выравнивания

Page 12: Понятие (множественного) выравнивания

Выравнивания – 2014 12

Биологический смысл выравнивания

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Идентичные аминокислоты(тут замен, наверное, не было)

Похожие участки(в некоторых

позициях были замены)

Гэп (gap), то естьпептидная связь!(тут были вставки

или делеции)

Page 13: Понятие (множественного) выравнивания

Выравнивания – 2014 13

VLSGGTTMYPGIADRMQKEITAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIVDRMNKELTAL-----------APSTMKIKIIAPPERKYSVWIGGSILAVLSGGSTMFPGIADRMSKEISAL-----------APSSMKIKVVAPPERKYSVWIGGSILAVLSGGSTMYPGLPSRLERELKQLYLERVLKGDVDKLSKFKIRIEDPPRRKHMVFLGGAVLA

Если взять много гомологичных последовательностей, то наши суждения будут надежнее!

Консервативные участки – это те, которые не изменились (или мало изменились – зависит от определения) в ходе эволюции.

VLSGGSTM?PGI?DRM?KE??Alтут_ничего_не_было...

Биологический смысл выравнивания

Если взять много гомологичных последовательностей, то наши суждения будут надежнее!

Неконсервативные участки менялись быстрее.

Если взять много гомологичных последовательностей, то наши суждения будут надежнее!

Гэпы соотвествуют вставкам или делециям (инделям). Не всегда можно уверенно сказать, чему именно.

Page 14: Понятие (множественного) выравнивания

Выравнивания – 2014 14

Участки выравнивания,где много совпадений

соответствуют консервативным

(медленно эволюционирующим)

участкам последовательностей

Page 15: Понятие (множественного) выравнивания

Выравнивания – 2014 15

Совпадение (match) аминокислот может

означать, что в данной позиции сохранилась

предковая последовательность

Page 16: Понятие (множественного) выравнивания

Выравнивания – 2014 16

Несовпадение (mismatch) аминокислот может

означать, что в данной позиции произошли

замены

Page 17: Понятие (множественного) выравнивания

Выравнивания – 2014 17

Гэпы соответствуют вставкам или делециям (вместе они называются

инделями)

Page 18: Понятие (множественного) выравнивания

Выравнивания – 2014 18

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?• Как изобразить выравнивание?

Page 19: Понятие (множественного) выравнивания

Выравнивания – 2014 19

Обычно выравнивание выглядит так

Раскраска – BLOSUM62

Page 20: Понятие (множественного) выравнивания

Выравнивания – 2014 20

Или так …

Раскраска – ClustalX

Page 21: Понятие (множественного) выравнивания

Выравнивания – 2014 21

Или так …

~1400 последовательностей, - почти в каждой позиции найдется какая-нибудь вставка хотя бы в одной

последовательности

Page 22: Понятие (множественного) выравнивания

Выравнивания – 2014 22

LOGO и консенсус

RqdIAxxlGlTrETVsRxLxБольшие буквы – почти консервативные позиции, Маленькие – менее консервативные позиции,х – неконсервативная позиция

(Эти обозначения в разных программах могут отличаться)

Page 23: Понятие (множественного) выравнивания

Выравнивания – 2014 23

Существуют разные способы изображения

выравнивания – различные раскраски,

консенсусные последовательности, LOGO

Page 24: Понятие (множественного) выравнивания

Выравнивания – 2014 24

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное

выравнивание?

Page 25: Понятие (множественного) выравнивания

Выравнивания – 2014 25

Пример хорошего выравнивания

Page 26: Понятие (множественного) выравнивания

Выравнивания – 2014 26

Пример плохого выравнивания

Page 27: Понятие (множественного) выравнивания

Выравнивания – 2014 27

Некоторые участки выравниваются хорошо, другие - плохо

Page 28: Понятие (множественного) выравнивания

Выравнивания – 2014 28

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

Эти аминокислоты навернякапроизошли от одной предковой

Page 29: Понятие (множественного) выравнивания

Выравнивания – 2014 29

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

И эти тоже

Page 30: Понятие (множественного) выравнивания

Выравнивания – 2014 30

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

А эти – вряд ли. Почему?

Page 31: Понятие (множественного) выравнивания

Выравнивания – 2014 31

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

Ответ: участки выравнивания (не отдельные колонки), со значительным сходством свидетельствуют об общности

происхождения

Page 32: Понятие (множественного) выравнивания

Выравнивания – 2014 32

Выравнивание или его участок, на котором много гэпов и мало совпадений

не имеет никакого биологического смысла

Page 33: Понятие (множественного) выравнивания

Выравнивания – 2014 33

Участки с большим количеством совпадений и маленьким числом гэпов соответствуют гомологии

между участками последовательностей

Page 34: Понятие (множественного) выравнивания

Выравнивания – 2014 34

В таких участках консервативные колонки соответствуют гомологии

между буквами

Page 35: Понятие (множественного) выравнивания

Выравнивания – 2014 35

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное

выравнивание?• Что свидетельствует о гомологии целых

последовательностей, отдельных участков и аминокислот?

Page 36: Понятие (множественного) выравнивания

Выравнивания – 2014 36

Гомология целых последовательностей, отдельных участков и аминокислот

БлокиБлок?Есть гомология

между буквами

КластерЕсть гомология

между участками

Page 37: Понятие (множественного) выравнивания

Выравнивания – 2014 37

Гомология целых последовательностей, отдельных участков и аминокислот

Тут гомологичны некоторые, но не все последовательности

Page 38: Понятие (множественного) выравнивания

Выравнивания – 2014 38

Гомология целых последовательностей, отдельных участков и аминокислот

1. Последовательности гомологичны целиком, т.к. есть относительно неплохое выравнивание по всей длине последовательностей.

2. Есть блоки без гэпов и высоким процентом консервативных позиций – там можно говорить о гомологии между отдельными аминокислотами. В том числе о гомологии между аминокислотам в неконсервативных позициях!

3. Есть короткие участки с гэпами между блоками. Можно говорить о гомологии между короткими фрагментами и длинными кластерами блоков.

4. Некоторые участки части последовательностей могут быть гомологичны, даже есть на данном участке выравнивания нет гомологии между всеми последовательностями.

Page 39: Понятие (множественного) выравнивания

Выравнивания – 2014 39

Три причины, по которым можно сделать вывод об общности происхождения участков из двух разных последовательностей:

1. Эти участки формируют консервативный блок в выравнивании.

2. Эти участки небольшого размера находятся между двумя консервативными блоками.

3. Это длинные участки, где наблюдается значительное сходство между этими двумя последовательностями

Page 40: Понятие (множественного) выравнивания

Выравнивания – 2014 40

Выравнивание - описание того, каким образом похожи друг на друга

гомологичные последовательности

Еще раз: совпадение отдельных букв может быть (и, скорее всего, является) случайностью. А вот совпадение или значительное сходство мотивов из 5-10 аминокислот (тем более, - протяженных доменов, длиной в десятки или сотни а.к.) не может объясняться случайными причинами.

Ищите в выравнивании длинных похожие участки. Выравнивание между ними имеет биологический смысл.

Выравнивание, где сходства между длинными участками нет, бессмысленно.

Page 41: Понятие (множественного) выравнивания

Выравнивания – 2014 41

Выравнивания. Термины• Выравнивание – сопоставление аминокислот из разных

последовательностей.• Колонка, последовательность.• Гомология – общность происхождения. Если

выравнивание построено правильно, то аминокислоты, расположенные в одной колонке, гомологичны.

• Консервативность – сильное сходство между последовательностями.

• Гэп – условное обозначение для всятавки или делеции. Никакого разрыва полипептидной цепи в последовательности, конечно, нет.

• Позиция в выравнивании (номер колонки), позиция в последовательности. Не путать!

Page 42: Понятие (множественного) выравнивания

Выравнивания – 2014 42

• Что такое выравнивание?• В чем биологический смысл выравнивания и

отдельных его элементов?• Как изобразить выравнивание?• Что такое достоверное и недостоверное

выравнивание?• Что свидетельствует о гомологии целых

последовательностей, отдельных участков и аминокислот?

• Означает ли отсутствие достоверного выравнивания отсутствие гомологии?

Page 43: Понятие (множественного) выравнивания

Выравнивания – 2014 43

Пример плохого выравнивания

Page 44: Понятие (множественного) выравнивания

Выравнивания – 2014 44

Пример плохого выравнивания

1 2 3 4

Правомерно ли говорить о гомологии аминокислот в колонке 2? 3? 4?

НЕТ! Эти участки совершенно несходны.

Вопросы:Программа Muscle сумела построить выравнивание. Гомологичны ли последовательности?

НЕТ! Программа всегда что-нибудь построит.

Page 45: Понятие (множественного) выравнивания

Выравнивания – 2014 45

Пример плохого выравнивания

1 2 3 4

Правомерно ли говорить о гомологии аминокислот в колонке 2? 3? 4?

НЕТ! Эти участки совершенно несходны.

Правомерно ли говорить о гомологии аминокислот в колонке 1?

НЕТ! Это – очевидная случайность (участок вокруг этой колонки неконсервативен).

Page 46: Понятие (множественного) выравнивания

Выравнивания – 2014 46

Пример плохого выравнивания

1 2 3 4

Ни одна из колонок выравнивания не несет информации о родстве последовательностей. Значит, они неродственны?

НЕТ! Эти последовательности гомологичны. Это следует из

1. Структурного сходства (хотя и слабого).2. Общности функций.3. Сходства доменной архитектуры (это – С-концевые

домены α-амилаз).

Page 47: Понятие (множественного) выравнивания

Выравнивания – 2014 47

Вот, кстати, их “структурное” выравнивание.Между последовательностями нет ничего общего.Тоже одна консервативная колонка.

Page 48: Понятие (множественного) выравнивания

Выравнивания – 2014 48

Гомология между последовательностями может быть настолько

слабой, что ее невозможно обнаружить при помощи

выравнивания.

Page 49: Понятие (множественного) выравнивания

Выравнивания – 2014 49

Похожие последовательности обычно гомологичны

(но бывают исключения!).Непохожие

последовательности обычно негомологичны

(но бывают исключения!).