View
236
Download
2
Embed Size (px)
Citation preview
IV семестр «Функция и эволюция» БЛОК 1 «Эволюция» – 4 занятия
• Молекулярная филогенетика. Задачи и подходы. Лекция-семинар, 13.02. (АБР)
• Реконструкция филогенетических деревьев. 2 практических занятия, 20.02 и 27.02 (САС, АБР)
• «Алгоритмы реконструкции филогенетических деревьев». Лекция, семинар, обсуждение полученных результатов, 6.03 (САС).
Срок сдачи основного отчета – 5.03 БЛОК 2 «Функции генов и их
продуктов» – 4 занятия БЛОК 3 «Эволюция белкового
семейства» – 5 занятий
Biologists must constantly keep in mind that what they see was not designed, but rather evolved. It might be thought, therefore, that evolutionary arguments would play a large part in guiding biological research, but this is far from the case. Francis Crick What Mad Pursuit (1988) pp.138-139
Вы это уже делали! Прокомментируйте…
Весна, 2007, А.Б.Рахманинова
MYG_HETPO/ : MYG_GALGA/ : MYG_ALLMI/ : MYG_CYPCA/ : HBA_HETPO/ : HBA1_TORMA : HBA_SQUAC/ : HBA_LEPPA/ : HBA1_BOSMU : HBAT_HORSE : HBA1_IGUIG : HBAZ_CAPHI : HBA3_PLEWA : HBAD_PASMO : HBAD_LIOMI : HBA1_XENBO : HBA1_PLEWA : HBA_CATCL/ : HBB1_XENBO : HBB_RANCA/ : HBB2_XENLA : HBB0_MOUSE : HBBN_AMMLE : HBB_ALLMI/ : HBB1_CYGMA : HBB_LEPPA/ : HBB_SQUAC/ : HBB_HETPO/ : HBAM_RANCA :
* 20 * 40 * 60 * 80 EWEHVNKVWAVVEPDIPAVGLAILLRLFKEHKETKDLFPKF-KE-IPVQQLGNNEDLRKHGVTVLRALGNILKQ------KGKHSTNVKDWDKVNSVWSAMEANITAVGQNILLRLFEQYPESQSYFPKL-KN-KSLGELKDTADIKAQADTVLKALGNIVKK------KGNHSQPVKEWKHVLDIWTKVESKLPEHGHEVIIRLLQEHPETQERFEKF-KHMKTADEMKSSEKMKQHGNTVFTALGNILKQ------KGNHAEVLKDAELVLKCWGGVEADFEGTGGEVLTRLFKQHPETQKLFPKF-VG-IASNELAGNAAVKAHGATVLKKLGELLKA------RGDHAAILKDRAELAALSKVLAQNAEAFGAEALARMFTVYAATKSYFKDY-KDFT-----AAAPSIKAHGAKVVTALAKACDHL-----D-DLKTHLHNKKAIKNLLQKIHSQTEVLGAEALARLFECHPQTKSYFPKF-SGFS-----ANDKRVKHHGALVLKALVDTNKHL-----D-DLPHHLNDKTAIKHLTGSLRTNAEAWGAESLARMFATTPSTKTYFSKF-TDFS-----ANGKRVKAHGGKVLNAVADATDHL-----D-NVAGHLDDEVLIKEAWGLL-HQIPNAGGEALARMFSCYPGTKSYFPHFGHDFS-----ANNEKVKHHGKKVVDAIGQGVQHL-----H-DLSSCLHDKGNVKAAWGKVGGHAAEYGAEALERMFLSFPTTKTYFPHF--DLS-----QGSAQVKGHGAKVAAALTKAVEHL-----D-DLPGALSDRATVRALWKKMGSNVGVYATEALERMFLGFPSTTTYFLHL--DLS-----LGSTQVKAHGQKVADALTLAVEHL-----E-DLPRALSDKNHIRAIWGHVDNNPEAFGVEALTRLFLAYPATKTYFAHF--DLN-----PGSAQIKAHGKKVVDALTQAVNNL-----D-DIPDALAERTIILSLWSKISTQADVIGTETLERLFSCYPQAKTYFPHF--DLH-----SGSAQLRAHGSKVVAAVGDAVKSI-----D-NVTSALSEKALVVGLCGKISGHCDALGGEALDRLFASFGQTRTYFSHF--DLS-----PGSADVKRHGGKVLSAIGEAAKHI-----D-SMDQALSDKKLIQQIWGKLGGAEEEIGADALWRMFHSYPSTKTYFPHF--DLS-----QGSDQIRGHGKKVVAALSNAIKNL-----D-NLSQALSDRRLLQASVGKLGCRLEDIGADALNRLLITFPQSKTYFSHF--NLS-----PGSKDIIHQGEKVGKALDSALKHL-----D-DIRGTLSDKKHIKAIMPSIAAHGDKFGGEALYRMFLVNPKTKTYFPTF--DFH-----HNSKQISAHGKKVVDALNEASNHL-----D-NIAGSLSDKHNVKAIWDHVKGHEEAIGAEALYRMFCCMPTTRIYFPAK--DLS-----ERSSYLHSHGKKVVGALTNAVAHI-----D-DIDTAFSDKADVKIAWAKISPRADEIGAEALGRMLTVYPQTKTYFAHW-ADLS-----PGSGPVKHGKKVIMGAIGDAVTKF-----D-DLLGGLADRQLINSTWGKV--CAKTIGKEALGRLLWTYPWTQRYFSSF-GNLNSADAVFHNEAVAAHGEKVVTSIGEAIKHM-----D-DIKGYYAGGSDVSAFLAKV--DKRAVGGEALARLLIVYPWTQRYFSTF-GNLGSADAISHNSKVLAHGQRVLDSIEEGLKHP-----Z-BLKAYYAEKAAITSVWQKV--NVEHDGHDALGRLLIVYPWTQRYFSNF-GNLSNSAAVAGNAKVQAHGKKVLSAVGNAISHI-----D-SVKSSLQEKAAITSIWDKV--DLEKVGGETLGRLLIVYPWTQRFFDKF-GNLSSAQAIMGNPRIKAHGKKVLTSLGLAVKNM-----D-NLKETFABKALITGFWSKV--KVBZVGAZALGRLLVVYPWTZRFFZHF-GBLSSABAVMBBAKVKAHGKKVLBSFSBGLKHL-----B-BLKGAFAERKFIVDLWAKV--DVAQCGADALSRMLIVYPWKRRYFEHF-GKMCNAHDILHNSKVQEHGKKVLASFGEAVKHL-----D-NIKGHFAELTIINDIFSHL--DYDDIGPKALSRCLIVYPWTQRHFSGF-GNLYNAEAIIGNANVAAHGIKVLHGLDRGLKNM-----D-NIVDAYAEKQYIVSVFSKI--DVDHVGANTLERVLIVFPWTKRYFNSF-GDLSSPGAIKHNNKVSAHGRKVLAAIIECTRHF-----G-NIKGHLAEKALVNAVWTKT--DHQAVVAKALERLFVVYPWTKTYFVKFNGKFH-----ASDSTVQTHAGKVVSALTVAYNHI-----D-DVKPHFVELHEITTTWKSI--DKHSLGAKALARMFIVYPWTTRYFGNL-KEFT-----ACSYGVKEHAKKVTGALGVAVTHL-----G-DVKSQFTEKSAVASLWEKIAPQTNKLGAESMERLFKNHPETKSFFSRF--DIS-----PGSQDLLTHGGKIFGALGEAIKSL----------DNLQ 6 g 6 R p F 6 hg 6
: 81 : 81 : 82 : 81 : 77 : 77 : 77 : 77 : 76 : 76 : 76 : 76 : 76 : 76 : 76 : 76 : 76 : 77 : 80 : 80 : 80 : 80 : 80 : 80 : 80 : 80 : 76 : 75 : 72
Весна, 2007, А.Б.Рахманинова
Молекулярная эволюция (молекулярная филогенетика)
Молекулярная филогенетика
─ изучение филогенеза и эволюции путем анализа нуклеотидных и аминокислотных последовательностей
Основные этапы биоинформатического анализа молекулярной эволюции Выбор последовательностей и их выравнивание Построение/выбор эволюционной модели Реконструкция эволюции
реконструкция филогенетического дерева оценка силы давления и направления отбора сравнение скоростей эволюции ...
Оценка статистической значимости реконструкции
?
Весна, 2007, А.Б.Рахманинова
Что будет?
Выбор последовательностей и их выравнивание Построение/выбор эволюционной модели Реконструкция эволюции
реконструкция филогенетического дерева оценка силы давления и направления отбора сравнение скоростей эволюции ...
Оценка статистической значимости реконструкции
!
Весна, 2007, А.Б.Рахманинова
Выбор последовательностей и их выравнивание
Весна, 2007, А.Б.Рахманинова
# Length: 502 # Identity: 286/502 (57.0%) # Similarity: 286/502 (57.0%) # Gaps: 119/502 (23.7%) # Score: 678.5 #======================================= CAA32220| 1 atggttcatttcacagctgaggagaaggcagct-atcacaagcatctggg 49 |||| .|||.|||||..|.|| ..|.||||| ||||..||||.||||| AAA49655| 1 atgg---gtttgacagcacatga-tcgtcagctgatcaacagcacctggg 46 CAA32220| 50 ataaagt--------ggac--ttggaaaaagttggaggagaaactctggg 89 ..||||| .||| |.|||||| |||| |.||.|| AAA49655| 47 gcaaagtatgtgccaagactataggaaaa-----gagg-----cccttgg 86 CAA32220| 90 aaggctcctgattg--tttacccatggactcagaggttctttgacaaa-- 135 |.|.||.||| || .|||.||.|||||.||.||.|.|||| | AAA49655| 87 acgtctgctg--tggacttatccctggacccaaagatacttt-----agt 129 CAA32220| 136 ---tttggaaacctctcttctgcccaagccatcatgggtaatcccagaat 182 |||||.||||||.....|||..|.|||.|| |.|||.||| AAA49655| 130 tcttttgggaacctcaacagtgctgacgccgtc--------ttccacaat 171 CAA32220| 183 caa--------agcccatggcaagaaagtgctgacatccctgggcttggc 224 .|| .||.|||||..|.||.|||.|||||||..|.||...||| AAA49655| 172 gaagcagtggctgctcatggtgaaaaggtggtgacatctattggagaggc 221
Выравнивание ?
Весна, 2007, А.Б.Рахманинова
# Length: 444 # Identity: 248/444 (55.9%) # Similarity: 248/444 (55.9%) # Gaps: 3/444 ( 0.7%) # Score: 468.0 #======================================= CAA32220| 1 atggttcatttcacagctgaggagaaggcagctatcacaagcatctggga 50 .|...|||.|||||..|.||..........||||..||||.|||||. AAA49655| 1 ---atgggtttgacagcacatgatcgtcagctgatcaacagcacctgggg 47 CAA32220| 51 taaagtggacttggaaaaagttggaggagaaactctgggaaggctcctga 100 .|||||........|.|...|.|||..|||..|.||.|||.|.||.|||. AAA49655| 48 caaagtatgtgccaagactataggaaaagaggcccttggacgtctgctgt 97 CAA32220| 101 ttgtttacccatggactcagaggttctttgacaaatttggaaacctctct 150 ....|||.||.|||||.||.||.|.||||......|||||.||||||... AAA49655| 98 ggacttatccctggacccaaagatactttagttcttttgggaacctcaac 147 CAA32220| 151 tctgcccaagccatcatgggtaatcccagaatcaaagcccatggcaagaa 200 ..|||..|.|||.||.|....|||.....|.|....||.|||||..|.|| AAA49655| 148 agtgctgacgccgtcttccacaatgaagcagtggctgctcatggtgaaaa 197 CAA32220| 201 agtgctgacatccctgggcttggcagttaagaacatggacaacctcaagg 250 .|||.|||||||..|.||...|||..|.|||.|||||||..||.|.|||| AAA49655| 198 ggtggtgacatctattggagaggccatcaagcacatggatgacattaagg 247
Выбор последовательностей и их выравнивание
Весна, 2007, А.Б.Рахманинова
Что делать?
Весна, 2007, А.Б.Рахманинова
tranalign
PAL2NAL (
http://coot.embl.de/pal2nal/)
!
Эволюционная модель - математическая модель, описывающей изменения последовательностей во времени.
Число эволюционных событий оценивают, сравнивая 2 родственные последовательности
Наблюдаемое число различий между последовательностями меньше реального числа из-за повторных мутаций
Резюме: чтобы оценить реальное число событий нужна модель.
Нужна поправка
Однопараметрическая модельДжукса-Кантора (1969)
PA(t=0) =PA(0) =1
P A(1) =1-3
PA(2) = PA(1) (1-3) +(1- PA(1) ) ……………..
Djc = -b ln (1 - D/b)
Djc – расстояние по Джуксу-Кантору (число
событий за время t)
b – константа, для нуклеотидных последовательностей b=3/4
D – неоткорректированные расстояния (в простейшем случае, это доля несовпадающих букв)
Вероятность А в момент t
PA(t=0) =PA(0)=1
PA(1) =1-3
PA(2) = PA(1) (1-3) +(1- PA(1) )
PA(t+1) = PA(t) (1-3) + (1- PA(t))
= - 4 PA(t) +
PA(t) = 1/4 + (PA(0) -1/4) e -4t
PA(t) = 1/4 + 3/4 e-4t для PA(0)=1
PA(t) = 1/4 - 1/4 e-4t для PA(0)=0
dPA(t)
dt——
Расстояние до предковой последовательности
1. Модель предполагает, что в 1 позиции в единицу времени происходит 3
замен.2. Прошло время t, Djc – общее число
замен/позицию за время t.3. Доля совпадений/позицию между
предковой и настоящей последовательностью?
4. Доля несовпадений/позицию между предковой и настоящей последовательностью?
5. Расстояние между предковой и настоящей последовательностью в смысле ожидаемого числа замен за время t (Djc ) - ?
Однопараметрическая модель Джукса-Кантора
Двухпараметрическая модельМ.Кимура (1980)
distance = -0.5 ln[ (1-2P-Q)*sqrt(1-2Q)] P = transitions/nposQ = transversions/npos
трансверсия транзиция
Чем точнее модель, тем лучше результат?
?
по материаламSimon Whelan, Pietro Lio and Nick Goldman"Molecular phylogenetics: state-of-theartmethods for looking into the past"TRENDS in Genetics Vol.17 No.5 May 2001
Сравнение скоростей эволюции разных генов
1. Thr-Ser-Ala…
1.Thr-Ser-Ala…
2. Thr-Ser-Ala…
2.Pro-Arg-Asp…
1. ACT AGT GCC…
1. ACT AGT GCC…
2. ACA AGC GCT…
2. CCT AGA GAC…
?
Весна, 2007, А.Б.Рахманинова
KA/KS – мера давления естественного отбора Сравниваем 2 наблюдения:
ATG GGG GCT GGG ATA GGA GAT GGA
Несинонимичные замены 1 1 Синонимичные замены 1 1
KA/KS =1 KA/KS =1 ?
Ожидаемые значения: PA 5/6 4/6 Ps 1/6 2/6 KA/KS =5 KA/KS = 2
Нормируем на мутабильность последовательностей: KA/KS = 1/5 KA/KS = 1/2
KA/KS – мера давления естественного отбора KA – число несинонимичных замен на 1 несинонимичный сайт
Ks – число синонимичных замен на 1 синонимичный сайт Пример:
Ka= 1 / 8.67= 0.12Ks= 2/ 3.33= 0.6 Ka/Ks=0.12 / 0.6 =0.19 (стабилизирующий отбор?)
KA/KS, опять все не просто....
KA/KS – мера давления естественного отбора
KA – число несинонимичных замен на 1 несинонимичный сайт
Ks – число синонимичных замен на 1 синонимичный сайт
KA / Ks << 1 отрицательный (стабилизирующий) отбор
KA / Ks 1 нейтральная эволюция
KA / Ks > 1 положительный (движущий) отбор
KA/KS; какие бывают?
Из Hurst, L.D. (2002) Trends in Genet. 18, 486-487
ВЗАИМОДЕЙСТВИЕ ПАТОГЕН-ХОЗЯИН
ВОСПРОИЗВОДСТВО
ПРИСПОСОБЛЕНИЕ К ПИТАНИЮ
ВНЕШНОСТЬ
СЕНСОРНЫЕ СИСТЕМЫ
ПОВЕДЕНИЕ
ОРГАНИЗАЦИЯ МОЗГА
НЕИЗВЕСТНОГО НАЗНАЧЕНИЯ
E.J. Vallender, B.T. Lahn. Hum.Mol.Gen. 2004, V.13, Rev.Issue 2, R245-R254
КАТЕГОРИИ ГЕНОВ ЧЕЛОВЕКА, ОБНАРУЖИВАЮЩИХ ПРИЗНАКИ ПОЛОЖИТЕЛЬНОГО ОТБОРА
Ждите лекций А.В.Алешина по теории эволюции и лекций М.С.Гельфанда по сравнительной геномике!!