Co-evolution mellem malaria-parasitter ( Plasmodium ) og deres værter

Preview:

DESCRIPTION

Co-evolution mellem malaria-parasitter ( Plasmodium ) og deres værter. Formål. At undersøge slægtskab hos h.h.v malaria-parasitter af slægten Plasmodium og deres værter. At sammenligne fylogenier med henblik på at konstatere om der er sket co-evolution eller spring mellem værter. Metode. - PowerPoint PPT Presentation

Citation preview

Co-evolution mellem malaria-parasitter (Plasmodium) og deres

værter

Formål

• At undersøge slægtskab hos h.h.v malaria-parasitter af slægten Plasmodium og deres værter.

• At sammenligne fylogenier med henblik på at konstatere om der er sket co-evolution eller spring mellem værter.

Metode

• Download af gensekvenser (rRNA SSU) for parasitter og værter fra GenBank.

• Alignment med CLUSTALw

• Konstruktion af fylogenetiske træer v.h.a.– Neighbor-joining (NJ)– Maximum Parsimony (MP)– Maximum Likelihood (ML)

Neighbour-joiningMinimum evolution

• Distance Matrix Method• Fordele

– Hurtig. Velegnet til store datasæt – Tillader lineages med forskellige grenlængder

(forskellig mutationsrater/evolutionshastgheder) – Tillader korrektion af multiple substitutioner

• Ulemper– Sekvensinformation er reduceret– Giver kun et muligt træ – Stærkt afhængigt af den anvendte evolutionsmodel

Neighbour-joining

• Da afstanden mellem AC er kortere end AB ville AC klade sammen ved brug af UPGMA

• Derfor......

Neighbour-joining

• ialt 6 OTUs (N=6).

• Step 1: nettodivergens r(i) beregnes

• r(A) = 5+4+7+6+8=30

• r(B) = 42

• r(C) = 32

• r(D) = 38

• r(E) = 34

• r(F) = 44

A B C D E

B 5

C 4 7

D 7 10 7

E 6 9 6 5

F 8 11 8 9 8

Neighbour-joining

• Step 2: Ny distance beregnes for hvert OTU par:

• M(ij)=d(ij) - [r(i) + r(j)]/(N-2)

• M(AB)=d(AB) -[(r(A) + r(B)]/(N-2)

• M(AB)=5-[30+42]/(6-2)=-13

Neighbour-joining

A B C D E

B -13

C -11.5 -11.5

D -10 -10 -10.5

E -10 -10 -10.5 -13

F -10.5 -10.5 -11 -11.5 -11.5

Neighbour-joining

A F | B \ | / \ | / \|/ /|\ / | \ / | \ E | C D

Neighbour-joining

• Step 3: Nu udvælges som naboer de to OTUer for hvem Mij er mindst

• A & B og D & E. • Fx A & B som naboer. Ny noder som kaldes U• Grenlængder beregnes fra den interne node U til

de eksterne OTUer A & B• S(AU) =d(AB) / 2 + [r(A)-r(B)] / 2(N-2) = 1

S(BU) =d(AB) -S(AU) = 4

Neighbour-joining

• Step 4: Nye afstande defineres fra U til alle andre terminale noder:

• d(CU) = d(AC) + d(BC) - d(AB) / 2 = 3 d(DU) = d(AD) + d(BD) - d(AB) / 2 = 6 d(EU) = d(AE) + d(BE) - d(AB) / 2 = 5 d(FU) = d(AF) + d(BF) - d(AB) / 2 = 7

Neighbour-joining

C D | \ | A \ |___/ 1 / | \ / | \ 4 E | \ F \ B

Hele proceduren gentages

U C D E

C 3

D 6 7

E 5 6 5

F 7 8 9 8

Maximum Parsimony

• Parsimony indebærer at den mest simple hypotese foretrækkes

• Maximum parsimony er en karakterbaseret metode der udleder fylogenetiske træer ved at minimere det totale antal af evolutionære trin der kræves for at forklare et givent datasæt. Minimering af trælængden (antal substitutioner)

• Trin kan være base eller aminosyre substitutioner for sekvensdata

Maximum Parsimony

Site

Sekv. 1 2 3 4 5 6 7 8 9

1 A A G A G T G C A

2 A G C C G T G C G

3 A G A T A T C C A

4 A G A G A T C C G

* * *

Maximum Parsimony

1) GGA ACA (3)

\1 1/ Antal mutationer

\ 2 /

GGG --- ACG Træ I: 4

/ \

/0 0\

(2) GGG ACG (4)

Maximum Parsimony

(1) GGA GGG (2)

\1 1/ Antal mutationer

\ 1 /

GCA --- GCG Træ II: 5

/ \

/1 1\

(3) ACA ACG (4)

Maximum Parsimony

(1) GGA GGG (2)

\2 1/ Antal mutationer

\ 0 /

GCG --- GCG Træ III: 6

/ \

/1 2\

(4) ACG ACA (3)

Maximum Parsimony

• Mindste antal substitutioner vinder..• Et informativt site favoriserer ET træ• Træ I støttes af 2 sites• Træ II støttes af 1 site• Træ III støttes 0 sites • MP søger efter det optimale (minimale) træ

– Men der kan være mere end et!– Exhaustive search af alle mulige træer– MEEEEEN............

Maximum ParsimonyAntal OTUer Antal urodede træer Antal rodede træer

2 1 1

3 1 3

4 3 15

5 15 105

6 105 945

7 954 10.395

8 10.395 135.135

9 135.135 34.459.425

10 34.459.425 2.13E15

15 2,13E15 8E21

Maximum Parsimony

• Branch and Bound: en variation af MP der garanterer at finde det minimale træ uden at evaluerer samtlige træer

• Heuristic searches branch swapping metoder. Ingen garanti for at finde bedste træ– Nearest neighbour interchange

– Subtree pruning and regrafting

– Treebisection and reconnection

Maximum Parsimony

Maximum Parsimony

• Fordele:• Reducerer ikke sekvensinformation til et enkelt tal• Prøver at give information om ancestrale sekvenser • Evaluerer forskellige træer

• Ulemper: • Langsom i forhold til distancebaserede metoder • Bruger ikke al sekvensinformation • Korrigerer ikke for multiple mutationer• Giver ikke information om grenlængder

Maximum Likelihood

• Maximum Likelihood evaluerer en hypotese om en evolutionær historie som en sandsynlighed for at den foreslåede model og den hypotetiserede historie ville ligge til grund for de observerede data

• Det antages at en historie med en højere sandsynlighed for at nå det observerede stadium er at foretrække frem for en en historie med en lavere sandsynlighed

• Metoden søger efter træet med den højeste sandsynlighed eller likelihood

Maximum Likelihood

• Fordele med ML• Ofte lavere varians end andre metoder (den

metode mindst påvirket af sampling error!) • Mindre påvirkelig over for brud på antagelser af

den evolutionære model • Selv med meget korte sekvenser er den ofte bedre

en d MP og distancemetoder • Al sekvensinformation bruges 

Maximum Likelihood

• Ulemper med ML• ML er MEGET langsom• Resultatet er beroende på evolutionsmodellen som

anvendes• Vægtning af mutationer

– Transition• Purin til purin A til G, G til A• Pyrimidin til pyrimidin T til C, C til T

– Transversion• Purin til pyrimidin A til T, A til C, G til T, G til C • Pyrimidin til purin C til A, C til G, T til A, T til G

Maximum Likelihood

• Maximum likelihood evaluerer sandsynligheden for at den valgte evolutionsmodel vil have genereret de observerede sekvenser

• Fylogenier konstrueres ved at finde træer med den højeste likelihood

Maximum Likelihood

• Antag at vi har følgende alignede nukleotidsekvenser for 4 taxa:

• 1 j ....N • (1) A G G C U C C A A ....A • (2) A G G U U C G A A ....A • (3) A G C C C A G A A.... A • (4) A U U U C G G A A.... C

Maximum Likelihood

• Under antagelse af at nukleotidsites udvikler sig uafhængigt (the Markovian model of evolution), kan likelihood for hvert site beregnes separat og en samlet likelihood for alle sites kan beregnes

• Alle muligheder for nukleotidudviklingen for site j må beregnes

• Sandsynligheden/Likelihooden for et bestemt site er summeringen af alle mulige rekonstruktioner for en bestemt basesubstitutionsmodel

• I dette tilfælde samtlige mulige nukleotider A,G,C,T ved node 5 og 6 eller 4 x 4 = 16 muligheder

Maximum Likelihood

• Og vi vil evaluere sandsynligheden/likelihooden for det urodede træ repræsenteret ved nukleotiderne ved site j 

• (1,C) (2,C) • \ / • \ / • (5,?) --- (6,?) • / \ • / \ • (3,A) (4,G)

Maximum Likelihood

N• L= L(1) x L(2) ..... x L(N) = ½ L(j) j=1 • Da likelihoodværdier er små summes log likelihoods

for hver enkelt site og likelihood for hele træet opgives som log likelihood

N• ln L= ln L(1) + ln L(2) ....+ ln L(N) = SUM ln L(j)

j=1

Maximum Likelihood

• Proceduren gentages for alle topologier/træer

• Træet med den højeste sandsynlighed er træet med maximum likelihood.

Bootstrapping

Sample 1

0 1 2 0 3 0 1 2 0 1

A A G G C U C C A A A

B A G G U U C G A A A

C A G C C C C G A A A

D A U U U C C G A A C

Pseudosample

A G G G U U U C A A A

B G G G U U U G A A A

C G C C C C C G A A A

D U U U C C C G A A C

A B C 

B 1   

C 6 5  

D 8 7 4

Bootstrapping

Sample 2

1 0 0 0 2 2 2 0 0 3

A A G G C U C C A A A

B A G G U U C G A A A

C A G C C C C G A A A

D A U U U C C G A A C

Pseudoreplicates

A A U U C C C C A A A

B A U U C C G G A A A

C A C C C C G G A A A

D A C C C C G G C C C

A B C 

B 2   

C 4 2  

D 7 5 3

Bootstrapping

Sample 3

1 0 0 0 2 2 2 0 0 3

A A G G C U C C A A A

B A G G U U C G A A A

C A G C C C C G A A A

D A U U U C C G A A C

Pseudoreplicates

A A U U C C C C A A A

B A U U C C G G A A A

C A C C C C G G A A A

D A C C C C G G C C C

A B C 

B 1   

C 3 2  

D 6 3 4

Bootstrapping

Parasitter

• Fugl: P. gallinaceum• Firben: P. mexicanum• Gnaver: P. berghei• Østaber: P. cynomolgi, P. knowlesi• Chimpanse: P. reichenowi• Menneske: P. falciparum, P. vivax, P. ovale,

P. malariae

Co-evolution eller spring mellem værter?

• Hvis parasitternes stamtræ har samme topologi som de tilsvarende værters, kan det tolkes som co-evolution (parasitterne er udviklet med værterne).

• Hvis parasitternes stamtræ ikke har samme topologi som værternes, tyder det på, at parasitterne har sprunget mellem værter.

NJ værter

NJ parasitter

MP værter (bootstrap)

MP parasitter

(bootstrap)

ML værter

ML parasitter

Hvad siger litteraturen?

• Waters et al. 1991: Fylogeni baseret på SSU rRNA, NJ.P. falciparum er opstået ved spring fra fuglevært

til menneskelig vært.

• Quari et al. 1996: Fylogeni baseret på SSU rRNA, ML.

Pattedyrsparasitter er evolutionært adskilt fra fugle/krybdyr-parasitter.

P.falciparum og P. reichenowi (chimpanse) er søstergrupper og evolutionært adskilt

fra resten af pattedyrsparasitterne

• Perkins & Schall 2002: Fylogeni baseret på cytochrom b, MP og ML.

Samme konklusion som Quari et al.

Hvad understøtter vores resultater?

• MP-træet: Meget rodet, generelt parafyletiske arter.

Støtter teori om spring fra fugl til menneske.

Fastholder dog søstergruppeforholdet ml. P. falciparum og P. Reichenowi.

• NJ- og MP-træerne: Støtter teorien om adskillelse ml. krybdyr/fugleparasitterne og

pattedyrsparasitterne.

P. falciparum og P. reichenowi er søstergrupper og evolutionært adskilt fra resten af

pattedyrsparasitterne.