70
Marina Axelson-Fisk Matematisk orientering, 30 nov 2015 Bioinformatik

No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Marina Axelson-FiskMatematisk orientering, 30 nov 2015

Bioinformatik

Page 2: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Bioinformatik

Page 3: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Bioinformatik

Page 4: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

DNA analys

Medicin

• DNA-sekvensering och assemblering

• Sekvensanalys

• Proteinstruktur och funktion

• Expression- och nätverksanalys

• Sjukdomsgener

• Drug target

• Lead compound

• Kliniska försök

Var används bioinformatik?

Page 5: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Grundläggande genetik

KärnaCell

Kromosom DNA

Page 6: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia
Page 7: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia
Page 8: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Vad är en gen?

Protein

RNA

DNA

transkription

translation

CCTGAGCCAACTATTGAT

PEPTID

CCUGAGCCAACUAUUGAU

Page 9: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Proteinfunktioner• Enzym – matsmältningssystemet

• Strukturella komponenter – senor, ligament

• Skydd – antikroppar, blodkoagulering

• Regulatoriska hormon – insulin, tillväxt-

• Rörelse – aktin, myosin

• Transport – hemoglobin, albumin

Page 10: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

1977: Phi X174 (5’400 bp)

Sekvenserings-historia

1999: kromosom 22q (33.4)

2000: Bananflugan (180)

2003: Människan (3,200)

1995: Två mikrober (1.8, 0.6)

1996: Jästsvamp (12)

1997: E. coli (4.6)

1998: C. elegans (97)

Page 11: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

2001: The human genome

Page 12: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Och det kommer mer…

Page 13: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Genom-analys

• Sekvensjämförelser

• Genletning

• Regulatoriska element

Page 14: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Sekvensjämförelser

Page 15: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Sekvensjämförelser

• Är sekvenserna evolutionärt besläktade?

• Vilka regioner är likartade?

• Hur stort är det evolutionära avståndet?

• Hur verkar den evolutionära processen?

Page 16: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Mutationer

Normal THE BIG DOG RAN OUT.

Missense THE BIG DAG RAN OUT.

Nonsens THE BIG DOG.

Deletion THE BGD OGR ANO.

Inversion THE BIG RAN DOG OUT.

Insertion THE BIG RED DOG RAN OUT.

Page 17: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Tree of life: mammals

Mammals

Triconodonts

Multituberculata

Monotremata

(platypus,

echidnas)

Marsupialia

(opossums,

kangaroos)

Eutheria

(placental

animals)

Edentata (anteaters,

sloths, armadillos)

Lagomorpha

(rabbits)

Rodentia (mice,

rats, squirrels)

Primates

Tree shrews

Bats

Colugos

Carnivora (dogs, cats, bears, raccoons, weasels,

mongooses, hyenas)

Artiodactyla (pigs, deer, cattle, goats, sheep,

hippopotamuses, camels, etc.)

Cetacea (whales, dolphins, porpoises)

Perissodactyla (horses, tapirs, rhinoceroses)

Proboscidea (elephants, mammoths)

New World monkeys

Old World monkeys

humans, gorilla,

chimpanzee, bonobo,

orangutan

gibbons

lemurs, galagos,

lorises

Page 18: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Sekvens-alignment50 . : . : . : . : . :

247 GGTGAGGTCGAGGACCCTGCA CGGAGCTGTATGGAGGGCA AGAGC

|: || ||||: |||| --:|| ||| |::| |||---||||

368 GAGTCGGGGGAGGGGGCTGCTGTTGGCTCTGGACAGCTTGCATTGAGAGG

100 . : . : . : . : . :

292 TTC CTACAGAAAAGTCCCAGCAAGGAGCCACACTTCACTG

|||----------|| | |::| |: ||||::|:||:-|| ||:| |

418 TTCTGGCTACGCTCTCCCTTAGGGACTGAGCAGAGGGCT CAGGTCGCGG

150 . : . : . : . : . :

332 ATGTCGAGGGGAAGACATCATTCGGGATGTCAGTG

---------------||||||||||||||||||||||:||||||||||||

467 TGGGAGATGAGGCCAATGTCGAGGGGAAGACATCATTTGGGATGTCAGTG

200 . : . : . : . : . :

367 TTCAACCTCAGCAATGCCATCATGGGCAGCGGCATCCTGGGACTCGCCTA

|||||:||||||||:||||||||||||||:|| ||:|||||:||||||||

517 TTCAATCTCAGCAACGCCATCATGGGCAGTGGAATTCTGGGGCTCGCCTA

Page 19: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Strängjämförelser

• Exakt strängsökning

• Exakt mängdsökning

• Sökning av delsträngar

• Längsta gemensamma delsträng

• Gemensamma delsträngar i fler än två

• Förorenat DNA

Page 20: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Svårigheter

• Algoritmerna behöver vara:

– Snabba

– Robusta

– Minneseffektiva

• Hantera omkastningar, dupliceringar, och

repetitiva element

Page 21: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Genletning

Page 22: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Genstruktur

TATA

exon3promoter

introntranslation

start

translation

stop

exon4 exon5exon1 exon2

transcription

start

transcription

stop

transkription

splicing

translation

Page 23: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Genletning

exon1 exon3promoter

introntranslation

start

translation

stop

exon4 exon5exon2

transcription

start

transcription

stop

5’UTR 3’UTR

start codon

ATG

stop codon

TAA/TAG/TGA

splice sites

TATA

Page 24: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia
Page 25: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia
Page 26: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Den genetiska koden

Page 27: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Splice site detection

Position

% -8 … -2 -1 0 1 2 … 17

A 26 … 60 9 0 1 54 … 21

C 26 … 15 5 0 1 2 … 27

G 25 … 12 78 99 0 41 … 27

T 23 … 13 8 1 98 3 … 25

donor site

Page 28: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Dolda Markov-modeller

Hidden Markov models (HMMs)

Page 30: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Markov-kedjor

• Markov-egenskapen:

– Sannolikheten för nästa position beror bara på

den nuvarande (minneslös process)

Page 31: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Stokastiska processer

• En stokastisk variabel är en variabel som

påverkas av slump. Den kan anta vissa

värden enligt en sannolikhetsfördelning.

• En stokastisk process är en utvecklingen av

en stokastisk variabel i tid (eller rum)

Page 32: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Stokastiska processer

• Ankomst av kunder i ett kösystem

• Förändringar i aktiekursen

• Ledningsväxling under en rösträkning

• Växling mellan olika tillstånd

Page 33: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

En Markov-kedja

bA(i) 1 / 6

bB(i) 1/ 4

(A,B)Initial fördelning:

A

PBB

PAA

P = 1-PAB AA

P = 1-PBA BB

Page 34: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

En dold Markov-modell

A

B

1 4 3 6 6 4

Observerad sekvens:

BA A ABB

Dold sekvens:

Page 35: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

DNA-sekvenser

A C

G T

Page 36: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Tillståndssekvenser (durations)

p

duration

Geometrisk fördelning

1-p

p

A

Page 37: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Observerade exoner och introner

Intron Start-exon

Intern exon Slut-exon

Page 38: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

HMM i genletning

Exon1 Exon2 Exon3

A AT TG GGC C CTAAT A AT TTG G G A A ATT TG GGGC C C A AT TTG G G A AAT TGC AATG

Page 39: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Som lattice:

Page 40: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Två fundamentala problem

• Sannolikheten av observerade data, givet

modellen.

• Den bästa dolda sekvensen givet

observerade data.

forward-algoritmen

Viterbi-algoritmen

Page 41: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Dynamisk programmering

• Rekurrens relation

• Tabulär beräkning

• Traceback

Page 42: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Dynamisk programmering

f (n) =

0

1

f (n-1) + f (n-2)

om n = 0

om n = 1

om n > 1

Fibonacci-tal:

Page 43: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Dynamisk programmering

f (5)

f (4) f (3)

f (3) f (2)

f (2)

f (2) f (1)

f (1) f (1) f (1)

f (1)

f (0) f (0)

f (0)

Page 44: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Dynamisk programmering

• Rekurrens-relation

• Tabulär beräkning

• Traceback

f (n) =

0

1

f (n-1) + f (n-2)

om n = 0

om n = 1

om n > 1

f (0), f (1), f (2), f (3),…

Page 45: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

HMM algoritmer

t

t

1 4 3 6 6 4

BA A ABB

Page 46: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Dynamisk programmering

Observation

Til

lstå

nd

1 T

1

N

Page 47: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Forward-algoritmen

t(j) (

t 1(i)

i 1

N p

ij)b

j(Y

t)

(tillstånd j vid tidpunkt t)

Page 48: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Forward-algoritmen

...

tillstånd

1

2

3

N

j

t-1 t

t 1(i) t( j)

övergångssannolikheter

fördelning för utdata

Page 49: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Forward-algoritmen

Observation

Til

lstå

nd

1 T

1

N

Page 50: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Forward-algoritmen

Observation

Til

lstå

nd

......

...

. . .

. . .

. . .

. . .

1 2 3 T

1

2

3

N

Page 51: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Viterbi-algoritmen

Page 52: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Viterbi-algoritmen

...

tillstånd

1

2

3

N

j

t-1 t

Page 53: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Traceback

Observation

Til

lstå

nd

......

...

. . .

. . .

. . .

. . .

1 T

1

2

3

N

T-1T-2

Page 54: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

HMM i sekvens-alignment50 . : . : . : . : . :

247 GGTGAGGTCGAGGACCCTGCA CGGAGCTGTATGGAGGGCA AGAGC

|: || ||||: |||| --:|| ||| |::| |||---||||

368 GAGTCGGGGGAGGGGGCTGCTGTTGGCTCTGGACAGCTTGCATTGAGAGG

100 . : . : . : . : . :

292 TTC CTACAGAAAAGTCCCAGCAAGGAGCCACACTTCACTG

|||----------|| | |::| |: ||||::|:||:-|| ||:| |

418 TTCTGGCTACGCTCTCCCTTAGGGACTGAGCAGAGGGCT CAGGTCGCGG

150 . : . : . : . : . :

332 ATGTCGAGGGGAAGACATCATTCGGGATGTCAGTG

---------------||||||||||||||||||||||:||||||||||||

467 TGGGAGATGAGGCCAATGTCGAGGGGAAGACATCATTTGGGATGTCAGTG

200 . : . : . : . : . :

367 TTCAACCTCAGCAATGCCATCATGGGCAGCGGCATCCTGGGACTCGCCTA

|||||:||||||||:||||||||||||||:|| ||:|||||:||||||||

517 TTCAATCTCAGCAACGCCATCATGGGCAGTGGAATTCTGGGGCTCGCCTA

Human:

Mouse:

Human:

Mouse:

Human:

Mouse:

Human:

Mouse:

Page 55: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Pair HMMs

M

X

Y

M = (mis)match

X = insert seq1

Y = insert seq2

Observerade sekvenser:

ATCGG

ACGTCA

Utdata:

ATCG--G

AC-GTCA

Page 56: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Pair HMMs

M X YM M Y M

Dold sekvens:

A

A

T

C

C

-

G

G

-

T

-

C

G

A

Observerad sekvens:

ATCGG

ACGTCA

Utdata:

ATCG--G

AC-GTCA

Page 57: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Komparativ genletning50 . : . : . : . : . :

247 GGTGAGGTCGAGGACCCTGCA CGGAGCTGTATGGAGGGCA AGAGC

|: || ||||: |||| --:|| ||| |::| |||---||||

368 GAGTCGGGGGAGGGGGCTGCTGTTGGCTCTGGACAGCTTGCATTGAGAGG

100 . : . : . : . : . :

292 TTC CTACAGAAAAGTCCCAGCAAGGAGCCACACTTCACTG

|||----------|| | |::| |: ||||::|:||:-|| ||:| |

418 TTCTGGCTACGCTCTCCCTTAGGGACTGAGCAGAGGGCT CAGGTCGCGG

150 . : . : . : . : . :

332 ATGTCGAGGGGAAGACATCATTCGGGATGTCAGTG

---------------||||||||||||||||||||||:||||||||||||

467 TGGGAGATGAGGCCAATGTCGAGGGGAAGACATCATTTGGGATGTCAGTG

200 . : . : . : . : . :

367 TTCAACCTCAGCAATGCCATCATGGGCAGCGGCATCCTGGGACTCGCCTA

|||||:||||||||:||||||||||||||:|| ||:|||||:||||||||

517 TTCAATCTCAGCAACGCCATCATGGGCAGTGGAATTCTGGGGCTCGCCTA

Human:

Mouse:

Human:

Mouse:

Human:

Mouse:

Human:

Mouse:

Page 58: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Komparativ genletning

exon3promoter

introntranslation

start

translation

stop

exon4 exon5exon1 exon2

transcription

start

transcription

stopTATA

Page 59: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Generalized Pair HMMs

A AT TG GGC C CTAAT A AT TTG G G A A ATT TG GGGC C C A AT TTG G G A AAT TGC AATG

A AT TG TGA C CCTG ATT TG GG T C GTT AGC G G ATG G G A AAT TGC T CTGC CT C G

Exon1 Exon2 Exon3

Page 60: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Som lattice:

tillstånd

Page 61: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Beräkningsproblem

Modell Tid Minne

HMM N2T NT

PHMM N2TU NTU

GHMM D2N

2T NT

GPHMM D4N

2TU NTU

N antal tillstånd

D max duration

T längd sekv1

U längd sekv2

Page 62: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Approximate alignment

Reduces

TU -factor

to

hT

Page 63: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Jämförelse: människa – mus

Feb 2001 Dec 2002

Page 64: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Why mouse?

Page 65: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Varför mus?

Page 66: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Mus

Människa

Page 67: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

RNA folding

Page 68: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Helix

Tillstånd

Single-branched loop

Multi-branched loop

Hairpin

Page 69: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Viterbi-algoritmen

Page 70: No Slide Title...Kromosom DNA. Vad är en gen? Protein RNA DNA transkription translation CCTGAGCCAACTATTGAT PEPTID CCUGAGCCAACUAUUGAU. Proteinfunktioner ... (platypus, echidnas) Marsupialia

Hur många gener har vi?

27,462