33
Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung bei Microarrayexperimenten Klassenvergleiche und Classifier

Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Embed Size (px)

Citation preview

Page 1: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

1

Größenbestimmung bei MicroarrayexperimentenKlassenvergleiche und Classifier

Page 2: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

2

Microarrays

• Dienen zur Erkennung von Expressionsprodukten.

• Platten aus Glas, Silizium etc.• Enthalten die Gene des Organismus.• Position jedes Gens auf Platte ist bekannt.

Page 3: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

3

Versuchsablauf• Transkriptionsprodukte (Targets) werden

auf das MA gegeben. Diese sind mit Fluoreszenz-Markern versehen.

• Binden der Targets an den komplementären Strängen auf dem MA.

• Waschen um nicht oder unzureichend gebundene Targets zu entfernen.

Page 4: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

4

Auswertung• Farbstoffe werden durch Laser zum

Leuchten gebracht. • Scannen des Bildes.• Normalisierung. • Fehlerbeseitigung• Erstellen der Genexpressionsmatrix.

Page 5: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

5

Warum Versuchsgrößenbestimmung?

• Beschränkungen durch:– Finanzmittel– Zeit– Vorhandene Proben

Page 6: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

6

Klassen-Vergleiche

• Vergleich von zwei Gewebetypenz.B.:

- Krebsgewebe normales Gewebe- histologisch verschiedene Krebsgewebe

• Ziel ist es, unterschiedliche Gen-Expressionen zu identifizieren.

Page 7: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

7

Verschiedene MA-Versuchstypen

• Single Label/ Double Label– Pooling– Dye Swap– Nutzen von technischen Replikaten

Page 8: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

8

Single Label Arrays

• DNA – Oligonukleotid MAs (Affymetrix)• Nur Targets einer Zelle• Hohe Spotdichte• teuer

Page 9: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

9

Notation• Floureszens-Intensität: Ygadvfs

– g :1,2,...G | Gen– a :1,...,n | Array– d : 1 = Single Label; 2 = double Label | Farbe– v : 1,2 | Phänotypen– f : 1,2,...F | Individuen– s : 1,2,...m | Unterprobe/technisches Replikat

Page 10: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

10

Single Label MAs

• Log (Ygadvfs) = Gg + GVgv + (GF)gf(v) + gadvfs

– Gg = Genexpression von g in der Population

– GVgv = Effekt der Klasse oder des Typs

– (GF)gf(v) = individueller Effekt gadvfs = unabh. Fehler mit Normal(0, )

2x

Page 11: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

11

),σNormal(

Normaly

mlnkyw

Normal

Normalx

mjnixz

kl

xk

klkykl

ij

xi

ijixij

2

2

2

2

fsg2fsfsg1fs

0~

),0(~

..1;...1;

),0(~

),0(~

..1;...1;

w Y , z Y

Single Label MAs

Page 12: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

12

Varianz e technisch

Varianz ebiologisch

Entdeckte negativfalsch Entdeckte positvfalsch zchschnitteKlassendurder Distanz

Sample pro Replikateer technischAnzahl msMicroarray benötigtenan Anzahl totalen

)(][4

2

2

/2

2222/

g

g

gg

z

mzz

mn

Single Label MAs

Page 13: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

13

Single Label MAs

Samplesdlichen unterschie biologischder Anzahl /

)(][4/2

222/

mnm

zzmn g

g

Page 14: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

14

Dual Label Arrays

• cDNA MAs• Targets von 2 Zellen. Dies erleichtert einen

direkten Vergleich• Teilweise geringe Spotdichte

Page 15: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

15

Dual Label MAs

• Log (Ygadvfs) = Gg + GAga + GDgd + GVgv+ (GF)gf(v) + gadvfs

– Gg = Genexpression von g in der Population– GAga = Spot auf Array– GDgd = Effekt des Färbemittels– GVgv = Effekt der Klasse oder des Typs – (GF)gf(v) = individueller Effekt gadvfs = unabh. Fehler mit Normal(0, )

2x

Page 16: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

16

Dual Label MAs

• Referenz Design:

A1

R

A2

R

B1 B2

R R

Page 17: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

17

Dual Label MAs

• Reference Design

Muss aus vorherigen Daten geschätzt werden.

Klassen.der einer innerhalb Varianz 2

)2(][4

22

2222/

gg

gg

zzn

Page 18: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

18

Dual Label MAs

• Design mit technischen Replikaten und Dye Swap:

)2

(][42

222/

mzz

mn gg

Page 19: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

19

Dual Label MAs

α = 0,001β = 0,05δ = 1

VarianzVerhältnis

technische Replikate /Sample

Anzahl benötigter Arrays

Anzahl benötigter Samples 

2 1 49 49  2 74 37  3 99 33  4 124 314 1 49 49  2 82 41  3 114 38  4 148 37

Page 20: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

20

Dual Label Mas

.Replikatenhnischen keinen tec bei n Anzahl zur Verhältnis im Replikaten m bei

Arrays Benötigtender Anzahl dieist n

]2)/(2)/(

[

1

m

22

22

1

gg

ggm

mnn

Page 21: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

21

Dual Label MAs

• Block Design:

A2 A3

B2

A1

B1

A4

B3 B4

Page 22: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

22

Dual Label MAs

• Balanced Block Design– Leichter Vergleich von 2 Klassen.– Weniger Arrays benötigt.– unflexibel

)2()( 22

2,2

1,

2

22/

ggg

zzn

Page 23: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

23

Dual Label MAs

• Single Paired Design– Natürliche biologische Paarungen ( z.B. von

Individuum vor und nach einer Behandlung).– Je eine Seite mit einer Farbe pro Probe.

– η an Stelle von τ. Varianz des veränderten Gewebes (z.B. Tumor) zum normalen Gewebe.

)2()( 22

2

22/

ggbalanced

zzn

Page 24: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

24

Dual Label MAs

• Dye-Swap Paired Design– Die gleichen Targets wie Single Paired Design.– Die gleichen Arrays werden nocheinmal mit

dem jeweils anderen Fluoreszensstoff ausgewertet.

)2()( 22

2

22/

ggdyeswap

zzn

Page 25: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

25

Prognostic Markers• Finden von Genen oder Genklassen, die bei

einer Krankheit exprimiert werden.

Page 26: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

26

Prognostic Markers

• Effekt von Pooling

• Mehr Samples weniger Arrays

Samplesen biologischen unabhängigan Anzahl

)2

()(

4222

22/

kmk

zzmn gg

Page 27: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

27

Prognostic Markers

• α = Wahrscheinlichkeit für falsch positive Entdeckung.

• 1-β = Wahrscheinlichkeit richtig positive Entdeckung.

• Problem: Wie wählt man α?

Page 28: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

28

Prognostic Markers

Genenan Anzahl GGeneen exprimiert andersder Anteil

)1(1

Entdeckte richtig #Entdecktefalsch #

]##

#[

GE[#TD]

π)Gα(E[#FD] FDFD

TDFDFDEFDR

Page 29: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

29

Prognostic Markers

Page 30: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

30

Prognostic Markers

Page 31: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

31

Training eines Classifiers

• Ein Classifier soll Gene als Prognostic Marker erkennen.

Page 32: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

32

Training eines Classifiers

• Bedingung: Solle wenige Samples brauchen• Lösung: Sequentielle Bestimmung• Vorteile

– Lernt durch eigene Erfahrung.– Stopp-Kriterium wird bei jedem Schritt

überprüft.– Erzielen der gewünschten Signifikanz garantiert– Mit jeder Klassifikationsmethode einsetzbar.

Page 33: Johann Wolfgang Goethe Universität Frankfurt am Main Fachbereich 15: Biologie und Informatik Junior Prof. Dr. Dirk Metzler Sebastian Bremm 1 Größenbestimmung

Johann Wolfgang Goethe Universität Frankfurt am MainFachbereich 15: Biologie und InformatikJunior Prof. Dr. Dirk Metzler

Sebastian Bremm

33

Training eines Classifiers

N

ii

N

N

ii

N

QN

k

NQN

kzN

1

1

^

0

2

1

1

^

1

0

0

,min