51
1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

Embed Size (px)

Citation preview

Page 1: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

1

STATISIK

LV Nr 1852

WS 200506

1Dezember 2005

2

Inhalt

bull Deskriptive Statistik

bull Einfache Kennzahlenndash Lagemaszligendash Streuungsmaszligendash Konzentrationsmaszligendash Verhaumlltniszahlenndash Indexzahlen

3

Maszligzahlen

bull Parameter Kollektivmaszligzahlen

bull Lageparameter (Mittelwerte)

bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)

bull Schiefe

bull Woumllbung

4

Lagemaszlige und Mittelwerte

bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der

Datenndash Wenn alle Daten derselben linearen

Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit

5

Lagemaszlige und Mittelwerte

bull Arithmetisches Mittel

bull Median

bull Modus

bull Geometrisches Mittel

bull Harmonisches Mittel

bull Quantile

6

Arithmetisches Mittel

bull Mittelwert durchschnittlicher Wert

bull Fuumlr metrisch skalierte Merkmale

bull a1an beobachtete Merkmalswerte eines Merkmals X

k

1iii

k

1iii fxhx

n

1x

n

1iia

n

1a

7

Arithmetisches Mittel

bull Bsp Merkmal X Koumlrpergroumlszlige in cm

bull Merkmalswerte (a1an n = 5)

162 170 155 187 179

bull ā = 15 middot (162+170+155+187+179) = 1706

8

Arithmetisches Mittel

Eigenschaften (Betrachte Einzelwerte ai i=1n)

bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0

bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

n

1ii 0)a(a

)a(MM)(a)a(an

1i

n

1i

2i

2i

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 2: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

2

Inhalt

bull Deskriptive Statistik

bull Einfache Kennzahlenndash Lagemaszligendash Streuungsmaszligendash Konzentrationsmaszligendash Verhaumlltniszahlenndash Indexzahlen

3

Maszligzahlen

bull Parameter Kollektivmaszligzahlen

bull Lageparameter (Mittelwerte)

bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)

bull Schiefe

bull Woumllbung

4

Lagemaszlige und Mittelwerte

bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der

Datenndash Wenn alle Daten derselben linearen

Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit

5

Lagemaszlige und Mittelwerte

bull Arithmetisches Mittel

bull Median

bull Modus

bull Geometrisches Mittel

bull Harmonisches Mittel

bull Quantile

6

Arithmetisches Mittel

bull Mittelwert durchschnittlicher Wert

bull Fuumlr metrisch skalierte Merkmale

bull a1an beobachtete Merkmalswerte eines Merkmals X

k

1iii

k

1iii fxhx

n

1x

n

1iia

n

1a

7

Arithmetisches Mittel

bull Bsp Merkmal X Koumlrpergroumlszlige in cm

bull Merkmalswerte (a1an n = 5)

162 170 155 187 179

bull ā = 15 middot (162+170+155+187+179) = 1706

8

Arithmetisches Mittel

Eigenschaften (Betrachte Einzelwerte ai i=1n)

bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0

bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

n

1ii 0)a(a

)a(MM)(a)a(an

1i

n

1i

2i

2i

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 3: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

3

Maszligzahlen

bull Parameter Kollektivmaszligzahlen

bull Lageparameter (Mittelwerte)

bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)

bull Schiefe

bull Woumllbung

4

Lagemaszlige und Mittelwerte

bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der

Datenndash Wenn alle Daten derselben linearen

Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit

5

Lagemaszlige und Mittelwerte

bull Arithmetisches Mittel

bull Median

bull Modus

bull Geometrisches Mittel

bull Harmonisches Mittel

bull Quantile

6

Arithmetisches Mittel

bull Mittelwert durchschnittlicher Wert

bull Fuumlr metrisch skalierte Merkmale

bull a1an beobachtete Merkmalswerte eines Merkmals X

k

1iii

k

1iii fxhx

n

1x

n

1iia

n

1a

7

Arithmetisches Mittel

bull Bsp Merkmal X Koumlrpergroumlszlige in cm

bull Merkmalswerte (a1an n = 5)

162 170 155 187 179

bull ā = 15 middot (162+170+155+187+179) = 1706

8

Arithmetisches Mittel

Eigenschaften (Betrachte Einzelwerte ai i=1n)

bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0

bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

n

1ii 0)a(a

)a(MM)(a)a(an

1i

n

1i

2i

2i

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 4: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

4

Lagemaszlige und Mittelwerte

bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der

Datenndash Wenn alle Daten derselben linearen

Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit

5

Lagemaszlige und Mittelwerte

bull Arithmetisches Mittel

bull Median

bull Modus

bull Geometrisches Mittel

bull Harmonisches Mittel

bull Quantile

6

Arithmetisches Mittel

bull Mittelwert durchschnittlicher Wert

bull Fuumlr metrisch skalierte Merkmale

bull a1an beobachtete Merkmalswerte eines Merkmals X

k

1iii

k

1iii fxhx

n

1x

n

1iia

n

1a

7

Arithmetisches Mittel

bull Bsp Merkmal X Koumlrpergroumlszlige in cm

bull Merkmalswerte (a1an n = 5)

162 170 155 187 179

bull ā = 15 middot (162+170+155+187+179) = 1706

8

Arithmetisches Mittel

Eigenschaften (Betrachte Einzelwerte ai i=1n)

bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0

bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

n

1ii 0)a(a

)a(MM)(a)a(an

1i

n

1i

2i

2i

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 5: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

5

Lagemaszlige und Mittelwerte

bull Arithmetisches Mittel

bull Median

bull Modus

bull Geometrisches Mittel

bull Harmonisches Mittel

bull Quantile

6

Arithmetisches Mittel

bull Mittelwert durchschnittlicher Wert

bull Fuumlr metrisch skalierte Merkmale

bull a1an beobachtete Merkmalswerte eines Merkmals X

k

1iii

k

1iii fxhx

n

1x

n

1iia

n

1a

7

Arithmetisches Mittel

bull Bsp Merkmal X Koumlrpergroumlszlige in cm

bull Merkmalswerte (a1an n = 5)

162 170 155 187 179

bull ā = 15 middot (162+170+155+187+179) = 1706

8

Arithmetisches Mittel

Eigenschaften (Betrachte Einzelwerte ai i=1n)

bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0

bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

n

1ii 0)a(a

)a(MM)(a)a(an

1i

n

1i

2i

2i

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 6: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

6

Arithmetisches Mittel

bull Mittelwert durchschnittlicher Wert

bull Fuumlr metrisch skalierte Merkmale

bull a1an beobachtete Merkmalswerte eines Merkmals X

k

1iii

k

1iii fxhx

n

1x

n

1iia

n

1a

7

Arithmetisches Mittel

bull Bsp Merkmal X Koumlrpergroumlszlige in cm

bull Merkmalswerte (a1an n = 5)

162 170 155 187 179

bull ā = 15 middot (162+170+155+187+179) = 1706

8

Arithmetisches Mittel

Eigenschaften (Betrachte Einzelwerte ai i=1n)

bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0

bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

n

1ii 0)a(a

)a(MM)(a)a(an

1i

n

1i

2i

2i

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 7: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

7

Arithmetisches Mittel

bull Bsp Merkmal X Koumlrpergroumlszlige in cm

bull Merkmalswerte (a1an n = 5)

162 170 155 187 179

bull ā = 15 middot (162+170+155+187+179) = 1706

8

Arithmetisches Mittel

Eigenschaften (Betrachte Einzelwerte ai i=1n)

bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0

bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

n

1ii 0)a(a

)a(MM)(a)a(an

1i

n

1i

2i

2i

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 8: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

8

Arithmetisches Mittel

Eigenschaften (Betrachte Einzelwerte ai i=1n)

bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0

bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert

n

1ii 0)a(a

)a(MM)(a)a(an

1i

n

1i

2i

2i

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 9: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

9

Arithmetisches Mittel

bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte

Lineare Transformation

bull Bsp Koumlrpergroumlszlige ai = 001middotai

ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706

n)1(iβaαa ii

aβαa

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 10: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

10

Arithmetisches Mittel

bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten

bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706

ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752

ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729

21

2211n

1i

n

2i1i21 nn

ananaa

nn

1a

1 2

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 11: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

11

Arithmetisches Mittel

bull Gewogenes (gewichtetes) arithmetische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel

n

1iii

w awa

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 12: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

12

Median

bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an

bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05

x((n+1)2) n ungerade

x05 = frac12(x(n2)+x(n2+1)) n gerade

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 13: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

13

Median

bull Haumlufigkeitsverteilung

Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet

bull Klassifizierte Daten

Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 14: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

14

Median

bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187 193

ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171

bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet

155 159 162 168 170 172 179 184 187

ndash Median x05 = x((n+1)2) = x5 = 170

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 15: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

15

Quantile

bull Geordnete Beobachtungsreihe x(1)x(n)

bull α-Quantil x(k) falls nα keine ganze Zahl (k ist

die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα

bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 16: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

16

Quantile

bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)

155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25

also x025 = x(k) = x(3) = 162

ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 17: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

17

Modalwert

bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt

bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle

Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert

als Klassenmitte der am dichtesten besetzten Klasse

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 18: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

18

Geometrisches Mittel

bull Voraussetzung Daten verhaumlltnisskaliert

bull n Einzelwerte a1 an

bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )

bull Geometrisches Mitteln

n21g aaaa

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 19: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

19

Geometrisches Mittel

bull Bsp Produktionssteigerung eines Betriebes pro Jahr

bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7

bull Durchschnittliche Steigerung

bull Durchschnittliche Produktionssteigerung ~6

0571261071041111102a 44g

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 20: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

20

Geometrisches Mittel

bull Gewogenes (gewichtetes) geometrische Mittel

bull Gewichte w1 wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel

n21 wn

w2

w1

wg aaaa

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 21: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

21

Harmonisches Mittel

bull Nur positive od negative Beobachtungswerte a1an

bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1

bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel

n

1i i

h

a

1n

a

n

1i i

i

wh

a

w1

a

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 22: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

22

Harmonisches Mittel

bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M

bull P ist das mit wi gewogene harmonische Mittel der xi

ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes

ndash P = durchschnittlicher Preis pro Mengeneinheit

ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes

ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes

iii

iiii

i

i

i uuwmit)x(w

1

)xu(

u

m

u

M

UP

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 23: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

23

Mittel

bull Vergleich arithmetische- geometrisches- und harmonisches Mittel

bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung

bull Bei identischen Beobachtungen a1==an sind die Mittel gleich

aaa gh

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 24: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

24

Streuungsmaszlige

bull Varianz

bull Standardabweichung

bull Variationskoeffizient

bull Mittlere absolute Abweichung

bull Spannweite

bull Quartilsabstand

bull Schiefe

bull Woumllbung

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 25: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

25

Varianz

bull Beobachtungswerte a1an (metrisch skaliert)

bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel

bull Varianz (Mittlere quadratische Abweichung)

n

1i

2i

2 )a(an

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 26: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

26

Varianz

bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179

bull Arithmetisches Mittel = 1706

bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 27: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

27

Streuungsmaszlig

bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt

bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M

n

1ii 0)a(a

n

1i

2i M)(a

n

1MQ(M)

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 28: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

28

Varianz

bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)

bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels

22 M)a(σMQ(M)

)a(MM)(a)a(an

1i

n

1i

2i

2i

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 29: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

29

Varianz

bull Rechenvereinfachung

bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)

bull Varianz

n

1i

22i

n

1i

2i

2 aan

1)a(a

n

i

n

1i

2i

2 h)x(xn

n2 2

i ii 1

σ (x x) f

n

1iii

n

1iii fxhx

n

1xmit

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 30: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

30

Varianz

bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht

mit 21

222

211

21

222

2112

nn

)aa(n)aa(n

nn

σnσnσ

21

2211

nn

anana

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 31: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

31

Varianz

bull Klassifizierte Daten Haumlufigkeitsverteilung

bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet

i

n

1i

2i

2 h)xx(n

i

n

1i

2i

2 f)xx(n

n

1iii

n

1iii fxhx

n

1xmit

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 32: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

32

Varianz

bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird

bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur

σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz

12

x)(Δσσ

222

corr

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 33: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

33

Varianz

bull Dimension Quadrat der Dimension der einzelnen Beobachtungen

bull Eigenschaft Varianz immer 0

bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 34: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

34

Standardabweichung

bull Standardabweichung = Quadratwurzel der Varianz

n

1i

2i

2 )a(an

1σσ

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 35: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

35

Varianz amp Standardabweichung

Eigenschaften

bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)

bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ

bull Sonderfall β=1 Transformation ai = α + ai

σsup2 = σsup2 und σ = σ

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 36: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

36

Standardisierung

bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte

Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird

bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1

σ

μaz i

i

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 37: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

37

Variationskoeffizient

bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen

bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ

μ

σVC

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 38: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

38

MAD Mittlere absolute Abw

bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)

bull Minimumeigenschaft des Medians

M beliebiger Wert

n

1ii |Ma|

n

1MAD

n

1ii

n

1ii |Ma|

n

1|Mea|

n

1

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 39: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

39

MAD

bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ

bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute

ersetzen

i

n

1ii h|μx|

n

1MAD

i

n

1ii f|μx|MAD

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 40: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

40

Spannweite (Range)

bull Abstand zw dem groumlszligten und dem kleinsten Wert

bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]

R = a[n] - a[1]

bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen

R = xk - x1

bull Haumlufigkeitsverteilung von klassifizierten Daten

R = xko - x1

u

bull Spannweite ist instabil gegenuumlber Ausreiszligern

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 41: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

41

Quartilsabstand

bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile

bull α-Quantil

a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)

aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα

bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte

QA = Q3 ndash Q1

bull Eigenschaft stabil gegenuumlber Ausreiszligern

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 42: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

42

38N =

GEWICHT

110

100

90

80

70

60

50

40

937

Box-Plot

bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)

38N =

GROEszligE

210

200

190

180

170

160

150

140

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 43: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

43

Box-Plot

bull Box-Plot fuumlr Vergleich von 2 Messreihen

1820N =

SEX

mw

GR

OE

szligE

210

200

190

180

170

160

150

140

28

9

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 44: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

44

Box-Plot

bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1

und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers

bull Ausreiszliger

bull Krasse Ausreiszliger

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 45: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

45

Schiefe

bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an

lt 0 linksschiefe

g1 = 0 symmetrisch

gt 0 rechtsschiefebull Kein direkter Streuungsparameter

3n

1i

2i

n

1i

3i

1

)a(an1

)a(an1

g

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 46: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

46

Schiefe

bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren

3k

1ii

2i

i

k

1i

3i

1

h)aa(n1

h)aa(n1

g

3k

1ii

2i

i

k

1i

3i

1

h)a(mn1

h)a(mn1

g

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 47: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

47

Schiefe

bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung

Auspraumlgung

Hauml

ufi

gke

it

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 48: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

48

Schiefe

bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung

Auspraumlgung

Hauml

ufi

gke

it

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 49: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

49

Schiefe

bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung

Auspraumlgung

Haumlu

fig

keit

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 50: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

50

Woumllbung

bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen

bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist

3

)a(an1

)a(an1

g 2n

1i

2i

n

1i

4i

2

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51
Page 51: 1 STATISIK LV Nr.: 1852 WS 2005/06 1.Dezember 2005

51

Woumllbung

lt 0 abs Max kleiner als bei N-Vt

g2 = 0 Normalverteilung

gt 0 abs Max groumlszliger als bei N-Vt

bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten

3

h)aa(n1

h)aa(n1

g 2n

1ii

2i

k

1ii

4i

2

3

h)a(mn1

h)a(mn1

g 2n

1ii

2i

k

1ii

4i

2

  • STATISIK
  • Inhalt
  • Maszligzahlen
  • Lagemaszlige und Mittelwerte
  • Slide 5
  • Arithmetisches Mittel
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Median
  • Slide 13
  • Slide 14
  • Quantile
  • Slide 16
  • Modalwert
  • Geometrisches Mittel
  • Slide 19
  • Slide 20
  • Harmonisches Mittel
  • Slide 22
  • Mittel
  • Streuungsmaszlige
  • Varianz
  • Slide 26
  • Streuungsmaszlig
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33
  • Standardabweichung
  • Varianz amp Standardabweichung
  • Standardisierung
  • Variationskoeffizient
  • MAD Mittlere absolute Abw
  • MAD
  • Spannweite (Range)
  • Quartilsabstand
  • Box-Plot
  • Slide 43
  • Slide 44
  • Schiefe
  • Slide 46
  • Slide 47
  • Slide 48
  • Slide 49
  • Woumllbung
  • Slide 51