Transcript

4 Spezifizierende Beschreibung

empirischer Verteilungen

61

4 Spezifizierende Beschreibung empirischer Verteilungen

4.1 Spezifika empirischer Verteilungen

4.2 Lagekennwerte

4.2.3 Modalwert

4.3.1 Arithmetisches Mittel bei gruppierten Daten

4.2.1 Arithmetisches Mittel

4.2.2 Median

4.2.4 Fechnerโ€˜sche Lageregeln

4.3 Spezielle Lagekennwerte

4.3.2 Quantile

4.3.3 Geometrisches Mittel

65

69

69

73

77

78

80

80

82

87

4.4 Streuungskennwerte

4.4.1 Spannweite

92

92

4.4.2 Mittlere absolute Abweichungen 93

4 Spezifizierende Beschreibung empirischer Verteilungen

4.4.3 Median absoluter Abweichungen

4.4.4 Varianz, Standardabweichung und Schwankungsintervalle

4.5.2 Quantilsabstรคnde

4.7 Messung von Schiefe

4.5 Spezielle Streuungskennwerte

4.5.1 Varianz bei gruppierten Daten

4.5.3 Variationskoeffizient

4.6 Standardisierung mittels Lage und Streuung

4.8 Darstellung und Messung von Konzentration

97

100

104

104

107

109

113

117

120

4.8.1 Lorenzkurve

4.8.2 Gini-Koeffizient

120

123

4 Spezifizierende Beschreibung empirischer Verteilungen

64

4.9 Spezifische Eigenschaften empirischer Kennwerte 128

4.9.1 Minimumeigenschaft des arithmetischen Mittels

4.9.2 Minimumeigenschaft des Medians

128

132

4.9.3 Transformationseigenschaften 136

4.9.4 Robustheit 144

65

4.1 Spezifika empirischer Verteilungen

โ— Unimodalitรคt und Multimodalitรคt โ—

โ— Symmetrie und Schiefe โ—

โ— Lage und Streuung โ—

66

4.1 Spezifika empirischer Verteilungen

Beispiel 4.1.1: Schiefe und Multimodalitรคt

67

4.1 Spezifika empirischer Verteilungen

68

4.1 Spezifika empirischer Verteilungen

4.2 Lagekennwerte

4.2.1 Arithmetisches Mittel

โ— Definition und Berechnung โ—

69

าง๐‘ฅ =1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘–

> Gegeben metrisch skalierte Beobachtungswerte ๐‘ฅ1, ๐‘ฅ2,... ๐‘ฅ๐‘›:

> Merkmalssumme

๐‘–=1

๐‘›

๐‘ฅ๐‘– = ๐‘› ร— าง๐‘ฅ

โ— Interpretation โ—

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ = 0 Schwerpunkteigenschaft

4.2 Lagekennwerte

70

โ— Berechnung bei klassierten Daten โ—

4.2 Lagekennwerte

71โ— Kein robuster Kennwert โ—

> Feststellung: Bei gleichmรครŸiger Verteilung aller Werte innerhalb der Klassen

stimmen Klassenmittelwert und Klassenmitte ungefรคhr รผberein

> Im Beispiel (Tab. 4.2.1) gilt deshalb mit k = 6 Klassen:

าง๐‘ฅ โ‰ˆ1

๐‘›

๐‘—=1

6

๐‘š๐‘— ๐‘›๐‘—

=1

305 ร— 2 + 15 ร— 8 + 25 ร— 10 + 35 ร— 6 + 45 ร— 3 + 55 ร— 1

= 26

๐‘š๐‘— ... Klassenmitte der j-ten Klasse

๐‘š6

๐‘›6

4.2 Lagekennwerte

72

4.2 Lagekennwerte

73

4.2.2 Median

โ— Definition und Interpretation โ—

โ— Berechnung bei Urlisten โ—

โˆ’1, 0, 0, 1, 3, 5, 6 โˆ’1, 0, 1, 3, 5, 6

๐‘ฅ1 = 0, ๐‘ฅ2 = 1, ๐‘ฅ3 = 5, ๐‘ฅ4 = 6, ๐‘ฅ5 = 3, ๐‘ฅ6 = 0, ๐‘ฅ7 = โˆ’1

Geordnete Werte:๐‘ฅ 1 = โˆ’1, ๐‘ฅ 2 = 0, ๐‘ฅ 3 = 0, ๐‘ฅ 4 = 1, ๐‘ฅ 5 = 3, ๐‘ฅ 6 = 5, ๐‘ฅ 7 = 6

๐‘ฅ0.5 = 1 ๐‘ฅ0.5 = 2

๐‘ฅ0.5 = ๐‘ฅ ๐‘›+12

= ๐‘ฅ 7+12

= ๐‘ฅ 4 = 1

๐‘› = 7 ungerade:

๐‘ฅ0.5 = 0.5 ๐‘ฅ ๐‘›/2 + ๐‘ฅ ๐‘›/2+1 falls n gerade wรคre

4.2 Lagekennwerte

74

โ— Berechnung bei klassierten Daten โ—

Einfallsklasse des Medians ist hier ๐‘— = 3

๐‘๐‘—โˆ’1 = ๐‘2 = 20, เทจ๐น๐‘› ๐‘2 = 0.333, แˆš๐‘“3/๐‘‘3 = 0.0333

4.2 Lagekennwerte

75๐‘ฅ0.5 โ‰ˆ 20 +

0.5 โˆ’ 0.333

0.0333โ‰ˆ 25.02

4.2 Lagekennwerte

76

4.2 Lagekennwerte

77

4.2.3 Modalwert

4.2 Lagekennwerte

4.2.4 Fechnerโ€˜sche Lageregeln

78

4.2 Lagekennwerte

79

Beispiel 4.2.1: Durchschnittseinkommen, Bundesmedian und

Armutsgefรคhrdung

4.3 Spezielle Lagekennwerte

4.3.1 Arithmetisches Mittel bei gruppierten Daten

80

โ— Hintergrund โ—

โ— Berechnung โ—

าง๐‘ฅ =1

๐‘›

๐‘—=1

๐‘˜

าง๐‘ฅ๐‘— ๐‘›๐‘— =1

11171.5 ร— 282 + 2.4 ร— 585 + 1.6 ร— 250

โ‰ˆ 1.99

๐‘˜ = 3 Gruppen

าง๐‘ฅ3 = 1.6 ๐‘›3 = 250

๐‘› = 282 + 585 + 250= 1117

4.3 Spezielle Lagekennwerte

81

โ— Klassierung als Spezialfall โ—

๐‘š๐‘— โ‰ˆ าง๐‘ฅ๐‘—> Klassenmitten ersetzen approximativ die Klassenmittel

> Gruppen sind gegeben als GrรถรŸenklassen

> Problem: Klassenmittelwerte hรคufig unbekannt

4.3 Spezielle Lagekennwerte

82

4.3.2 Quantile

โ— Definition und Interpretation โ—

โ— Berechnung bei Urlisten โ—

> Ein x%-Quantil wird (grob) gesagt von x% der Werte unterschritten

und von (100x)% รผberschritten

> Speziell: 50%-Quantil oder 0.5-Quantil = Median

๐‘ฅ0.25 = ๐‘ฅ 7.5 +1 = ๐‘ฅ 8 = 18 320

z. B. 0.25- und 0.9-Quantil:

๐‘ฅ0.9 = 0.5 ๐‘ฅ 27 + ๐‘ฅ 28 = 0.5 41004 + 44981 = 42992.5

0.25 ร— 30 = 7.5 โˆ‰ โ„• 0.9 ร— 30 = 27 โˆˆ โ„•

Werte geordnet!

4.3 Spezielle Lagekennwerte

83

โ— Berechnung bei klassierten Daten โ—

Einfallsklasse des 0.25-Quantils ist hier ๐‘— = 2

๐‘๐‘—โˆ’1 = ๐‘1 = 10, เทจ๐น๐‘› ๐‘1 = 0.067, แˆš๐‘“2/๐‘‘2 = 0.0267

4.3 Spezielle Lagekennwerte

84

๐‘ฅ0.25 โ‰ˆ 10 +0.25 โˆ’ 0.067

0.0267โ‰ˆ 16.85

๐‘ฅ0.9 โ‰ˆ 40 +0.9 โˆ’ 0.867

0.01โ‰ˆ 43.3

4.3 Spezielle Lagekennwerte

85

4.3 Spezielle Lagekennwerte

Beispiel 4.3.1: Dezile und Quintilsverhรคltnis der Einkommensverteilung

86

4.3 Spezielle Lagekennwerte

87

4.3.3 Geometrisches Mittel

โ— Hintergrund โ—

Umsรคtze eines Unternehmens

+10% โˆ’ 10% + 30% (Wachstumsraten)

Problem: 1

30.1 โˆ’ 0.1 + 0.3 = 0.1 aber

1000 ร— 1.1 ร— 1.1 ร— 1.1 = 1331 โ‰  1287

Angabe des durchschnittlichen Wachstums mit 10% nicht sinnvoll

4.3 Spezielle Lagekennwerte

88

โ— Wachstumsfaktoren und Wachstumsraten โ—

โ— Definition und Berechnung โ—

> Wachstumsfaktoren im Beispiel: 1.1, 0.9, 1.3

> Wachstumsraten im Beispiel: +10%, 10%, +30%

Wachstumrate =(Wachstumsfaktor 1) ร— 100%

z.B. 1.3 =1287

990(โ€žspรคterer Zeitpunkt/frรผherer Zeitpunktโ€œ)

าง๐‘ฅ๐‘”๐‘’๐‘œ๐‘š = 1.1 ร— 0.9 ร— 1.3 1/3 โ‰ˆ 1.0877

Damit gilt tatsรคchlich:

1000 ร— าง๐‘ฅ๐‘”๐‘’๐‘œ๐‘š ร— าง๐‘ฅ๐‘”๐‘’๐‘œ๐‘š ร— าง๐‘ฅ๐‘”๐‘’๐‘œ๐‘š = 1000 ร— 1.08773 = 1287

Alternativ: าง๐‘ฅ๐‘”๐‘’๐‘œ๐‘š = 1287/1000 1/3 โ‰ˆ 1.0877

4.3 Spezielle Lagekennwerte

89

4.3 Spezielle Lagekennwerte

90

Beispiel 4.3.2: Wirtschaftswachstum in Deutschland

4.3 Spezielle Lagekennwerte

91

> Durchschnittliches Wachstum des realen BIP von 1994 bis 2007

าง๐‘ฅ๐‘”๐‘’๐‘œ๐‘š = 1.017 ร— 1.008 ร— 1.017 ร—โ‹ฏร— 1.033 1/13 โ‰ˆ 1.016

> Durchschnittliches Wachstum des realen BIP von 2008 bis 2012

าง๐‘ฅ๐‘”๐‘’๐‘œ๐‘š = 1.011 ร— 0.949 ร— 1.040 ร— 1.033 ร— 1.007 1/5 โ‰ˆ 0.007

> Durchschnittliches Wachstum des nominalen BIP von 1994 bis 2012

าง๐‘ฅ๐‘”๐‘’๐‘œ๐‘š = 2666.4/1782.2 1/18 โ‰ˆ 1.023

4.4 Streuungskennwerte

4.4.1 Spannweite

92

โˆ’1, 0, 0, 1, 3, 5, 6 (geordnet!)

R = ๐‘ฅ 7 โˆ’ ๐‘ฅ 1 = 6 โˆ’ โˆ’1 = 7

4.4 Streuungskennwerte

4.4.2 Mittlere absolute Abweichungen

โ— Definition und Berechnung โ—

โˆ’1, 0, 0, 1, 3, 5, 6

๐‘‘โˆ— =1

7โˆ’1 โˆ’ 2 + 0 โˆ’ 2 + 0 โˆ’ 2 + 1 โˆ’ 2 + 3 โˆ’ 2 + 5 โˆ’ 2 + 6 โˆ’ 2

โŸน าง๐‘ฅ = 2:

=1

73 + 2 + 2 + 1 + 1 + 3 + 4 โ‰ˆ 2.29

๐‘‘ =1

7โˆ’1 โˆ’ 1 + 0 โˆ’ 1 + 0 โˆ’ 1 + 1 โˆ’ 1 + 3 โˆ’ 1 + 5 โˆ’ 1 + 6 โˆ’ 1

=1

72 + 1 + 1 + 0 + 2 + 4 + 5 โ‰ˆ 2.14

โŸน ๐‘ฅ0.5= 1:

93

4.4 Streuungskennwerte

94

โ— Interpretation โ—

> ๐‘‘โˆ— ... Durchschnittsabstand aller Werte zum arithmetischen Mittel

(Mittlere absolute Abweichung vom arithmetischen Mittel)

> ๐‘‘ ... Durchschnittsabstand aller Werte zum Median

(Mittlere absolute Abweichung vom Median)

4.4 Streuungskennwerte

95

โ— Berechnung bei klassierten Daten โ—

๐‘‘โˆ— โ‰ˆ1

302 ร— 5 โˆ’ 26 + 8 ร— 15 โˆ’ 26 +โ‹ฏ+ 1 ร— 55 โˆ’ 26 โ‰ˆ 9.33

๐‘‘ โ‰ˆ1

302 ร— 5 โˆ’ 25.02 + 8 ร— 15 โˆ’ 25.02 + โ‹ฏ+ 1 ร— 55 โˆ’ 25.02 โ‰ˆ 9.00

โŸน าง๐‘ฅ = 26

โŸน ๐‘ฅ0.5= 25.02

(Folie 71)

(Folie 75)

4.4 Streuungskennwerte

โ— Median als prรคferierter Bezugswert โ—

96

> ... ๐‘‘ theoretisch fundiert รผber Minimumeigenschaft des Medians

> ... ๐‘‘โˆ— eher unรผblich

Summen laufen jeweils

bis k, j statt i

4.4 Streuungskennwerte

97

4.4.3 Median absoluter Abweichungen

โ— Hintergrund โ—

> Problem: Mittelwerte sind nicht robust, so auch nicht mittlere absolute

Abweichungen (auch nicht wenn Bezugspunkt Median ist)

Beobachtungswerte: 1, 2, 3, 4, 5 โŸน าง๐‘ฅ = 3 ๐‘ฅ0.5= 3

Absolute Abweichungen: 2, 1, 0, 1, 2 โŸน ๐‘‘โˆ— = 1.2

> Situation ohne AusreiรŸer

๐‘‘ = 1.2

1, 2, 3, 4, 500 โŸน าง๐‘ฅ = 102 ๐‘ฅ0.5= 3

Absolute Abweichungen: 101, 100, 99,98,398 โŸน ๐‘‘โˆ— = 159.2

2, 1, 0, 1, 497 โŸน ๐‘‘ = 100.2

> Situation mit AusreiรŸer:

... vom arithmetischen Mittel bzw. Median

... vom arithmetischen Mittel

... vom Median

4.4 Streuungskennwerte

โ— Definition und Berechnung โ—

Situation mit AusreiรŸer: 1, 2, 3, 4, 500

Absolute Abweichungen vom Median: 2, 1, 0, 1, 497

โŸน ๐‘ฅ0.5= 3

Davon der Median: MAD = 1

Geordnet: 0, 1, 1, 2, 497

98

4.4 Streuungskennwerte

Beispiel 4.4.1: Streuung des weltweiten Pro-Kopf-BIP (vgl. Abb. 4.1.2)

99

าง๐‘ฅ = 14 936

๐‘ฅ0.5 = 5 476

๐‘‘ = 12 744

๐‘€๐ด๐ท = 4 722

(alle Einheiten in US-Dollar)

4.4 Streuungskennwerte

4.4.4 Varianz, Standardabweichung und Schwankungsintervalle

โ— Definition und Berechnung โ—

> Empirische Varianz in โ€žoriginรคrer Formelโ€œ

ว๐‘ 2 =1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2

> Empirische Standardabweichung

ว๐‘  = ว๐‘ 2

> Rechenbeispiel:

โˆ’1, 0, 0, 1, 3, 5, 6 โŸน าง๐‘ฅ = 2

โŸน ว๐‘ 2 =1

7โˆ’1 โˆ’ 2 2 + 0 โˆ’ 2 2 + 0 โˆ’ 2 2 +โ‹ฏ 6 โˆ’ 2 2 โ‰ˆ 6.2857

โŸน ว๐‘  = 6.28571 โ‰ˆ 2.51

4.4 Streuungskennwerte

101

โ— Verschiebungsformel fรผr die empirische Varianz โ—

> Allgemeine Verschiebungsformel

1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2 =1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ ๐‘ 2 โˆ’ าง๐‘ฅ โˆ’ ๐‘ 2

> Fรผr c = 0 folgt daraus die Verschiebungsformel fรผr die emirische Varianz

1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2 =1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘–2 โˆ’ าง๐‘ฅ2

> Rechenbeispiel

โˆ’1, 0, 0, 1, 3, 5, 6 โŸน าง๐‘ฅ = 2

โŸน ว๐‘ 2 =1

7โˆ’1 2 + 02 + 02 + 12 + 32 + 52 + 62 โˆ’ 22 โ‰ˆ 6.2857

4.4 Streuungskennwerte

102

โ— Standardabweichung und Interpretation โ—

Es liegen in den empirischen Schwankungsintervallen

าง๐‘ฅ โˆ’ ว๐‘ , าง๐‘ฅ + ว๐‘  , าง๐‘ฅ โˆ’ 2 ว๐‘ , าง๐‘ฅ + 2 ว๐‘  und าง๐‘ฅ โˆ’ 3 ว๐‘ , าง๐‘ฅ + 3 ว๐‘ 

ca. 68% 95% bzw. 99%

aller Beobachtungswerte.

4.4 Streuungskennwerte

103

โ— Hintergrรผnde โ—

Bedeutendstes StreuungsmaรŸ in der Statistik aus verschiedenen Grรผnden...

4.5.1 Varianz bei gruppierten Daten

104

โ— Berechnung โ—

4.5 Spezielle Streuungskennwerte

4.5 Spezielle Streuungskennwerte

105

โ— Beispiel 4.5.1 โ—

าง๐‘ฅ1 = 1.0 าง๐‘ฅ2 = 2.0 าง๐‘ฅ3 = 1.46

ว๐‘ 12 = 0.06 ว๐‘ 2

2 = 0.05 ว๐‘ 32 = 0.0464

๐‘›1 = 3 ๐‘›2 = 4 ๐‘›3 = 5

โŸน าง๐‘ฅ =

๐‘—=1

3

แˆš๐‘“๐‘— าง๐‘ฅ๐‘— =3

12ร— 1.0 +

4

12ร— 2.0 +

5

12ร— 1.46 = 1.525

4.5 Spezielle Streuungskennwerte

106โ— Hintergrรผnde โ—

โ— Interpretation โ—

โŸน

๐‘—=1

3

แˆš๐‘“๐‘— ว๐‘ ๐‘—2 =

3

12ร— 0.06 +

4

12ร— 0.05 +

5

12ร— 0.0464 = 0.051

โŸน

๐‘—=1

3

แˆš๐‘“๐‘— าง๐‘ฅ๐‘— โˆ’ าง๐‘ฅ2=

3

12ร— 1 โˆ’ 1.525 2 +

4

12ร— 2 โˆ’ 1.525 2 +

5

12ร— 1.46 โˆ’ 1.525 2

= 0.145875

โŸน ว๐‘ 2 = 0.051 + 0.145875 = 0.196875

Tatsรคchlich erhรคlt man diesen Wert auch auf โ€žkonventionellem Wegeโ€œ:

ว๐‘ 2 =1

12

๐‘–=1

12

๐‘ฅ๐‘–2 โˆ’ าง๐‘ฅ2 =

1

1212 + 1.32 +โ‹ฏ+ 1.62 โˆ’ 1.5252 = 0.196875

Intern Extern Gesamt

4.5 Spezielle Streuungskennwerte

107

4.5.2 Quantilsabstรคnde

2ฮฑ

4.5 Spezielle Streuungskennwerte

108

Beispiel 4.5.2: Quantilsabstรคnde der Einkommensverteilung

16168

๐‘„0.1 = ๐‘ฅ0.9 โˆ’ ๐‘ฅ0.1 = 35731 โˆ’ 9913 = 25818

๐‘ฅ0.8 โˆ’ ๐‘ฅ0.2 = 29039 โˆ’ 12871 = 16168๐‘„0.2 =

4.5 Spezielle Streuungskennwerte

109

4.5.3 Variationskoeffizient

โ— Hintergrund โ—

> Verschiebungsinvarianz der Varianz ist manchmal stรถrend:

1, 2, 3, 4, 5 โ† identische Varianz โ†’ 15, 16, 17, 18, 19

> Beispiel:

Angenommen, im Rahmen einer Marktstudie wird die Streuung von Preisen

fรผr bestimmte Produkte bei 3 verschiedenen Lebensmitteldiscountern vergli-

chen. Dabei ergeben sich folgende Preise fรผr

100g Speisezalz: 0.29, 0.39, 0.49 Euro

1kg Waschmittel: 19.79, 19.89, 19.99 Euro

Somit erhalten wir:

าง๐‘ฅ๐‘†๐‘Ž๐‘™๐‘ง = 0.39 ว๐‘ ๐‘†๐‘Ž๐‘™๐‘ง = 0.0816

าง๐‘ฅ๐‘Š๐‘Ž๐‘ ๐‘โ„Ž๐‘’๐‘› = 19.89 ว๐‘ ๐‘Š๐‘Ž๐‘ ๐‘โ„Ž๐‘’๐‘› = 0.0816

Bezogen auf das Preisniveau variiert der Preis des Waschmittels

relativ betrachtet weniger als der Preis des Salzes

Identisch!

4.5 Spezielle Streuungskennwerte

110โ— Interpretation โ—

โ— Definition und Berechnung โ—

> Variationskoeffizient als MaรŸ der relativen Streuung:

> Beispiel von zuvor:

> Variationskoeffizient entspricht der Standardabweichung der

prozentualen Abweichungen vom arithmetischen Mittel

๐‘ฃ =ว๐‘ 

าง๐‘ฅnichtnegative Werte mit าง๐‘ฅ > 0 vorausgesetzt

๐‘ฃ๐‘†๐‘Ž๐‘™๐‘ง =ว๐‘ ๐‘†๐‘Ž๐‘™๐‘งาง๐‘ฅ๐‘†๐‘Ž๐‘™๐‘ง

=0.0816

0.39โ‰ˆ 0.209

๐‘ฃ๐‘Š๐‘Ž๐‘ ๐‘โ„Ž๐‘’๐‘› =ว๐‘ ๐‘Š๐‘Ž๐‘ ๐‘โ„Ž๐‘’๐‘›

าง๐‘ฅ๐‘Š๐‘Ž๐‘ ๐‘โ„Ž๐‘’๐‘›=0.0816

19.89โ‰ˆ 0.004

4.5 Spezielle Streuungskennwerte

> Im Beispiel des Salzes mit าง๐‘ฅ๐‘†๐‘Ž๐‘™๐‘ง = 0.39

Preise: 0.29 0.39 0.49

Abweichung in %: โˆ’25.64% 0% 25.64%

111

z. B. 0.49โˆ’0.39

0.39ร— 100% = 25.64%Standardabweichung :

ว๐‘  = ว๐‘ 2 =1

3โˆ’25.64 โˆ’ 0 2 + 0 โˆ’ 0 2 + 25.64 โˆ’ 0 2 โ‰ˆ 20.9

4.5 Spezielle Streuungskennwerte

112

Beispiel 4.5.3: Variationsvergleich von Wechselkursen

าง๐‘ฅ๐‘Œ๐‘ข๐‘Ž๐‘› = 9.49 ว๐‘ ๐‘Œ๐‘ข๐‘Ž๐‘› = 0.93 ๐‘ฃ๐‘Œ๐‘ข๐‘Ž๐‘› = 0.10

าง๐‘ฅ๐ท๐‘œ๐‘™๐‘™๐‘Ž๐‘Ÿ = 1.33 ว๐‘ ๐ท๐‘œ๐‘™๐‘™๐‘Ž๐‘Ÿ = 0.09 ๐‘ฃ๐ท๐‘œ๐‘™๐‘™๐‘Ž๐‘Ÿ = 0.07

4.6 Standardisierung mittels Lage und Streuung

113

โ— Hintergrund โ—

> Beispiel: Einkommensvergleich in zwei unterschiedlichen Lรคndern

Deutscher: 2800 Euro bei einem Durchschnitt von 2500 Euro und einer

Standardabweichung von 150 Euro

Schweizer: 5500 Franken bei einem Durchschnitt von 5000 Franken und

einer Standardabweichung von 400 Franken

โ— Berechnung und Interpretation โ—

> Allgemeine Form:

> Spezialfall Z-Standardisierung:

> Beobachtungswerte aus unterschiedlichen Grundgesamtheiten lassen

sich nicht immer sinnvoll vergleichen

๐‘ง๐‘– =๐‘ฅ๐‘– โˆ’ าง๐‘ฅ

ว๐‘ ๐‘‹

4.6 Standardisierung mittels Lage und Streuung

114

โ— Eigenschaften z-standardisierter Werte โ—

> Im Beispiel von zuvor

Deutscher:2800 โˆ’ 2500

150= 2 Schweizer:

5500 โˆ’ 5000

400= 1.25

Fazit: Deutscher (Schweizer) liegt 2 (1.25) Standardabweichungen รผber

dem Durchschnitt

> Mittelwert z-standardisierter Werte ist stets 0:

าง๐‘ง =1

๐‘›

๐‘–=1

๐‘›

๐‘ง๐‘– =1

๐‘›

๐‘–=1

๐‘›๐‘ฅ๐‘– โˆ’ าง๐‘ฅ

ว๐‘ ๐‘‹

=1

๐‘› ว๐‘ ๐‘‹

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ = 0 (vgl. Folie 69)

4.6 Standardisierung mittels Lage und Streuung

ว๐‘ ๐‘2 =

1

๐‘›

๐‘–=1

๐‘›

๐‘ง๐‘– โˆ’ าง๐‘ง 2 =1

๐‘›

๐‘–=1

๐‘›

๐‘ง๐‘–2 โˆ’ าง๐‘ง2 =

1

๐‘›

๐‘–=1

๐‘›

๐‘ง๐‘–2

> Varianz (Standardabweichung) z-standardisierter Werte ist stets 1:

=1

๐‘›

๐‘–=1

๐‘›๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2

ว๐‘ ๐‘‹2 =

1

ว๐‘ ๐‘‹2 ร—

1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2 =1

ว๐‘ ๐‘‹2 ร— ว๐‘ ๐‘‹

2 = 1

115

116

Beispiel 4.6.1: Standardisierte Zeitreihen

4.6 Standardisierung mittels Lage und Streuung

4.7 Messung von Schiefe

117

โ— Konzept und Definition โ—

> Feststellung: Bei schiefen Verteilungen liegen obere und untere Quantile

gewรถhnlich unterschiedlich weit vom Median entfernt

> Erster Vorschritt: Zerlegung des Quantilsabstands im Sinne von

๐‘ฅ1โˆ’๐›ผ โˆ’ ๐‘ฅ๐›ผ = ๐‘ฅ0.5 โˆ’ ๐‘ฅ๐›ผ + ๐‘ฅ1โˆ’๐›ผ โˆ’ ๐‘ฅ0.5

๐‘„๐›ผ

4.7 Messung von Schiefe

โ— Interpretation โ—

QS

118

> Quantilskoeffizient der Schiefe setzt die Differenz der beiden Abstรคnde

ins Verhรคltnis zum Quantilsabstand (siehe Kasten)

... siehe Kasten

119

Beispiel 4.7.1: Schiefe der Einkommensverteilung

4.7 Messung von Schiefe

๐‘„๐‘†0.1 =๐‘ฅ0.9 โˆ’ ๐‘ฅ0.5 โˆ’ ๐‘ฅ0.5 โˆ’ ๐‘ฅ0.1

๐‘ฅ0.9 โˆ’ ๐‘ฅ0.1=

35731 โˆ’ 19595 โˆ’ 19595 โˆ’ 9913

35731 โˆ’ 9913

โ‰ˆ 0.25

๐‘„๐‘†0.1 = 0.25

๐‘„๐‘†0.2 = 0.17

๐‘„๐‘†0.3 = 0.10

4.8 Darstellung und Messung von Konzentration

4.8.1 Lorenz-Kurve

โ— Was versteht man unter Konzentration? โ—

โ— Beispiel 4.8.1 โ—

Man vergleiche die folgenden beiden Datensรคtze

Merkmalssumme jeweils = 20

Wie verteilt sich diese auf die einzelnen Merkmalstrรคger?

Wie stark ist die Ungleichverteilung (Konzentration) ausgeprรคgt?

Man stelle sich 3 Branchen mit jeweils 5 Firmen vor:

120Feststellung: Phรคnomen der Konzentration wird durch her-

kรถmmliche MaรŸe nicht adรคquat gemessen

4.8 Darstellung und Messung von Konzentration

โ— Konstruktion einer Lorenzkurve โ—

121

4.8 Darstellung und Messung von Konzentration

โ— Interpretation โ—

122

> Die Flรคche zwischen Lorenzkurve und Winkelhalbierender wird immer

dann groรŸ, wenn

> Keine Konzentration liegt vor, wenn die Lorenzkurve mit der Winkel-

halbierenden zusammenfรคllt. Dann

> Beispiel: Koordinatenpunkte der Lorenzkurve, falls Branche mit 5 Unter-

nehmen keinerlei Konzentration aufweist:

wenige Merkmalstrรคger (relativ) viel von der Merkmalssumme

auf sich vereinigen.

sind alle Werte gleich. Damit verteilt sich die Merkmalssumme

gleichmรครŸig auf die Merkmalstrรคger.

(0, 0), (0.2, 0.2), (0.4, 0.4), (0.6, 0.6), (0.8, 0.8), (1, 1)

4.8 Darstellung und Messung von Konzentration

123

4.8.2 Gini-Koeffizient

โ— Definition und Interpretation โ—

> (Nichtnormierter) Gini-Koeffizient:

Zweifaches der Flรคche zwischen Lorenzkurve und Winkelhalbierender

> Gini-Koeffizient = 0, falls alle Werte gleich sind

> Gini-Koeffizient โ‰ˆ 1 bei maximaler Konzentration, d. h. wenn ein ein-

zelner Merkmalstrรคger die gesamte Merkmalssumme auf sich vereint

4.8 Darstellung und Messung von Konzentration

โ— Berechnung โ—

124

Formel: G =2ฯƒ ๐‘–๐‘ฅ ๐‘–

๐‘›ฯƒ๐‘ฅ๐‘–โˆ’๐‘› + 1

๐‘›

Beispielrechnung fรผr Branche 3:

20, 40, 60, 80, 100 (geordnet!)

โ‡’ ๐บ3 =2 1 ร— 20 + 2 ร— 40 + 3 ร— 60 + 4 ร— 80 + 5 ร— 100

5 ร— 300โˆ’6

5

โ‰ˆ 0.2667

Analog: ๐บ1 = 0.76, ๐บ2 = 0.1975

4.8 Darstellung und Messung von Konzentration

โ— Wertebereich und Normierung โ—

๐บ ist maximal ๐‘›โˆ’1

๐‘›; soll der Maximalwert = 1 sein:

๐บโˆ— =๐‘›

๐‘› โˆ’ 1๐บ

Normierter Gini-Koeffizient

4.8 Darstellung und Messung von Konzentration

โ— Vorsicht bei der Interpretation โ—

126vgl. Fahrmeir et al. (2010)

Fazit:

๐บ๐ด = 0.4 ๐บ๐ต = 0.4

Gini-Koeffizient allein verrรคt nicht alles!

4.8 Darstellung und Messung von Konzentration

Beispiel 4.8.2: Konzentration von Einkommen in Deutschland

127

4.9 Spezifische Eigenschaften empirischer Kennwerte

4.9.1 Minimumeigenschaft des arithmetischen Mittels

128

โ— Hintergrund โ—

> Bekannt: ว๐‘ 2 =1

๐‘›ฯƒ๐‘–=1๐‘› ๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2 verwendet าง๐‘ฅ als Referenzpunkt in

der Frage โ€žWie stark streuen die Werte um ...?โ€œ

> Frage: Welcher Referenzpunkt c minimiert den Ausdruck1

๐‘›ฯƒ๐‘–=1๐‘› ๐‘ฅ๐‘– โˆ’ ๐‘ 2?

> Antwort: Die Lรถsung lautet tatsรคchlich ๐‘ = าง๐‘ฅ

โ— Analytischer Nachweis โ—

> Minimierungsproblem: min๐‘

๐‘“ ๐‘ mit ๐‘“ ๐‘ =1

๐‘›ฯƒ๐‘–=1๐‘› ๐‘ฅ๐‘– โˆ’ ๐‘ 2

๐‘‘๐‘“ ๐‘

๐‘‘๐‘= โˆ’

2

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ ๐‘ = โˆ’2

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– +2

๐‘›

๐‘–=1

๐‘›

๐‘

4.9 Spezifische Eigenschaften empirischer Kennwerte

129

> Alternativ: Betrachte allgemeine Verschiebungsformel (Folie 101)

1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2 =1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ ๐‘ 2 โˆ’ าง๐‘ฅ โˆ’ ๐‘ 2

ว๐‘ 2

โ‡”1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ ๐‘ 2 = ว๐‘ 2 + าง๐‘ฅ โˆ’ ๐‘ 2

= โˆ’2 าง๐‘ฅ + 2๐‘ = 2 ๐‘ โˆ’ าง๐‘ฅ

โ‡’ ๐‘“ minimal fรผr ๐‘ = าง๐‘ฅ

Ist minimal, falls ๐‘ = าง๐‘ฅ

4.9 Spezifische Eigenschaften empirischer Kennwerte

โ— Beispiel 4.9.1 โ—

130

Fall 1 : 1, 0, 0, 1, 3, 5, 6

โ‡’ าง๐‘ฅ = 2, ว๐‘ 2= 6.28571

Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6

โ‡’ าง๐‘ฅ = 2.25, ว๐‘ 2= 5.9375

โ‡’ ๐‘“1 ๐‘ = 2 โˆ’ ๐‘ 2 + 6.28571 โ‡’ ๐‘“2 ๐‘ = 2.25 โˆ’ ๐‘ 2 + 5.9375

4.9 Spezifische Eigenschaften empirischer Kennwerte

131

4.9.2 Minimumeigenschaft des Medians

132

โ— Hintergrund โ—

4.9 Spezifische Eigenschaften empirischer Kennwerte

> Bekannt: ๐‘‘ =1

๐‘›ฯƒ๐‘–=1๐‘› ๐‘ฅ๐‘– โˆ’ ๐‘ฅ0.5 verwendet ๐‘ฅ0.5 als Referenzpunkt in

der Frage โ€žWie stark streuen die Werte um ...?โ€œ

> Frage: Welcher Referenzpunkt c minimiert den Ausdruck 1

๐‘›ฯƒ๐‘–=1๐‘› ๐‘ฅ๐‘– โˆ’ ๐‘ ?

> Antwort: Die Lรถsung lautet tatsรคchlich ๐‘ = ๐‘ฅ0.5

โ— Analytischer Nachweis โ—

> Minimierungsproblem: min๐‘

แˆš๐‘“ ๐‘ mit แˆš๐‘“ ๐‘ =1

๐‘›ฯƒ๐‘–=1๐‘› ๐‘ฅ๐‘– โˆ’ ๐‘

> Jedoch: แˆš๐‘“ analytisch nicht gut handhabbar (teils nicht differenzierbar)

> Minimumeigenschaft jedoch einsichtig (โ€žinformaler Beweisโ€œ)

auch keine Streuungzerlegungsformel

4.9 Spezifische Eigenschaften empirischer Kennwerte

133

โ— Beispiel 4.9.2 โ—

4.9 Spezifische Eigenschaften empirischer Kennwerte

134

Fall 1 : 1, 0, 0, 1, 3, 5, 6

โ‡’ ๐‘ฅ0.5 = 1

Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6

โ‡’ แˆš๐‘“1 ๐‘ =1

7แˆพ โˆ’1 โˆ’ ๐‘ + 0 โˆ’ ๐‘

แˆฟ+โ‹ฏ+ 6 โˆ’ ๐‘

โ‡’ ๐‘ฅ0.5 = 2

โ‡’ แˆš๐‘“2 ๐‘ =1

8แˆพ โˆ’1 โˆ’ ๐‘ + |0 โˆ’ ๐‘|

แˆฟ+โ‹ฏ+ 6 โˆ’ ๐‘

4.9 Spezifische Eigenschaften empirischer Kennwerte

135

4.9.3 Transformationseigenschaften

โ— Arten von Transformationen โ—

4.9 Spezifische Eigenschaften empirischer Kennwerte

136

> Verschiebung:

> Ursprungswerte ๐‘ฅ1, ๐‘ฅ2, โ€ฆ , ๐‘ฅ๐‘› sollen einheitlich transformiert werden

> Umskalierung:

> Beispiel:

Ursprungswerte: 1, 0, 0, 1, 3, 5, 6

Verschiebung um ๐‘ = 9:

Umskalierung mit ๐‘ = 2:

๐‘ข๐‘– = ๐‘ฅ๐‘– + ๐‘ fรผr ๐‘– = 1, โ€ฆ , ๐‘›

๐‘ข๐‘– = ๐‘๐‘ฅ๐‘– fรผr ๐‘– = 1,โ€ฆ , ๐‘› und ๐‘ > 0

8, 9, 9, 10, 12, 14, 15

2, 0, 0, 2, 6, 10, 12

4.9 Spezifische Eigenschaften empirischer Kennwerte

137

4.9 Spezifische Eigenschaften empirischer Kennwerte

138

โ— Verschiebungsรคquivarianz und Verschiebungsinvarianz โ—

> ร„quivarianz ... โ€žGleichartige Verรคnderlichkeitโ€œ bei Transformation

> Invarianz ... โ€žUnverรคnderlichkeit โ€œ bei Transformation

> Beispiel 1: Verschiebungsรคquivarianz des arithmetischen Mittels:

เดค๐‘ข =1

๐‘›

๐‘–=1

๐‘›

๐‘ข๐‘– =1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– + ๐‘ =

Transformation: ๐‘ข๐‘– = ๐‘ฅ๐‘– + ๐‘

= าง๐‘ฅ +1

๐‘›ร— ๐‘›๐‘ = าง๐‘ฅ + ๐‘

= าง๐‘ฅ + ๐‘

4.9 Spezifische Eigenschaften empirischer Kennwerte

139

> Beispiel 2: Verschiebungsinvarianz der (empirischen) Varianz

โ— Skalenรคquivarianz und Skaleninvarianz โ—

> Beispiel 3: Skalenรคquivarianz des arithmetischen Mittels

ว๐‘ ๐‘ˆ2 =

1

๐‘›

๐‘–=1

๐‘›

๐‘ข๐‘– โˆ’ เดค๐‘ข 2 =1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– + ๐‘ โˆ’ าง๐‘ฅ โˆ’ ๐‘ 2

=1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2

= ว๐‘ ๐‘‹2

Transformation: ๐‘ข๐‘– = ๐‘๐‘ฅ๐‘–

เดค๐‘ข =1

๐‘›

๐‘–=1

๐‘›

๐‘ข๐‘– =1

๐‘›

๐‘–=1

๐‘›

๐‘๐‘ฅ๐‘– = ๐‘ ร—1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– = ๐‘ าง๐‘ฅ

4.9 Spezifische Eigenschaften empirischer Kennwerte

140

> Beispiel 4: Skalenรคquivarianz der Standardabweichung

Transformation: ๐‘ข๐‘– = ๐‘๐‘ฅ๐‘– mit ๐‘ > 0

ว๐‘ ๐‘ˆ2 =

1

๐‘›

๐‘–=1

๐‘›

๐‘ข๐‘– โˆ’ เดค๐‘ข 2 =1

๐‘›

๐‘–=1

๐‘›

๐‘๐‘ฅ๐‘– โˆ’ ๐‘ าง๐‘ฅ 2

= ๐‘2 ร—1

๐‘›

๐‘–=1

๐‘›

๐‘ฅ๐‘– โˆ’ าง๐‘ฅ 2

= ๐‘2 ว๐‘ ๐‘‹2

=> Fazit: Varianz ist weder รคquivariant noch invariant, aber

ว๐‘ ๐‘ˆ = ว๐‘ ๐‘ˆ2 = ๐‘2 ว๐‘ ๐‘‹

2 = ๐‘ ว๐‘ ๐‘‹

=> Fazit: Standardabweichung ist skalenรคquivariant

Beachte: ๐‘ > 0

4.9 Spezifische Eigenschaften empirischer Kennwerte

141

โ— Eigenschaften weiterer Kennwerte โ—

4.9 Spezifische Eigenschaften empirischer Kennwerte

142

โ— Eigenschaften standardisierter Werte โ—

> Bei Verschiebung ๐‘ข๐‘– = ๐‘ฅ๐‘– + ๐‘ gilt: เดค๐‘ข = าง๐‘ฅ + ๐‘ und ว๐‘ ๐‘ˆ = ว๐‘ ๐‘‹

> Bei Umskalierung ๐‘ข๐‘– = ๐‘๐‘ฅ๐‘– gilt: เดค๐‘ข = ๐‘ าง๐‘ฅ und ว๐‘ ๐‘ˆ = ๐‘ ว๐‘ ๐‘‹

Daraus folgt bei einer Standardisierung verschobener Werte:

Daraus folgt bei einer Standardisierung verschobener Werte:

> Fazit: Verschiebungen und Umskalierungen wirken sich nicht

auf standardisierte Werte aus

๐‘ง๐‘– =๐‘ข๐‘– โˆ’ เดค๐‘ข

ว๐‘ ๐‘ˆ=๐‘ฅ๐‘– + ๐‘ โˆ’ าง๐‘ฅ โˆ’ ๐‘

ว๐‘ ๐‘‹=๐‘ฅ๐‘– โˆ’ าง๐‘ฅ

ว๐‘ ๐‘‹

๐‘ง๐‘– =๐‘ข๐‘– โˆ’ เดค๐‘ข

ว๐‘ ๐‘ˆ=๐‘๐‘ฅ๐‘– โˆ’ ๐‘ าง๐‘ฅ

๐‘ ว๐‘ ๐‘‹=๐‘ฅ๐‘– โˆ’ าง๐‘ฅ

ว๐‘ ๐‘‹

4.9 Spezifische Eigenschaften empirischer Kennwerte

143

4.9.4 Robustheit

โ— Zum Begriff โ—

4.9 Spezifische Eigenschaften empirischer Kennwerte

144

โ— Robuste und nicht robuste Kennwerte โ—

โ— Anmerkungen zur kritischen Verwendung โ—