4 Spezifizierende Beschreibung empirischer Verteilungen
4.1 Spezifika empirischer Verteilungen
4.2 Lagekennwerte
4.2.3 Modalwert
4.3.1 Arithmetisches Mittel bei gruppierten Daten
4.2.1 Arithmetisches Mittel
4.2.2 Median
4.2.4 Fechnerโsche Lageregeln
4.3 Spezielle Lagekennwerte
4.3.2 Quantile
4.3.3 Geometrisches Mittel
65
69
69
73
77
78
80
80
82
87
4.4 Streuungskennwerte
4.4.1 Spannweite
92
92
4.4.2 Mittlere absolute Abweichungen 93
4 Spezifizierende Beschreibung empirischer Verteilungen
4.4.3 Median absoluter Abweichungen
4.4.4 Varianz, Standardabweichung und Schwankungsintervalle
4.5.2 Quantilsabstรคnde
4.7 Messung von Schiefe
4.5 Spezielle Streuungskennwerte
4.5.1 Varianz bei gruppierten Daten
4.5.3 Variationskoeffizient
4.6 Standardisierung mittels Lage und Streuung
4.8 Darstellung und Messung von Konzentration
97
100
104
104
107
109
113
117
120
4.8.1 Lorenzkurve
4.8.2 Gini-Koeffizient
120
123
4 Spezifizierende Beschreibung empirischer Verteilungen
64
4.9 Spezifische Eigenschaften empirischer Kennwerte 128
4.9.1 Minimumeigenschaft des arithmetischen Mittels
4.9.2 Minimumeigenschaft des Medians
128
132
4.9.3 Transformationseigenschaften 136
4.9.4 Robustheit 144
65
4.1 Spezifika empirischer Verteilungen
โ Unimodalitรคt und Multimodalitรคt โ
โ Symmetrie und Schiefe โ
โ Lage und Streuung โ
4.2 Lagekennwerte
4.2.1 Arithmetisches Mittel
โ Definition und Berechnung โ
69
าง๐ฅ =1
๐
๐=1
๐
๐ฅ๐
> Gegeben metrisch skalierte Beobachtungswerte ๐ฅ1, ๐ฅ2,... ๐ฅ๐:
> Merkmalssumme
๐=1
๐
๐ฅ๐ = ๐ ร าง๐ฅ
โ Interpretation โ
๐=1
๐
๐ฅ๐ โ าง๐ฅ = 0 Schwerpunkteigenschaft
4.2 Lagekennwerte
71โ Kein robuster Kennwert โ
> Feststellung: Bei gleichmรครiger Verteilung aller Werte innerhalb der Klassen
stimmen Klassenmittelwert und Klassenmitte ungefรคhr รผberein
> Im Beispiel (Tab. 4.2.1) gilt deshalb mit k = 6 Klassen:
าง๐ฅ โ1
๐
๐=1
6
๐๐ ๐๐
=1
305 ร 2 + 15 ร 8 + 25 ร 10 + 35 ร 6 + 45 ร 3 + 55 ร 1
= 26
๐๐ ... Klassenmitte der j-ten Klasse
๐6
๐6
4.2 Lagekennwerte
73
4.2.2 Median
โ Definition und Interpretation โ
โ Berechnung bei Urlisten โ
โ1, 0, 0, 1, 3, 5, 6 โ1, 0, 1, 3, 5, 6
๐ฅ1 = 0, ๐ฅ2 = 1, ๐ฅ3 = 5, ๐ฅ4 = 6, ๐ฅ5 = 3, ๐ฅ6 = 0, ๐ฅ7 = โ1
Geordnete Werte:๐ฅ 1 = โ1, ๐ฅ 2 = 0, ๐ฅ 3 = 0, ๐ฅ 4 = 1, ๐ฅ 5 = 3, ๐ฅ 6 = 5, ๐ฅ 7 = 6
๐ฅ0.5 = 1 ๐ฅ0.5 = 2
๐ฅ0.5 = ๐ฅ ๐+12
= ๐ฅ 7+12
= ๐ฅ 4 = 1
๐ = 7 ungerade:
๐ฅ0.5 = 0.5 ๐ฅ ๐/2 + ๐ฅ ๐/2+1 falls n gerade wรคre
4.2 Lagekennwerte
74
โ Berechnung bei klassierten Daten โ
Einfallsklasse des Medians ist hier ๐ = 3
๐๐โ1 = ๐2 = 20, เทจ๐น๐ ๐2 = 0.333, แ๐3/๐3 = 0.0333
4.3 Spezielle Lagekennwerte
4.3.1 Arithmetisches Mittel bei gruppierten Daten
80
โ Hintergrund โ
โ Berechnung โ
าง๐ฅ =1
๐
๐=1
๐
าง๐ฅ๐ ๐๐ =1
11171.5 ร 282 + 2.4 ร 585 + 1.6 ร 250
โ 1.99
๐ = 3 Gruppen
าง๐ฅ3 = 1.6 ๐3 = 250
๐ = 282 + 585 + 250= 1117
4.3 Spezielle Lagekennwerte
81
โ Klassierung als Spezialfall โ
๐๐ โ าง๐ฅ๐> Klassenmitten ersetzen approximativ die Klassenmittel
> Gruppen sind gegeben als Grรถรenklassen
> Problem: Klassenmittelwerte hรคufig unbekannt
4.3 Spezielle Lagekennwerte
82
4.3.2 Quantile
โ Definition und Interpretation โ
โ Berechnung bei Urlisten โ
> Ein x%-Quantil wird (grob) gesagt von x% der Werte unterschritten
und von (100x)% รผberschritten
> Speziell: 50%-Quantil oder 0.5-Quantil = Median
๐ฅ0.25 = ๐ฅ 7.5 +1 = ๐ฅ 8 = 18 320
z. B. 0.25- und 0.9-Quantil:
๐ฅ0.9 = 0.5 ๐ฅ 27 + ๐ฅ 28 = 0.5 41004 + 44981 = 42992.5
0.25 ร 30 = 7.5 โ โ 0.9 ร 30 = 27 โ โ
Werte geordnet!
4.3 Spezielle Lagekennwerte
83
โ Berechnung bei klassierten Daten โ
Einfallsklasse des 0.25-Quantils ist hier ๐ = 2
๐๐โ1 = ๐1 = 10, เทจ๐น๐ ๐1 = 0.067, แ๐2/๐2 = 0.0267
4.3 Spezielle Lagekennwerte
84
๐ฅ0.25 โ 10 +0.25 โ 0.067
0.0267โ 16.85
๐ฅ0.9 โ 40 +0.9 โ 0.867
0.01โ 43.3
4.3 Spezielle Lagekennwerte
Beispiel 4.3.1: Dezile und Quintilsverhรคltnis der Einkommensverteilung
86
4.3 Spezielle Lagekennwerte
87
4.3.3 Geometrisches Mittel
โ Hintergrund โ
Umsรคtze eines Unternehmens
+10% โ 10% + 30% (Wachstumsraten)
Problem: 1
30.1 โ 0.1 + 0.3 = 0.1 aber
1000 ร 1.1 ร 1.1 ร 1.1 = 1331 โ 1287
Angabe des durchschnittlichen Wachstums mit 10% nicht sinnvoll
4.3 Spezielle Lagekennwerte
88
โ Wachstumsfaktoren und Wachstumsraten โ
โ Definition und Berechnung โ
> Wachstumsfaktoren im Beispiel: 1.1, 0.9, 1.3
> Wachstumsraten im Beispiel: +10%, 10%, +30%
Wachstumrate =(Wachstumsfaktor 1) ร 100%
z.B. 1.3 =1287
990(โspรคterer Zeitpunkt/frรผherer Zeitpunktโ)
าง๐ฅ๐๐๐๐ = 1.1 ร 0.9 ร 1.3 1/3 โ 1.0877
Damit gilt tatsรคchlich:
1000 ร าง๐ฅ๐๐๐๐ ร าง๐ฅ๐๐๐๐ ร าง๐ฅ๐๐๐๐ = 1000 ร 1.08773 = 1287
Alternativ: าง๐ฅ๐๐๐๐ = 1287/1000 1/3 โ 1.0877
4.3 Spezielle Lagekennwerte
91
> Durchschnittliches Wachstum des realen BIP von 1994 bis 2007
าง๐ฅ๐๐๐๐ = 1.017 ร 1.008 ร 1.017 รโฏร 1.033 1/13 โ 1.016
> Durchschnittliches Wachstum des realen BIP von 2008 bis 2012
าง๐ฅ๐๐๐๐ = 1.011 ร 0.949 ร 1.040 ร 1.033 ร 1.007 1/5 โ 0.007
> Durchschnittliches Wachstum des nominalen BIP von 1994 bis 2012
าง๐ฅ๐๐๐๐ = 2666.4/1782.2 1/18 โ 1.023
4.4 Streuungskennwerte
4.4.1 Spannweite
92
โ1, 0, 0, 1, 3, 5, 6 (geordnet!)
R = ๐ฅ 7 โ ๐ฅ 1 = 6 โ โ1 = 7
4.4 Streuungskennwerte
4.4.2 Mittlere absolute Abweichungen
โ Definition und Berechnung โ
โ1, 0, 0, 1, 3, 5, 6
๐โ =1
7โ1 โ 2 + 0 โ 2 + 0 โ 2 + 1 โ 2 + 3 โ 2 + 5 โ 2 + 6 โ 2
โน าง๐ฅ = 2:
=1
73 + 2 + 2 + 1 + 1 + 3 + 4 โ 2.29
๐ =1
7โ1 โ 1 + 0 โ 1 + 0 โ 1 + 1 โ 1 + 3 โ 1 + 5 โ 1 + 6 โ 1
=1
72 + 1 + 1 + 0 + 2 + 4 + 5 โ 2.14
โน ๐ฅ0.5= 1:
93
4.4 Streuungskennwerte
94
โ Interpretation โ
> ๐โ ... Durchschnittsabstand aller Werte zum arithmetischen Mittel
(Mittlere absolute Abweichung vom arithmetischen Mittel)
> ๐ ... Durchschnittsabstand aller Werte zum Median
(Mittlere absolute Abweichung vom Median)
4.4 Streuungskennwerte
95
โ Berechnung bei klassierten Daten โ
๐โ โ1
302 ร 5 โ 26 + 8 ร 15 โ 26 +โฏ+ 1 ร 55 โ 26 โ 9.33
๐ โ1
302 ร 5 โ 25.02 + 8 ร 15 โ 25.02 + โฏ+ 1 ร 55 โ 25.02 โ 9.00
โน าง๐ฅ = 26
โน ๐ฅ0.5= 25.02
(Folie 71)
(Folie 75)
4.4 Streuungskennwerte
โ Median als prรคferierter Bezugswert โ
96
> ... ๐ theoretisch fundiert รผber Minimumeigenschaft des Medians
> ... ๐โ eher unรผblich
Summen laufen jeweils
bis k, j statt i
4.4 Streuungskennwerte
97
4.4.3 Median absoluter Abweichungen
โ Hintergrund โ
> Problem: Mittelwerte sind nicht robust, so auch nicht mittlere absolute
Abweichungen (auch nicht wenn Bezugspunkt Median ist)
Beobachtungswerte: 1, 2, 3, 4, 5 โน าง๐ฅ = 3 ๐ฅ0.5= 3
Absolute Abweichungen: 2, 1, 0, 1, 2 โน ๐โ = 1.2
> Situation ohne Ausreiรer
๐ = 1.2
1, 2, 3, 4, 500 โน าง๐ฅ = 102 ๐ฅ0.5= 3
Absolute Abweichungen: 101, 100, 99,98,398 โน ๐โ = 159.2
2, 1, 0, 1, 497 โน ๐ = 100.2
> Situation mit Ausreiรer:
... vom arithmetischen Mittel bzw. Median
... vom arithmetischen Mittel
... vom Median
4.4 Streuungskennwerte
โ Definition und Berechnung โ
Situation mit Ausreiรer: 1, 2, 3, 4, 500
Absolute Abweichungen vom Median: 2, 1, 0, 1, 497
โน ๐ฅ0.5= 3
Davon der Median: MAD = 1
Geordnet: 0, 1, 1, 2, 497
98
4.4 Streuungskennwerte
Beispiel 4.4.1: Streuung des weltweiten Pro-Kopf-BIP (vgl. Abb. 4.1.2)
99
าง๐ฅ = 14 936
๐ฅ0.5 = 5 476
๐ = 12 744
๐๐ด๐ท = 4 722
(alle Einheiten in US-Dollar)
4.4 Streuungskennwerte
4.4.4 Varianz, Standardabweichung und Schwankungsintervalle
โ Definition und Berechnung โ
> Empirische Varianz in โoriginรคrer Formelโ
ว๐ 2 =1
๐
๐=1
๐
๐ฅ๐ โ าง๐ฅ 2
> Empirische Standardabweichung
ว๐ = ว๐ 2
> Rechenbeispiel:
โ1, 0, 0, 1, 3, 5, 6 โน าง๐ฅ = 2
โน ว๐ 2 =1
7โ1 โ 2 2 + 0 โ 2 2 + 0 โ 2 2 +โฏ 6 โ 2 2 โ 6.2857
โน ว๐ = 6.28571 โ 2.51
4.4 Streuungskennwerte
101
โ Verschiebungsformel fรผr die empirische Varianz โ
> Allgemeine Verschiebungsformel
1
๐
๐=1
๐
๐ฅ๐ โ าง๐ฅ 2 =1
๐
๐=1
๐
๐ฅ๐ โ ๐ 2 โ าง๐ฅ โ ๐ 2
> Fรผr c = 0 folgt daraus die Verschiebungsformel fรผr die emirische Varianz
1
๐
๐=1
๐
๐ฅ๐ โ าง๐ฅ 2 =1
๐
๐=1
๐
๐ฅ๐2 โ าง๐ฅ2
> Rechenbeispiel
โ1, 0, 0, 1, 3, 5, 6 โน าง๐ฅ = 2
โน ว๐ 2 =1
7โ1 2 + 02 + 02 + 12 + 32 + 52 + 62 โ 22 โ 6.2857
4.4 Streuungskennwerte
102
โ Standardabweichung und Interpretation โ
Es liegen in den empirischen Schwankungsintervallen
าง๐ฅ โ ว๐ , าง๐ฅ + ว๐ , าง๐ฅ โ 2 ว๐ , าง๐ฅ + 2 ว๐ und าง๐ฅ โ 3 ว๐ , าง๐ฅ + 3 ว๐
ca. 68% 95% bzw. 99%
aller Beobachtungswerte.
4.4 Streuungskennwerte
103
โ Hintergrรผnde โ
Bedeutendstes Streuungsmaร in der Statistik aus verschiedenen Grรผnden...
4.5 Spezielle Streuungskennwerte
105
โ Beispiel 4.5.1 โ
าง๐ฅ1 = 1.0 าง๐ฅ2 = 2.0 าง๐ฅ3 = 1.46
ว๐ 12 = 0.06 ว๐ 2
2 = 0.05 ว๐ 32 = 0.0464
๐1 = 3 ๐2 = 4 ๐3 = 5
โน าง๐ฅ =
๐=1
3
แ๐๐ าง๐ฅ๐ =3
12ร 1.0 +
4
12ร 2.0 +
5
12ร 1.46 = 1.525
4.5 Spezielle Streuungskennwerte
106โ Hintergrรผnde โ
โ Interpretation โ
โน
๐=1
3
แ๐๐ ว๐ ๐2 =
3
12ร 0.06 +
4
12ร 0.05 +
5
12ร 0.0464 = 0.051
โน
๐=1
3
แ๐๐ าง๐ฅ๐ โ าง๐ฅ2=
3
12ร 1 โ 1.525 2 +
4
12ร 2 โ 1.525 2 +
5
12ร 1.46 โ 1.525 2
= 0.145875
โน ว๐ 2 = 0.051 + 0.145875 = 0.196875
Tatsรคchlich erhรคlt man diesen Wert auch auf โkonventionellem Wegeโ:
ว๐ 2 =1
12
๐=1
12
๐ฅ๐2 โ าง๐ฅ2 =
1
1212 + 1.32 +โฏ+ 1.62 โ 1.5252 = 0.196875
Intern Extern Gesamt
4.5 Spezielle Streuungskennwerte
108
Beispiel 4.5.2: Quantilsabstรคnde der Einkommensverteilung
16168
๐0.1 = ๐ฅ0.9 โ ๐ฅ0.1 = 35731 โ 9913 = 25818
๐ฅ0.8 โ ๐ฅ0.2 = 29039 โ 12871 = 16168๐0.2 =
4.5 Spezielle Streuungskennwerte
109
4.5.3 Variationskoeffizient
โ Hintergrund โ
> Verschiebungsinvarianz der Varianz ist manchmal stรถrend:
1, 2, 3, 4, 5 โ identische Varianz โ 15, 16, 17, 18, 19
> Beispiel:
Angenommen, im Rahmen einer Marktstudie wird die Streuung von Preisen
fรผr bestimmte Produkte bei 3 verschiedenen Lebensmitteldiscountern vergli-
chen. Dabei ergeben sich folgende Preise fรผr
100g Speisezalz: 0.29, 0.39, 0.49 Euro
1kg Waschmittel: 19.79, 19.89, 19.99 Euro
Somit erhalten wir:
าง๐ฅ๐๐๐๐ง = 0.39 ว๐ ๐๐๐๐ง = 0.0816
าง๐ฅ๐๐๐ ๐โ๐๐ = 19.89 ว๐ ๐๐๐ ๐โ๐๐ = 0.0816
Bezogen auf das Preisniveau variiert der Preis des Waschmittels
relativ betrachtet weniger als der Preis des Salzes
Identisch!
4.5 Spezielle Streuungskennwerte
110โ Interpretation โ
โ Definition und Berechnung โ
> Variationskoeffizient als Maร der relativen Streuung:
> Beispiel von zuvor:
> Variationskoeffizient entspricht der Standardabweichung der
prozentualen Abweichungen vom arithmetischen Mittel
๐ฃ =ว๐
าง๐ฅnichtnegative Werte mit าง๐ฅ > 0 vorausgesetzt
๐ฃ๐๐๐๐ง =ว๐ ๐๐๐๐งาง๐ฅ๐๐๐๐ง
=0.0816
0.39โ 0.209
๐ฃ๐๐๐ ๐โ๐๐ =ว๐ ๐๐๐ ๐โ๐๐
าง๐ฅ๐๐๐ ๐โ๐๐=0.0816
19.89โ 0.004
4.5 Spezielle Streuungskennwerte
> Im Beispiel des Salzes mit าง๐ฅ๐๐๐๐ง = 0.39
Preise: 0.29 0.39 0.49
Abweichung in %: โ25.64% 0% 25.64%
111
z. B. 0.49โ0.39
0.39ร 100% = 25.64%Standardabweichung :
ว๐ = ว๐ 2 =1
3โ25.64 โ 0 2 + 0 โ 0 2 + 25.64 โ 0 2 โ 20.9
4.5 Spezielle Streuungskennwerte
112
Beispiel 4.5.3: Variationsvergleich von Wechselkursen
าง๐ฅ๐๐ข๐๐ = 9.49 ว๐ ๐๐ข๐๐ = 0.93 ๐ฃ๐๐ข๐๐ = 0.10
าง๐ฅ๐ท๐๐๐๐๐ = 1.33 ว๐ ๐ท๐๐๐๐๐ = 0.09 ๐ฃ๐ท๐๐๐๐๐ = 0.07
4.6 Standardisierung mittels Lage und Streuung
113
โ Hintergrund โ
> Beispiel: Einkommensvergleich in zwei unterschiedlichen Lรคndern
Deutscher: 2800 Euro bei einem Durchschnitt von 2500 Euro und einer
Standardabweichung von 150 Euro
Schweizer: 5500 Franken bei einem Durchschnitt von 5000 Franken und
einer Standardabweichung von 400 Franken
โ Berechnung und Interpretation โ
> Allgemeine Form:
> Spezialfall Z-Standardisierung:
> Beobachtungswerte aus unterschiedlichen Grundgesamtheiten lassen
sich nicht immer sinnvoll vergleichen
๐ง๐ =๐ฅ๐ โ าง๐ฅ
ว๐ ๐
4.6 Standardisierung mittels Lage und Streuung
114
โ Eigenschaften z-standardisierter Werte โ
> Im Beispiel von zuvor
Deutscher:2800 โ 2500
150= 2 Schweizer:
5500 โ 5000
400= 1.25
Fazit: Deutscher (Schweizer) liegt 2 (1.25) Standardabweichungen รผber
dem Durchschnitt
> Mittelwert z-standardisierter Werte ist stets 0:
าง๐ง =1
๐
๐=1
๐
๐ง๐ =1
๐
๐=1
๐๐ฅ๐ โ าง๐ฅ
ว๐ ๐
=1
๐ ว๐ ๐
๐=1
๐
๐ฅ๐ โ าง๐ฅ = 0 (vgl. Folie 69)
4.6 Standardisierung mittels Lage und Streuung
ว๐ ๐2 =
1
๐
๐=1
๐
๐ง๐ โ าง๐ง 2 =1
๐
๐=1
๐
๐ง๐2 โ าง๐ง2 =
1
๐
๐=1
๐
๐ง๐2
> Varianz (Standardabweichung) z-standardisierter Werte ist stets 1:
=1
๐
๐=1
๐๐ฅ๐ โ าง๐ฅ 2
ว๐ ๐2 =
1
ว๐ ๐2 ร
1
๐
๐=1
๐
๐ฅ๐ โ าง๐ฅ 2 =1
ว๐ ๐2 ร ว๐ ๐
2 = 1
115
4.7 Messung von Schiefe
117
โ Konzept und Definition โ
> Feststellung: Bei schiefen Verteilungen liegen obere und untere Quantile
gewรถhnlich unterschiedlich weit vom Median entfernt
> Erster Vorschritt: Zerlegung des Quantilsabstands im Sinne von
๐ฅ1โ๐ผ โ ๐ฅ๐ผ = ๐ฅ0.5 โ ๐ฅ๐ผ + ๐ฅ1โ๐ผ โ ๐ฅ0.5
๐๐ผ
4.7 Messung von Schiefe
โ Interpretation โ
QS
118
> Quantilskoeffizient der Schiefe setzt die Differenz der beiden Abstรคnde
ins Verhรคltnis zum Quantilsabstand (siehe Kasten)
... siehe Kasten
119
Beispiel 4.7.1: Schiefe der Einkommensverteilung
4.7 Messung von Schiefe
๐๐0.1 =๐ฅ0.9 โ ๐ฅ0.5 โ ๐ฅ0.5 โ ๐ฅ0.1
๐ฅ0.9 โ ๐ฅ0.1=
35731 โ 19595 โ 19595 โ 9913
35731 โ 9913
โ 0.25
๐๐0.1 = 0.25
๐๐0.2 = 0.17
๐๐0.3 = 0.10
4.8 Darstellung und Messung von Konzentration
4.8.1 Lorenz-Kurve
โ Was versteht man unter Konzentration? โ
โ Beispiel 4.8.1 โ
Man vergleiche die folgenden beiden Datensรคtze
Merkmalssumme jeweils = 20
Wie verteilt sich diese auf die einzelnen Merkmalstrรคger?
Wie stark ist die Ungleichverteilung (Konzentration) ausgeprรคgt?
Man stelle sich 3 Branchen mit jeweils 5 Firmen vor:
120Feststellung: Phรคnomen der Konzentration wird durch her-
kรถmmliche Maรe nicht adรคquat gemessen
4.8 Darstellung und Messung von Konzentration
โ Interpretation โ
122
> Die Flรคche zwischen Lorenzkurve und Winkelhalbierender wird immer
dann groร, wenn
> Keine Konzentration liegt vor, wenn die Lorenzkurve mit der Winkel-
halbierenden zusammenfรคllt. Dann
> Beispiel: Koordinatenpunkte der Lorenzkurve, falls Branche mit 5 Unter-
nehmen keinerlei Konzentration aufweist:
wenige Merkmalstrรคger (relativ) viel von der Merkmalssumme
auf sich vereinigen.
sind alle Werte gleich. Damit verteilt sich die Merkmalssumme
gleichmรครig auf die Merkmalstrรคger.
(0, 0), (0.2, 0.2), (0.4, 0.4), (0.6, 0.6), (0.8, 0.8), (1, 1)
4.8 Darstellung und Messung von Konzentration
123
4.8.2 Gini-Koeffizient
โ Definition und Interpretation โ
> (Nichtnormierter) Gini-Koeffizient:
Zweifaches der Flรคche zwischen Lorenzkurve und Winkelhalbierender
> Gini-Koeffizient = 0, falls alle Werte gleich sind
> Gini-Koeffizient โ 1 bei maximaler Konzentration, d. h. wenn ein ein-
zelner Merkmalstrรคger die gesamte Merkmalssumme auf sich vereint
4.8 Darstellung und Messung von Konzentration
โ Berechnung โ
124
Formel: G =2ฯ ๐๐ฅ ๐
๐ฯ๐ฅ๐โ๐ + 1
๐
Beispielrechnung fรผr Branche 3:
20, 40, 60, 80, 100 (geordnet!)
โ ๐บ3 =2 1 ร 20 + 2 ร 40 + 3 ร 60 + 4 ร 80 + 5 ร 100
5 ร 300โ6
5
โ 0.2667
Analog: ๐บ1 = 0.76, ๐บ2 = 0.1975
4.8 Darstellung und Messung von Konzentration
โ Wertebereich und Normierung โ
๐บ ist maximal ๐โ1
๐; soll der Maximalwert = 1 sein:
๐บโ =๐
๐ โ 1๐บ
Normierter Gini-Koeffizient
4.8 Darstellung und Messung von Konzentration
โ Vorsicht bei der Interpretation โ
126vgl. Fahrmeir et al. (2010)
Fazit:
๐บ๐ด = 0.4 ๐บ๐ต = 0.4
Gini-Koeffizient allein verrรคt nicht alles!
4.8 Darstellung und Messung von Konzentration
Beispiel 4.8.2: Konzentration von Einkommen in Deutschland
127
4.9 Spezifische Eigenschaften empirischer Kennwerte
4.9.1 Minimumeigenschaft des arithmetischen Mittels
128
โ Hintergrund โ
> Bekannt: ว๐ 2 =1
๐ฯ๐=1๐ ๐ฅ๐ โ าง๐ฅ 2 verwendet าง๐ฅ als Referenzpunkt in
der Frage โWie stark streuen die Werte um ...?โ
> Frage: Welcher Referenzpunkt c minimiert den Ausdruck1
๐ฯ๐=1๐ ๐ฅ๐ โ ๐ 2?
> Antwort: Die Lรถsung lautet tatsรคchlich ๐ = าง๐ฅ
โ Analytischer Nachweis โ
> Minimierungsproblem: min๐
๐ ๐ mit ๐ ๐ =1
๐ฯ๐=1๐ ๐ฅ๐ โ ๐ 2
๐๐ ๐
๐๐= โ
2
๐
๐=1
๐
๐ฅ๐ โ ๐ = โ2
๐
๐=1
๐
๐ฅ๐ +2
๐
๐=1
๐
๐
4.9 Spezifische Eigenschaften empirischer Kennwerte
129
> Alternativ: Betrachte allgemeine Verschiebungsformel (Folie 101)
1
๐
๐=1
๐
๐ฅ๐ โ าง๐ฅ 2 =1
๐
๐=1
๐
๐ฅ๐ โ ๐ 2 โ าง๐ฅ โ ๐ 2
ว๐ 2
โ1
๐
๐=1
๐
๐ฅ๐ โ ๐ 2 = ว๐ 2 + าง๐ฅ โ ๐ 2
= โ2 าง๐ฅ + 2๐ = 2 ๐ โ าง๐ฅ
โ ๐ minimal fรผr ๐ = าง๐ฅ
Ist minimal, falls ๐ = าง๐ฅ
4.9 Spezifische Eigenschaften empirischer Kennwerte
โ Beispiel 4.9.1 โ
130
Fall 1 : 1, 0, 0, 1, 3, 5, 6
โ าง๐ฅ = 2, ว๐ 2= 6.28571
Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6
โ าง๐ฅ = 2.25, ว๐ 2= 5.9375
โ ๐1 ๐ = 2 โ ๐ 2 + 6.28571 โ ๐2 ๐ = 2.25 โ ๐ 2 + 5.9375
4.9.2 Minimumeigenschaft des Medians
132
โ Hintergrund โ
4.9 Spezifische Eigenschaften empirischer Kennwerte
> Bekannt: ๐ =1
๐ฯ๐=1๐ ๐ฅ๐ โ ๐ฅ0.5 verwendet ๐ฅ0.5 als Referenzpunkt in
der Frage โWie stark streuen die Werte um ...?โ
> Frage: Welcher Referenzpunkt c minimiert den Ausdruck 1
๐ฯ๐=1๐ ๐ฅ๐ โ ๐ ?
> Antwort: Die Lรถsung lautet tatsรคchlich ๐ = ๐ฅ0.5
โ Analytischer Nachweis โ
> Minimierungsproblem: min๐
แ๐ ๐ mit แ๐ ๐ =1
๐ฯ๐=1๐ ๐ฅ๐ โ ๐
> Jedoch: แ๐ analytisch nicht gut handhabbar (teils nicht differenzierbar)
> Minimumeigenschaft jedoch einsichtig (โinformaler Beweisโ)
auch keine Streuungzerlegungsformel
4.9 Spezifische Eigenschaften empirischer Kennwerte
134
Fall 1 : 1, 0, 0, 1, 3, 5, 6
โ ๐ฅ0.5 = 1
Fall 2 : 1, 0, 0, 1, 3, 4, 5, 6
โ แ๐1 ๐ =1
7แพ โ1 โ ๐ + 0 โ ๐
แฟ+โฏ+ 6 โ ๐
โ ๐ฅ0.5 = 2
โ แ๐2 ๐ =1
8แพ โ1 โ ๐ + |0 โ ๐|
แฟ+โฏ+ 6 โ ๐
4.9.3 Transformationseigenschaften
โ Arten von Transformationen โ
4.9 Spezifische Eigenschaften empirischer Kennwerte
136
> Verschiebung:
> Ursprungswerte ๐ฅ1, ๐ฅ2, โฆ , ๐ฅ๐ sollen einheitlich transformiert werden
> Umskalierung:
> Beispiel:
Ursprungswerte: 1, 0, 0, 1, 3, 5, 6
Verschiebung um ๐ = 9:
Umskalierung mit ๐ = 2:
๐ข๐ = ๐ฅ๐ + ๐ fรผr ๐ = 1, โฆ , ๐
๐ข๐ = ๐๐ฅ๐ fรผr ๐ = 1,โฆ , ๐ und ๐ > 0
8, 9, 9, 10, 12, 14, 15
2, 0, 0, 2, 6, 10, 12
4.9 Spezifische Eigenschaften empirischer Kennwerte
138
โ Verschiebungsรคquivarianz und Verschiebungsinvarianz โ
> รquivarianz ... โGleichartige Verรคnderlichkeitโ bei Transformation
> Invarianz ... โUnverรคnderlichkeit โ bei Transformation
> Beispiel 1: Verschiebungsรคquivarianz des arithmetischen Mittels:
เดค๐ข =1
๐
๐=1
๐
๐ข๐ =1
๐
๐=1
๐
๐ฅ๐ + ๐ =
Transformation: ๐ข๐ = ๐ฅ๐ + ๐
= าง๐ฅ +1
๐ร ๐๐ = าง๐ฅ + ๐
= าง๐ฅ + ๐
4.9 Spezifische Eigenschaften empirischer Kennwerte
139
> Beispiel 2: Verschiebungsinvarianz der (empirischen) Varianz
โ Skalenรคquivarianz und Skaleninvarianz โ
> Beispiel 3: Skalenรคquivarianz des arithmetischen Mittels
ว๐ ๐2 =
1
๐
๐=1
๐
๐ข๐ โ เดค๐ข 2 =1
๐
๐=1
๐
๐ฅ๐ + ๐ โ าง๐ฅ โ ๐ 2
=1
๐
๐=1
๐
๐ฅ๐ โ าง๐ฅ 2
= ว๐ ๐2
Transformation: ๐ข๐ = ๐๐ฅ๐
เดค๐ข =1
๐
๐=1
๐
๐ข๐ =1
๐
๐=1
๐
๐๐ฅ๐ = ๐ ร1
๐
๐=1
๐
๐ฅ๐ = ๐ าง๐ฅ
4.9 Spezifische Eigenschaften empirischer Kennwerte
140
> Beispiel 4: Skalenรคquivarianz der Standardabweichung
Transformation: ๐ข๐ = ๐๐ฅ๐ mit ๐ > 0
ว๐ ๐2 =
1
๐
๐=1
๐
๐ข๐ โ เดค๐ข 2 =1
๐
๐=1
๐
๐๐ฅ๐ โ ๐ าง๐ฅ 2
= ๐2 ร1
๐
๐=1
๐
๐ฅ๐ โ าง๐ฅ 2
= ๐2 ว๐ ๐2
=> Fazit: Varianz ist weder รคquivariant noch invariant, aber
ว๐ ๐ = ว๐ ๐2 = ๐2 ว๐ ๐
2 = ๐ ว๐ ๐
=> Fazit: Standardabweichung ist skalenรคquivariant
Beachte: ๐ > 0
4.9 Spezifische Eigenschaften empirischer Kennwerte
142
โ Eigenschaften standardisierter Werte โ
> Bei Verschiebung ๐ข๐ = ๐ฅ๐ + ๐ gilt: เดค๐ข = าง๐ฅ + ๐ und ว๐ ๐ = ว๐ ๐
> Bei Umskalierung ๐ข๐ = ๐๐ฅ๐ gilt: เดค๐ข = ๐ าง๐ฅ und ว๐ ๐ = ๐ ว๐ ๐
Daraus folgt bei einer Standardisierung verschobener Werte:
Daraus folgt bei einer Standardisierung verschobener Werte:
> Fazit: Verschiebungen und Umskalierungen wirken sich nicht
auf standardisierte Werte aus
๐ง๐ =๐ข๐ โ เดค๐ข
ว๐ ๐=๐ฅ๐ + ๐ โ าง๐ฅ โ ๐
ว๐ ๐=๐ฅ๐ โ าง๐ฅ
ว๐ ๐
๐ง๐ =๐ข๐ โ เดค๐ข
ว๐ ๐=๐๐ฅ๐ โ ๐ าง๐ฅ
๐ ว๐ ๐=๐ฅ๐ โ าง๐ฅ
ว๐ ๐