32
Indici di … posizione: -quantili -decili -percentili tendenza centrale: -Media -Moda -Mediana variabilità e dispersione: -Devianza - Varianza -Deviazione standard

Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Indici di …posizione:-quantili-decili-percentili

tendenza centrale:-Media-Moda-Mediana

variabilità e dispersione:-Devianza- Varianza-Deviazione standard

Page 2: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Indici di tendenza centrale

Page 3: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Indici di tendenza centrale

Scale di misura

Nominale Ordinale Intervalli Rapporti

ModaMedianaMedia

x xx

xxx

xxx

Page 4: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Media� punto di equilibrio centrale dell’insieme dei valor i

considerati (somma dei valori di ogni osservazione)

(numero di osservazioni)

n

Σi=1

nX =

X = media

Xi = valore i-esimo della distribuzione X

n

Σ = sommatoria di tutti i dati dal primo (i=1) a ni=1

n = numerosità totale del campione

Xi

Page 5: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Se i dati sono raggruppati in classi …n

Σi=1

nX =

X = media

Xi = valore i-esimo della distribuzione X

n

Σ = sommatoria di tutti i dati dal primo (i=1) a ni=1

n = numerosità totale del campione

fi Xi

fi = frequenza relativa della classe i-esima

Page 6: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Come si procede …I valori della variabile su cui calcolare la media sono determinati dalla somma dei limiti (inferiore e superiore) /2 dell’intervallo di classe che va moltiplicata per la frequenza ad esso associata.

Classi Xi fi Xi * fi45-49 (45+49)/2 47 1 47

40-44 (40+44)/2 42 2 84

35-39 (35+39)/2 37 3 111

30-34 (30+34)/2 32 5 160

25-29 (25+29)/2 27 4 108

20-24 (20+24)/2 22 1 22

16 532

X = 532/16= = 33.25

Page 7: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Mediana� Divide la distribuzione in due parti di uguale

numerosità e corrisponde al 50° percentile.� Determina semplicemente il valore che divide i

dati in due parti numericamente uguali,prescindendo dal valore dei dati e dal fatto chequesti siano bilanciati rispetto ad essa.

� Diversamente dalla media che non dividenecessariamente i dati in due partinumericamente uguali, ma li divide in base adun valore medio della variabile.

rappresenta il valore per cui si ha il picco di frequenza.

Moda

Page 8: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Indici di variabilità e di dispersione

Page 9: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Varianza

DS = Σ (x- M)2 = devianza = varianzaN-1 gradi di libertà

oscillazione media intorno alla media

SS = Σ (x- M)2 oppure Σx2 - (Σx)2

N

s2= MS = Σ (x- M)2 = devianzaN-1 gradi di libertà

Devianza scarti quadratici della media

Radice quadrata della varianza

Deviazione standard

Page 10: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

� Gruppo A:

� Gruppo B:

11

1+0+12

2

1

0

1

0

1

0

-11

10100200

100100+0+1002

100

0

100

0

10

0

-10

-5

-5

-5

-5

-5

-5

deviazione standard

varianzadevianzascarti dalla media

Deviazione standard

varianzadevianzascarti dalla media

Media= (4+5+6)/3=

5

Media= (-5+5+15)/3=

5

Σ6

15

5

4

15Σ15

5

-5

DS=1

DS=10

Page 11: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Gruppi

1120

Media deviazione standard

varianzadevianzascarti dalla

media

5A

B 5 0 200 100 10

1) Perché calcoliamo iquadrati degli scarti dallamedia (devianza) ?Per poter evidenziare ledifferenze fra i gruppi.La sommatoria degli scartiè sempre uguale a 0.Calcolando la devianza ivalori negativi diventanopositivi e la somma nonsarà più 0.

2) Perché calcoliamo la deviazione standard ?L’utilizzo di scarti elevati al quadrato (devianza) rende la varianza non omogenea con l’unità di misura dei dati di partenza, pertanto si utilizza la radice quadrata delle varianze (deviazione standard).

Page 12: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

3) Per garantire l’indipendenza delle osservazioni (dati) si calcolano i G.d.L. togliendo 1 dato al n° totale delle osservazioni.

A 4

5

6

Σ 15

B -5

5

15

Σ 15

Page 13: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Distribuzione normale

Page 14: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Distribuzione normale� unimodale� simmetrica (media, mediana e moda coincidono)� mesocurtica (la varianza è circa ¼ della media)

-3 -2 -1 0 1 2 3

68 %

95 %

99 %

Simmetrica

Page 15: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Se è bimodale… non c’è rimedio� Moda : rappresenta il valore per cui si ha il picco di

frequenza. Una distribuzione più essere unimodale o bimodale a seconda che sia presente un solo picco o due picchi intercalati da un avvallamento.

Bimodale

Media=Mediana

Page 16: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Se non è simmetrica ….Per correggere la simmetria e/o la curtosi:� se media = varianza si estrae la radice quadrata� se varianza > media si fa il log x o log x + C

(Anscombe)

Page 17: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Asimmetrica positivaMODA

MEDIANA

MEDIA

Page 18: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Asimmetria negativaMODA

MEDIANA

MEDIA

Page 19: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Rappresentazione della curtosi

LEPTOCURTICA

PLATICURTICA

MESOCURTICA

Page 20: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Teorema Bernouille

Dato un universo di media µ e deviazionestandard σ se si estraggono n campioni lamedia delle medie sarà uguale alla mediadella popolazione e l’errore standard ugualealla deviazione standard della popolazione.

Page 21: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Indici di posizioneper conoscere la posizione che una

osservazione occupa all’internodi una distribuzione

Page 22: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Primi passi …

� Calcolare il valore mediano� Stabilire se il nostro valore appartiene

nella metà inferiore o superiore di una distribuzione.

� Gli indici di posizione dividono la distribuzione in quattro (quantili), dieci (decili) o cento (percentili) parti.

Page 23: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Q1 Q2 Q3

Quantili (Q)

25 %25 % 25 % 25 %

Page 24: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

D1 D2 D3 D4 D5 D6 D7 D8 D9

Decili (D)

10%

50 %

Page 25: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

P10 P20 P30 P40 P50 P60 P70 P80 P90

Percentili (P)

10%

50 %

Page 26: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

ALCUNE CONSIDERAZIONI

� MEDIANA = Q2 = D5 = P50 = 50 %� Q1 = P25

� Q2 = P50

� Q3 = P25

Page 27: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Calcolo degli indici di posizioni� Se non sono raggruppati in classi …a) Disporre i dati della distribuzione in

ordine crescenteb) Identificare la posizione mediante la

formula:

c) Identificare il valore che corrisponde alla posizione

P Perc = Perc (n +1)100

Perc = percentile (1 -99)n= numero dei dati della

distribuzione

Valore percentile = XPPerc

Page 28: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Calcolo degli indici di posizioni� Se sono raggruppati in classi …a) Identificare la posizione mediante la

formula:

Perc = percentile (1 -99)n= numero dei dati della distribuzionel inf = limite reale inferiore della classe che contiene il percentilefc inf = frequenza cumulata della classe precedente a quella del percentilei = ampiezza della classe che contiene il percentile (limite reale superiore

meno limite reale inferiore)f = frequenza della classe che contiene il percentile

Valore percentile= X PPerc = l inf

Perc n100

+

- fcinf ** i

f

Page 29: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

EsercizioClassi Limiti reali fi fc3-6 7

7-10 9

11-14 5

15-18 3

24

7

16

21

24

2.5 – 6.5

6.5 – 10.5

10.5 – 14.5

14.5 – 18.5

7

7+9 =

7+9+5 =

7+9+5+3 =

Valore percentile= X PPerc = l inf

Perc n100

+

- fcinf ** i

f

1) Individuare la classe che contiene Q3 o P75

Perc n100

* = (75 * 24)100

= 18

(75 * 24)100 16 (14.5 -10.5)4

5

10.5

12.1Ricordiamoci di procedere

per interpolazione

Page 30: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Ranghi

� Corrispondono alle posizioni occupate dalle singole osservazioni.

� Se due o più valori sono uguali (cadono sullo stesso rango) bisogna calcolare il rango medio

� Il rango dipende dal n° delle osservazione

Page 31: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Ranghi percentili

� Libera le singole osservazioni dal denominatore

� Consente di confrontare direttamente la prestazione di un soggetto

* 100(n – R)

n - 1R= Rango

n = numerosità delle osservazioniR %= Rango percentile

R %=

Page 32: Indici di - unime.it · Indici di tendenza centrale Scale di misura Nominale Ordinale Intervalli Rapporti Moda Mediana Media x x x x x x x x x

Esempio : calcolare il rango percentile corrispondente al valore 20

� Il rango percentile del punteggio 20 corrisponde al 64% circa

=� Sotto al punteggio 20 cadono il

64% dei valori della distribuzione=

� Il punteggio 20 corrisponde in percentuale al 36 – esimo posto della distribuzione (64-100=36)

X = 27 – 11 – 26 – 12 – 24 – 16 - 21 – 20 – 17 – 14 – 13 – 22 – 19 – 18 - 15

X = 27 – 26 – 24 – 22 - 21 – 20 – 19 – 18 – 17 –16– 15 – 14 – 13 –12- 11

* 100(n – R)

n - 1R %=

* 100 =(15 – 6)

15 - 1R %=

= 64.28