30
La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto di una indagine statistica Unità statistica: ciascun elemento di una popolazione Campione: sottoinsieme della popolazione PROIEZIONI DI VOTO (elezioni) Popolazione: tutti gli aventi diritto al voto Campione: solo gli aventi diritto interrogati

La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

Embed Size (px)

Citation preview

Page 1: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva

ESEMPIO

Introduzione

1

•Oggetto della statistica: studio dei fenomeni collettivi

•Popolazione: insieme degli individui oggetto di una indagine statistica

•Unità statistica: ciascun elemento di una popolazione

•Campione: sottoinsieme della popolazione

PROIEZIONI DI VOTO (elezioni)

Popolazione: tutti gli aventi diritto al voto

Campione: solo gli aventi diritto interrogati

Page 2: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva

ESEMPIO

Introduzione

2

•Carattere: ogni aspetto del fenomeno da individuare

•Modalità: ciascuno dei diversi modi con cui un carattere può presentarsi

RELATIVAMENTE AL FENOMENO COLLETTIVO “GIOVANI”

Il carattere Titolo di studio si può presentare nelle seguenti modalità: licenza media, qualifica professionale, diploma di scuola media superiore, laurea triennale, laurea specialistica, dottorato.

Il carattere Utilizzo del tempo libero si può presentare nelle seguenti modalità: riposo, letture varie, cinema e teatro, discoteche, bar e pub, attività sportive, visite a musei o mostre, ecc.

Page 3: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Caratteri qualitativi e quantitativi

3

CARATTERE

Qualitativo: le sue modalità non sono espresse da numeri e vengono dette mutabili statistiche.

Quantitativo: le sue modalità sono espresse da numeri e vengono dette variabili statistiche.

Discreto (numeri naturali): ad esempio in una popolazione il numero di figli.

Continuo (intervalli di numeri reali): ad esempio in una popolazione l’altezza.

Page 4: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le distribuzioni di frequenze

4

• I dati di un’indagine statistica possono essere raccolti in una distribuzione di frequenze (assolute o relative) nella quale ogni modalità xi del carattere è associata a un numero fi, la sua frequenza assoluta,

che indica quante volte quel carattere compare.

• Frequenza relativa: pi = (T : totale delle

osservazioni)

fi

T

In forma percentuale: pi (percentuale) = pi 100%

• Rappresentazione della distribuzione di frequenze

x

x1

x2

xn

Freq. ass.

f1

f2

fn

Freq. rel.

p1

p2

pn

Dove:

x: caratterexi: modalità del caratterefi: frequenze assolutepi: frequenze relative

Page 5: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Rappresentazione grafica

5

Una distribuzione di frequenze può essere rappresentata graficamente mediante:

• Un diagramma a rettangoli o ortogrammi

Page 6: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Rappresentazione grafica

6

• Un diagramma circolare o areogramma

Page 7: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Rappresentazione grafica

7

• Un diagramma cartesiano (per dati quantitativi di natura discreta)

Page 8: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Rappresentazione grafica

8

• Un istogramma (per dati quantitativi di natura continua)

L’altezza dei rettangoli si ottiene dividendo la frequenza per l’ampiezza della relativa classe.

Page 9: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Sintesi dei dati

9

Sintesi dei dati

Indici di variabilità

Scarto quadratico medio o deviazione standard σ

Varianza σ

Indici di posizione

Medie ferme: aritmetica, geometrica, armonica

Medie lasche: moda, mediana

Page 10: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

10

Si dice media aritmetica semplice fra n numeri x1, x2, ……., xn il rapporto M fra la loro somma ed n;

x1 + x2 + ……., + xn M = =n n

Σi = 1

xi

n

ESEMPIO

mese 1

N. ore 12360

2

15865

3

15940

4

15758

5

16075

6

16124

7

15635

8

4520

9

15942

10

16214

11

16120

12

15658

Un’azienda ha raccolto i dati relativi al numero di ore di lavoro mensili complessive dei dipendenti.

Calcoliamo il numero medio di ore lavoro mensili.176211

M = = 14684,2512

La media aritmetica può essere calcolata solo per dati di tipo quantitativo.

Page 11: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

11

Se i dati di una variabile statistica si presentano con una certa frequenza per calcolare il valor medio si usa la media ponderata.

Una media in cui ogni dato ha un suo peso (rappresentato dalla sua frequenza) si dice ponderata.

Se f1, f2, …… fn sono le frequenze delle modalità x1, x2, …… xn, la media aritmetica M(x) è data dalla formula

x1f1 + x2f2 + ……., + xnf M(x) = = f1 + f2 + … fn

Σi = 1

xifi

n

Σi = 1

fi

n

Page 12: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

12

ESEMPIO

Num. Dei maschi nelle famiglie x

01234567

Freq. assoluta f

50120300250190602010

Prodotto x f

012060075076030012070

TOTALE 1000 2720

Possiamo dire che in media, ogni famiglia ha un numero di maschi pari a:

1000

2720M = = 2,72

Page 13: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

13

Nel caso di una distribuzione per classi, il calcolo della media viene fatto sostituendo ciascuna classe con il suo termine centrale, ottenuto calcolando la semisomma dei valori estremi.

Altezze

[100-140)

[140-160)

[160-170)

[170-175)

[175-180)

[180-190)

[190-200)

[200-210)

[210-250)

Maschi

8

32

120

250

330

196

50

10

4

120 8 = 960

150 32 = 4 800

165 120 = 19 800

172,5 250 = 43 125

177,5 330 = 58 575

185 196 = 36 260

195 50 = 9 750

205 10 = 2 050

230 4 = 920

TOTALE 1000 176 240

120

150

165

172,5

177,5

185

195

205

230

Valori centraliFreq. Prodotti

Maschi

12

125

336

260

196

62

6

0

0

120 15 = 1 800

150 125 = 18 750

165 336 = 55 440

172,5 260 = 44 850

177,5 196 = 34 790

185 62 = 11 470

195 6 = 1 170

205 0 = 0

230 0 = 0

1000 168 270

Freq. Prodotti

Altezza media dei maschi: M = = 176,24 (cm)1000

176 240

Altezza media delle femmine: M = = 168,27 (cm)1000

168 270

Page 14: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

14

Si chiama scarto della media la differenza fra il valore osservato e la media stessa.

Dati cioè gli n valori x1, x2, …… xn, gli scarti dalla loro media M sono i valori

x1 – M, x2 – M, ……., xn – M

Proprietà della media aritmetica.

• La somma degli scarti della media è sempre nulla: (x1 – M) = 0i = 1

n

Σ

• Se si considerano i quadrati degli scarti, cioè (x1 – M)2, (x2 – M)2 ….., (xn – M)2, la somma dei

quadrati degli scarti della media aritmetica è minima (rispetto a una qualunque altra media).

Page 15: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

15

• Media geometrica semplice MG fra n numeri positivi x1, x2, ….., xn: radice n-esima del loro prodotto.

MG = √x1 x2, ….., xn

ESEMPIO

Dati i numeri 3, 6, 9, 15, 24, 36

MG = √3 6 9 15 24 36 ≈ 11,326

Page 16: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

16

• Nel caso di una media geometrica ponderata:

ESEMPIO

Dove fi: pesi e F = f1 + f2 + ….. fn

x

568

10

f

39

126

TOTALE (F) 30

MG = √(x1)f1 (x2)f2, ….., (xn) fnF

MG = √53 69 812 106 ≈ 7,3230

Nel caso di distribuzioni per classi si trova prima il valore centrale della classe e poi si effettua il calcolo della media ponderata.

Page 17: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

17

• Media quadratica semplice MQ fra n numeri i x1, x2, x3 ….., xn: radice quadrata della media aritmetica dei quadrati dei dati.

ESEMPIO

Dati i numeri 3, 5, 7, 9, 12

x1 + x2 +…+ xn

nMQ = √ =

n√ i = 1

n

Σ xi2

32 + 52 + 72 + 92 + 122

MQ = √ ≈ 7,855

Page 18: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

18

ESEMPIO

• Nel caso di una media ponderata:x1

2 f1 + x22f2 +….., xn

2fn

f1 + f2 +…… fn

MQ = √

x

568

10

f

39

126

TOTALE (F) 30

52 3 + 62 9 + 82 12 + 102 6MQ = √ ≈ 7,67

30=

301767√

Nel caso di distribuzioni per classi si usa il termine centrale di ogni classe.

Page 19: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

19

• Media armonica semplice MA fra due numeri x1, x2, ….., xn: reciproco della media aritmetica dei reciproci dei dati.

1 nMA = =

1x1

1x2

1xn

+ + …. +

n

1x1

1x2

1xn

+ + …. +

• Nel caso di una media ponderata:

f1 + f2 + ….. + fnMA =

f1

x1

f2

x2

fn

xn+ + …. +

Page 20: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie ferme

20

Nel caso di distribuzioni per classi si utilizza il termine centrale.

ESEMPIO

x

568

10

f

39

126

TOTALE (F) 30

Tutte le medie finora definite si possono calcolare solo per dati di tipo quantitativo.

30MA =

3

5

9

6

6

10+ + +

12

8

≈ 7,14

Page 21: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie lasche

21

Si dice moda (valore modale) di una distribuzione di frequenze, il termine, se esiste, cui corrisponde la massima frequenza nella distribuzione.

• Località marine è la moda per i turisti italiani.

• Città di interesse storico/artistico è la moda per i turisti stranieri.

• Una distribuzione può avere più di un termine modale o può non averne (distribuzione in cui ogni modalità ha la stessa frequenza).

Page 22: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie lasche

22

Nel caso in cui una distribuzione sia per classi, si parla di classe modale.

• Se le classi della distribuzione hanno tutte uguale ampiezza, allora la classe modale è quella che presenta frequenza più alta.

• Se le classi hanno ampiezze diverse si valuta il rapporto tra frequenza e ampiezza della classe. La classe cui corrisponde l’altezza maggiore è la classe modale.

Page 23: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva

ESEMPIO

Le medie lasche

23

• Mediana MC di una distribuzione: il termine che, disposti i dati in ordine crescente o decrescente, occupa il posto centrale.

• Se i termini fra cui calcolare il valore mediano sono n e n è dispari, la mediana è il valore che occupa il

posto ; se n è pari, tutti i punti dell’intervallo [x , x ] sono valori mediani; di solito si prende il

termine centrale di questo intervallo.

2

n + 1

2

n

2

n+1

Date le distribuzioni di 7 termini e di 8 termini

•1, 2, 3, 5, 7, 11, 20 Il termine mediano è quello di posto = 4 cioè Me = 52

7 + 1

•1, 2, 3, 5, 7, 9, 12, 15, 34 Il termine mediano è il termine centrale dell’intervallo [7, 9] cioè Me = 8

Page 24: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva

ESEMPIO

Le medie lasche

24

Se i valori della distribuzione hanno un loro peso, bisogna calcolare le frequenze cumulate (frequenze relative a una data modalità uguali alla somma delle frequenze di tutte le modalità minori o uguali a esse).

Numero voti

12345

Frequenza

28

1262

TOTALE (F) 30

Freq. cumulate

210222830

Consideriamo adesso la metà del totale delle frequenze (30 : 2 = 15); poiché n = 30, quindi è pari, il valore mediano è il termine centrale dell’intervallo [x15, x16] ed è quindi necessario trovare quali sono questi elementi.

continua

Page 25: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie lasche

25

Allora, 2 posti sono occupati dalla modalità 1, 8 posti sono occupati dalla modalità 2 (in totale abbiamo 10 posti, cioè il valore della colonna delle frequenze cumulate in corrispondenza della seconda modalità), 12 sono i posti occupati dalla modalità 3 (in totale abbiamo contato 22 posti, cioè abbiamo superato la metà); quindi il quindicesimo e il sedicesimo posto sono occupati entrambi dalla modalità 3.

La mediana della distribuzione è quindi il valore centrale dell’intervallo [3, 3], cioè Me = 3.

Nel caso in cui n è dispari, la mediana corrisponde all’elemento di posto ; per trovarlo basta

cercare nella colonna delle frequenze cumulate il primo numero che è maggiore o uguale di tale valore e

leggere l’elemento corrispondente.

2

n + 1

Page 26: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le medie lasche

26

Se la distribuzione è per classi bisogna calcolare la frequenza cumulata.

Ricoveri

[0-4]

[5-9]

[10-14]

[15-19]

[20-24]

[25-30]

Freq. Assol.

732

928

264

56

12

8

TOTALE (F) 2000

Freq. cumulate

732

1660

1924

1980

1992

2000

La metà delle osservazioni è 1000 e quindi per arrivare alla mediana dobbiamo contare le prime 1000 persone disposte in ordine crescente di numero di ricoveri subiti; poiché il valore 1000 e il valore 1001 delle frequenze cumulate cadono nella seconda classe, possiamo dire che la classe mediana è la [5 – 9].

Possiamo allora calcolare:

2

NA ( )

− F

fMe = i +

N: numero totale osservazioniF: frequenza cumulata fino alla mediana esclusaf: frequenza della classe medianaA: ampiezza della classe medianai: estremo inferiore della classe mediana

ESEMPIO

Page 27: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le misure di sisperione

27

Per avere informazioni su come i dati di una indagine statistica si distribuiscono attorno ai valori di sintesi e quindi poter confrontare distribuzioni, si studiano gli indici di variabilità.

• Campo di variabilità di un insieme di n dati numerici x1, x2, ….. xn: differenza tra il valore massimo

e il valore minimo degli xi.

ESEMPIO

Supponiamo che i rilevamenti compiuti su un campione di individui sulla pressione minima sanguigna abbia dato i seguenti risultati:

80 80 85 90 85 60 90 95 95 80 85 115

Il campo di variabilità di questi dati è dato da 115 – 60 = 55; se basassimo le nostre considerazioni solo su questo valore, saremmo portati a dire che in quel gruppo di persone vi è un’alta variabilità fra i dati, mentre in realtà, osservando meglio, si nota che la maggior parte di essi (tranne due) si distribuiscono in un ambito più ristretto compreso fra 80 e 95.

Page 28: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le misure di dispersione

28

• Scarto quadratico medio o deviazione standard σ: media quadratica degli scarti dalla media aritmetica M.

σ = n√ i = 1

n

Σ (xi – M)2

Nel caso di dati semplici

σ = √ i = 1

n

Σ {(xi – M)2 fi }

Σi = 1

n

fi

Nel caso di dati ponderati con pesi fi

• Varianza (σ)2: quadrato dello scarto quadratico medio.

Per il calcolo di σ (e quindi di σ2) si può anche usare la formula:

σ = √media dei quadrati degli xi − quadrato della media

Page 29: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le misure di dispersione

29

ESEMPIO

Ad otto gruppi di persone è stato chiesto di provare due tipi particolari di shampoo che indicheremo con A e B, e di sceglierne quindi uno. Gli esiti di questa scelta sono riportati nella seguente tabella.

A 15

B 15

12

12

10

24

8

12

11

14

18

2

20

10

10

18

Sommando le preferenze accordate ai due prodotti, sia A che B ne hanno totalizzate 104.

Mediamente = 13 voti da ciascun gruppo 8

104

continua

Page 30: La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto

La statistica descrittiva Le misure di dispersione

30

ESEMPIO

Preferenze di A

15

112

10

8

11

18

20

10

4

1

9

25

4

25

49

9

12

12

24

12

14

2

10

18

TOTALE 126

2

-1

-3

-5

-2

5

7

-3

Scarti (Scarti)2 Preferenze di B

-1

-1

11

-1

1

-11

-3

5

1

1

121

1

1

121

9

25

280

Scarti (Scarti)2

TOTALE

Calcoliamo lo scarto quadratico medio della distribuzione di A e di B.

σA = 8√ i = 1

8

Σ (xi – 13)2

= = 3,9698

126√ σB = 8√ i = 1

8

Σ (xi – 13)2

= = 5,9168

280√