Esercitazioni corso di Statistica con riassunti teorici

Esercitazioni di Statistica con riassunti teorici ed esercizi

Irene Martelli

[email protected]

[email protected]

1/18

1


Irene Martelli

[email protected]

1/18

• Queste slide sono il risultato delle esercitazioni tenute durante il corso di Statistica

presso la facoltà di Scienze Politiche dell’Università di Bologna, nell’A.A. 2012/2013.

• Per gli esercizi si consiglia il libro:

«Statistica e laboratorio» di L. Stracqualursi e M. Matteucci.

Molti esercizi suggeriti in queste slide sono stati presi

dal suddetto libro.

• Le slide coprono tendenzialmente tutti gli argomenti

standard coperti da un corso universitario di primo livello in Statistica.

2

3


1/18

• Distribuzioni di frequenza e rappresentazioni grafiche - Slide 4

• I valori medi - Slide 23

• Variabilità, eterogeneità e concentrazione - Slide 38

• Rapporti e numeri indici - Slide 56

• Distribuzioni di frequenza doppie e connessione - Slide 62

• Correlazione e regressione - Slide 78

• Elementi di probabilità - Slide 93

• Variabili casuali - Slide 106

• Distribuzioni campionarie e stima - Slide 128

Indice degli argomenti

Distribuzioni di frequenza e rappresentazioni grafiche

Irene Martelli

[email protected] 4

Popolazione, unità statistiche, caratteri e modalità

• Popolazione: insieme delle unità statistiche portatrici di una o più caratteristiche

connesse al fenomeno oggetto di interesse.

• Caratteri: sono le caratteristiche scelte per definire il fenomeno collettivo oggetto di

interesse. Possono essere quantitativi (discreti/continui) o qualitativi

(sconnessi/ordinabili rettilineari/ordinabili ciclici).

• Modalità: rappresentano il diverso modo in cui si presentano i caratteri nelle unità

statistiche.

Carattere oggetto di

studio

Mutabile statistica

Variabile statistica

NO

SI

Interi

Reali

Attributi qualitativi

Attributi quantitativi

Gli attributi ammettono ordine di successione?

I valori assunti possono appartenere all’insieme dei numeri:

Mutabile statistica sconnessa

Mutabile statistica ordinata

Variabile statistica continua

Variabile statistica discreta

5

Esercizio 1

Per ciascun punto rispondere alle seguenti domande:

1. Quali sono le unità statistiche di rilevazione?

2. Quali caratteri vengono rilevati? Che tipo di caratteri sono?

• Al termine dell’Esame di Stato, in una classe terza di una scuola secondaria di primo grado,

ad ogni alunno viene chiesto dove vorrebbe andare in vacanza tra le seguenti possibilità:

città italiana, città straniera, lago, mare, montagna e parco divertimenti.

• Al fine di migliorare il servizio offerto, il

direttore dell'albergo Ariston ha attivato un

sistema di raccolta e registrazione dei dati

dei propri clienti. Nella tabella a lato sono

riportati i dati relativi ai primi 7 clienti che

hanno soggiornato nella struttura nel mese

di settembre.

ID Sesso Età N. notti Giudizio

1 M 27 1 Discreto

2 M 19 3 Ottimo

3 F 18 3 Buono

4 M 38 2 Sufficiente

5 F 34 2 Buono

6 F 26 1 Insufficiente

7 M 21 3 Discreto 6

Distribuzioni di frequenze assolute

• La distribuzione di frequenza è la prima forma di sintesi statistica dei dati, poiché riassume

le informazioni contenute nell’insieme dei valori individuali. È una classificazione delle n

unità statistiche in k classi formate sulla base delle modalità del carattere osservato nel

collettivo.

A ni

a1 n1

a2 n2

… …

ai ni

… …

ak nk

n

X ni

x1 n1

x2 n2

… …

xi ni

… …

xk nk

n

Mutabile statistica Variabile statistica

• Proprietà di esaustività

• Proprietà di disgiuntività

𝑛𝑖 = 𝑛1 + 𝑛2 +⋯+ 𝑛𝑘 = 𝑛

𝑘

𝑖=1

Frequenze Assolute

Totale delle unità statistiche

7

Esercizio 2

• A partire dal seguente protocollo elementare, ovvero

l’insieme dei valori assunti dal carattere oggetto di indagine

nelle unità statistiche del collettivo in esame, costruire la

distribuzione di frequenze assolute.

• Collettivo in esame: 27 giocatori del Milan (portieri esclusi)

• Carattere osservato: Numero di goal segnati nella stagione

2012-13 fino alla giornata 24

• Di che tipo è il carattere osservato?

Fonte: www.legaseriea.it

El Shaarawy Stephan 15 Montolivo Riccardo 2 Pazzini Giampaolo 10

Boateng Kevin-Prince 1 Nocerino Antonio 2

Constant Kevin 0 De Sciglio Mattia 0

Bojan 3 Robinho 2

Abate Ignazio 0 Mexès Philippe 0

Ambrosini Massimo 0 De Jong Nigel 1

Emanuelson Urby 1 Zapata Cristian 0 Bonera Daniele 0

Yepes Mario Alberto 0 Flamini Mathieu 0

Niang M'Baye 0 Antonini Luca 0

Acerbi Francesco 0 Traoré Bakaye 0

Pato 0 Muntari Sulley Ali 0

Balotelli Mario 3 Mesbah Djamel 0

Niang 0 8

Distribuzioni di frequenze relative

• Le frequenze relative descrivono il peso delle classi sul complesso delle osservazioni.

• Generica frequenza relativa della classe i-esima: 𝑓𝑖 = 𝑛𝑖

𝑛 inoltre: 0 ≤ 𝑓𝑖 ≤ 1

𝑓𝑖𝑘𝑖=1 = 1

A ni fi

a1 n1 n1/n

a2 n2 n2/n

… … …

ai ni ni/n

… … …

ak nk nk/n

Totale n 1

X ni fi

x1 n1 n1/n

x2 n2 n2/n

… … …

xi ni ni/n

… … …

xk nk nk/n

Totale n 1

Mutabile statistica Variabile statistica

Frequenze Relative

9

Esercizio 3

Ricorda: è sempre possibile costruire una distribuzione di frequenze relative a partire

dalla distribuzione di frequenze assolute, qualunque sia la natura del carattere.

È invece possibile ricostruire la distribuzione di frequenze assolute a partire dalla

distribuzione di frequenze relative soltanto se conosciamo la numerosità del collettivo n.

• Costruire la distribuzione di frequenze relative a partire dalla distribuzione di

frequenze assolute dell’esercizio 2.

• A partire dalla distribuzione di frequenze relative ottenuta, ricordando che la

numerosità del collettivo è n = 27, ricostruire la distribuzione di frequenze assolute.

10

Distribuzioni di frequenze cumulate

• Nella distribuzione cumulata di un carattere le classi sono formate raggruppando le unità

che presentano un livello del carattere minore o uguale (distribuzione crescente/cumulata)

o maggiore o uguale (distribuzione decrescente/retrocumulata) ad una soglia.

• Generica frequenza cumulata assoluta: 𝑁𝑘= 𝑛𝑖𝑘𝑖=1 e relativa: 𝐹𝑘= 𝑓𝑖

𝑘𝑖=1

X ni Ni fi Fi

(<=) x1 n1 N1 = n1 f1= n1/n F1 = f1

(<=) x2 n2 N2 = n1+n2 f2= n2/n F2 = f1+f2

… … … … …

(<=) xi ni Ni = n1+n2+…+ni fi= ni/n Fi = f1+f2+…+fi

… … … … …

(<=) xk nk Nk = n1+..+ni+..+nk= n fk= nk/n Fk = f1+..+fi+..+fk= 1

Totale n 1

Variabile statistica

11

Esercizio 4

Ricorda: è possibile costruire la distribuzione di frequenze cumulate (assolute e relative)

soltanto per caratteri di natura quantitativa e qualitativa ordinale rettilineare.

Se il carattere è qualitativo sconnesso o qualitativo ordinale ciclico non si possono

costruire distribuzioni di frequenze cumulate.

• Costruire la distribuzione di frequenze cumulate assolute a partire dalla distribuzione di

frequenze assolute dell’esercizio 2.

• Costruire la distribuzione di frequenze cumulate relative a partire dalla distribuzione di

frequenze relative dell’esercizio 3.

12

Esercizio riassuntivo sulle distribuzioni di frequenza

La tabella che segue riporta il genere (maschio/femmina) e l’esito dell’esame di Statistica

(promosso/non promosso) per gli studenti che hanno sostenuto l’esame negli appelli della

sessione estiva.

Genere M F M M M M F M F M M M M F M M M M F F F F F F F

Esito N P P P P N P N N P P N N N P P N P P P N P N N N

• Identificare: le unità statistiche, i caratteri osservati e le modalità.

• Costruire la distribuzione di frequenza assoluta e relativa degli studenti secondo il genere.

• Costruire la distribuzione di frequenza assoluta e relativa degli studenti secondo l’esito

dell’esame.

• È possibile costruire anche le corrispondenti distribuzioni di frequenza cumulata?

Motivare la risposta.

• Costruire la distribuzione di frequenza doppia (sia di frequenze assolute che relative).

Individuare, nella distribuzione di frequenza doppia, le singole distribuzioni di frequenza

dei due caratteri. 13

Esercizio – Trarre informazioni dalle distribuzioni di frequenza

Di un gruppo di persone di età compresa tra i 16 e i 30 è nota la distribuzione per età,

distintamente per maschi e femmine.

16-20 anni 21-25 anni 26-30 anni

Maschi 49 52 63

Femmine 36 26 21

• Qual è la percentuale di maschi con non più di 20 anni?

• Qual è la percentuale di femmine con più di 25 anni?

• Qual è la percentuale di femmine con meno di 26 anni?

• Qual è la percentuale di persone di età compresa tra 21 e 25 anni?

• Nella fascia d’età più bassa, quali sono le percentuali dei maschi e delle femmine?

14

Rappresentazioni grafiche – Grafici a nastro e a torta (1)

Su un collettivo di 35 auto è stato osservato il carattere qualitativo "Paese di produzione"

Produttore Freq. assoluta Freq. Relativa Freq. Relativa %

Italia 15 0,43 42,86

USA 8 0,23 22,86

Giappone 7 0,20 20,00 Europa 5 0,14 14,29

35 1 100

15

8

7

5

0 2 4 6 8 10 12 14 16

Italia

USA

Giappone

Europa

Numero auto prodotte (freq. assolute)

Grafico a nastro

42.86

22.86 20.00

14.29

Grafico a torta (freq. relative %)

Italia

USA

Giappone

Europa15

20.83

29.17 29.17

20.83

Frequenze Relative % - Titolo di studio

Scuola secondariainferiore

Scuola secondariasuperiore

Laurea

Titoli post-laurea

50

70 70

50

0

10

20

30

40

50

60

70

80

Scuola secondariainferiore

Scuola secondariasuperiore

Laurea Titoli post-laurea

Grafico a barre Distribuzione per titolo di studio

Rappresentazioni grafiche – Grafici a nastro e a torta (2)

Distribuzione univariata di un campione della popolazione italiana

per titolo di studio (carattere qualitativo ordinato)

Titolo di studio Freq. Assolute Freq. Relative Freq. Relative %

Scuola secondaria inferiore 50 0,21 20,83

Scuola secondaria superiore 70 0,29 29,17

Laurea 70 0,29 29,17

Titoli post-laurea 50 0,21 20,83

240 1 100

16

Rappresentazioni grafiche – Istogramma

Distribuzione per età' di un collettivo di 32 persone. Carattere quantitativo continuo,

suddiviso in classi definite mediante intervalli chiusi a destra e di uguale ampiezza.

Ampiezza classe età

Classe d'età

Freq. Assolute

Freq. relative

Freq. relative %

Freq. relative cumulate

Freq. relative % cumulate

20 10 |-- 30 9 0,28 28,13 0,28 28,13 20 30 |-- 50 12 0,38 37,50 0,66 65,63 20 50 |-- 70 7 0,22 21,88 0,88 87,50 20 70 |-- 4 0,13 12,50 1,00 100,00

32 1,00 100,00

9

12

7

4

0

2

4

6

8

10

12

14

Fre

qu

en

ze A

sso

lute

Classi di età

10 |-- 30

30 |-- 50

50 |-- 70

70 |--

17

Rappresentazioni grafiche – Linee di tendenza (1)

Il seguente dataset è stato preso dalla relazione economica del

Presidente degli Stati Uniti (Gennaio 2001).

Anno Prodotto interno lordo

(bilioni $)

Popolazione (migliaia)

Tasso % di disoccupazione

1990 5803,20 249973 5,6

1991 5986,20 252665 6,8

1992 6318,90 255410 7,5

1993 6642,30 258119 6,9

1994 7054,30 260637 6,1

1995 7400,50 263082 5,6

1996 7813,20 265502 5,4

1997 8318,40 268048 4,9

1998 8790,20 270509 4,5

1999 9299,20 272945 4,2

18


Rappresentazione «sbagliata» tramite linee di tendenza:

attenzione ai valori assunti dalle variabili osservate!

0.00

50000.00

100000.00

150000.00

200000.00

250000.00

300000.00

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

PIL

Popolazione

Tasso disocc.

19


0.00

1000.00

2000.00

3000.00

4000.00

5000.00

6000.00

7000.00

8000.00

9000.00

10000.00

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

Pro

do

tto

Inte

rno

Lo

rdo

Anni

Serie Storica - PIL

20


235000

240000

245000

250000

255000

260000

265000

270000

275000

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

Po

po

lazi

on

e

Anni

Serie Storica - Popolazione

21


0

1

2

3

4

5

6

7

8

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

Tass

o d

i dis

occ

up

azio

ne

Anni

Serie Storica - Tasso di disoccupazione

22

I valori medi

Irene Martelli

[email protected]

Irene Martelli

[email protected] 23

Breve introduzione teorica

• Il nostro obiettivo è riuscire ad avere una percezione immediata degli aspetti specifici

che caratterizzano il fenomeno oggetto di studio nella popolazione prescelta:

determinare una misura o un attributo che possa essere ritenuto «tipico» o

rappresentativo per l’intero collettivo.

MEDIE LASCHE (DI POSIZIONE)

Singole modalità assunte dal carattere (qualitativo o quantitativo) che hanno un ruolo importante nella distribuzione per la posizione che occupano.

MEDIE ALGEBRICHE (ANALITICHE)

Risultato dell’elaborazione algebrica di tutte le modalità osservate;

Per caratteri necessariamente quantitativi.

Media ARITMETICA SEMPLICE

Media ARITMETICA PONDERATA

Media GEOMETRICA

MINIMO e MASSIMO

MODA

MEDIANA

QUANTILI

24

La media aritmetica semplice

Media aritmetica calcolata:

𝑥 =1

𝑛 𝑥𝑗

𝑛

𝑗=1

𝑥 =1

𝑛 𝑥𝑖

𝑘

𝑖=1

𝑛𝑖 con riferimento ad una

successione di osservazioni a partire dalla

distribuzione

di frequenza

𝑥 = 𝑥𝑖

𝑘

𝑖=1

𝑓𝑖

assoluta:

relativa:

Proprietà della media aritmetica:

1. E’ interna, ovvero compresa tra i valori minimo e massimo: 𝑀𝑖𝑛 ≤ 𝑥 ≤ 𝑀𝑎𝑥

2. Identità di somma: 𝑛𝑥 = 𝑥𝑗𝑛𝑗=1

3. La somma degli scarti dalla media aritmetica è pari a zero: 𝑥𝑗 − 𝑥 = 0𝑛𝑗=1

4. La somma del quadrato degli scarti dalla media è un minimo: (𝑥𝑗 − 𝑥 )2= 𝑚𝑖𝑛𝑖𝑚𝑜𝑛𝑗=1

25

Esercizio 1 – Media aritmetica semplice

1. Costruire la distribuzione di frequenze assolute.

2. Calcolare la media aritmetica dei voti ottenuti dagli

studenti, sia a partire dal protocollo elementare che

dalla distribuzione di frequenze assolute.

• E’ interna?

• Verificare che vale la proprietà di identità di somma.

3. Senza effettuare calcoli, è possibile sapere quanto

vale la somma degli scarti dalla media aritmetica?

Verificare il risultato.

• La tabella a lato riporta l’esito in trentesimi

dell’esame di Statistica di un collettivo di 15 studenti

(carattere quantitativo discreto).

Esame di Statistica

Id studente Voto

1 28

2 27

3 29

4 18

5 19

6 23

7 30

8 23

9 27

10 25

11 23

12 19

13 19

14 27

15 19

26

La media aritmetica ponderata

• Se vogliamo attribuire un’importanza differenziata alle diverse modalità osservate

nel collettivo in esame, è più appropriato usare la media aritmetica ponderata:

𝑥 𝑤 = 𝑥𝑗𝑤𝑗𝑛𝑗=1

𝑤𝑗𝑛𝑗=1

Formula per il calcolo della media aritmetica ponderata:

• Nella formula precedente, con la lettera w sono indicati i pesi: attraverso i pesi

possiamo dare maggiore o minore importanza alle modalità osservate.

• Un esempio tipico è il calcolo della media universitaria: i voti ottenuti agli esami

devono essere pesati con i relativi CFU.

27

Esercizio 2 – Media aritmetica su un collettivo suddiviso in gruppi

1. Interpretare i valori della tabella

2. Calcolare la media del n. di componenti del nucleo familiare per le famiglie con

capofamiglia maschio

3. Calcolare la media del n. di componenti del nucleo familiare per le famiglie con

capofamiglia femmina

4. Calcolare la media del campione suddiviso in due gruppi (caso particolare di media

ponderata: media di due medie con pesi diversi)

5. Ottenere lo stesso risultato del punto 4 a partire dall’intero campione osservato

N° Componenti familiari Capofamiglia

Maschio Femmina 1 5 4 2 7 8 3 4 3 4 10 3 5 3 2 6 3 0

28

La media geometrica

• Media di tipo algebrico che si calcola solo quando tutti i valori sono positivi.

• Data la sequenza delle osservazioni individuali, la media geometrica è data dalla

radice n-esima del prodotto tra gli n valori:

𝑚𝑔 = 𝑥𝑗

𝑛

𝑗=1

𝑛

= 𝑥1 ∙ 𝑥2 ∙ ⋯ ∙ 𝑥𝑛𝑛

Proprietà delle potenze utile per il calcolo «pratico»

… quando usiamo la calcolatrice, per intendersi!! 𝑥𝑗

𝑛

𝑗=1

𝑛

= 𝑥𝑗

𝑛

𝑗=1

1𝑛

𝑚𝑔 = 𝑥𝑖𝑛𝑖

𝑘

𝑖=1

𝑛

= 𝑥1𝑛1 ∙ 𝑥2

𝑛2 ∙ ⋯ ∙ 𝑥𝑘𝑛𝑘𝑛

• La media geometrica gode della proprietà di identità di prodotto:

𝑚𝑔 ×𝑚𝑔 ×⋯×𝑚𝑔 = 𝑥1 × 𝑥2 ×⋯× 𝑥𝑛

29

Esercizio 3 – Media geometrica

Un investitore nel 1994 ha differenziato il suo portafoglio fondi, investendo un capitale C in

fondi obbligazionari e un capitale C’ in fondi azionari.

Quale tipologia di fondo è risultata, nel decennio considerato, più remunerativa, ovvero ha

presentato un rendimento medio annuo più elevato?

Anni Tassi di rendimento fondi obbligazionari

Anni Tassi di rendimento

fondi azionari

1994 -0.013 1994 -0.036 1995 0.104 1995 0.013 1996 0.094 1996 0.084 1997 0.066 1997 0.303 1998 0.052 1998 0.222 1999 0.003 1999 0.357 2000 0.043 2000 -0.088 2001 0.028 2001 -0.170 2002 0.022 2002 -0.263 2003 0.016 2003 0.101

30

Esercizio 4 – Il minimo e il massimo

• Minimo e massimo appartengono alle medie lasche (o di posizione). In generale,

prima di andare a determinare le medie lasche, dobbiamo operare un ordinamento

(crescente o decrescente) delle modalità osservate.

• Se il carattere osservato è quantitativo, possiamo attribuire un valore informativo ai

valori più piccolo e più grande, nella successione ordinata o nella distribuzione di

frequenza: 𝑀𝑖𝑛 = min 𝑥𝑗 𝑀𝑎𝑥 = ma𝑥 𝑥𝑗 𝑗 = 1,… , 𝑛

𝑀𝑖𝑛 = min 𝑥𝑖 𝑀𝑎𝑥 = ma𝑥 𝑥𝑖 𝑖 = 1,… , 𝑘

Esempio tratto dal libro «Statistica per l’analisi operativa dei dati»: Famiglie italiane per numero di stanze dell’abitazione occupata nell’anno 2003 (dati per 10000, fonte: ISTAT)

𝑥𝑖 𝑛𝑖

1 12

2 148

3 489

4 760

5 505

6 310

2224 31

La moda

• Idea intuitiva: modalità più ricorrente nella popolazione statistica di riferimento.

• Definita per tutti i tipi di carattere.

• E’ la modalità a cui corrisponde la massima frequenza (per la sua determinazione

facciamo quindi riferimento alla distribuzione di frequenza)

Esempio tratto dal libro «Statistica per l’analisi operativa dei dati»: Famiglie italiane per numero di stanze dell’abitazione occupata nell’anno 2003 (dati per 10000, fonte: ISTAT)

𝑥𝑖 𝑛𝑖

1 12

2 148

3 489

4 760

5 505

6 310

2224

32

Esercizio 5 – La moda

Statura (cm) Numero di studenti

150 -| 160 3

160 -| 165 9

165 -| 180 15

180 -| 200 2

In un istituto tecnico si rileva la statura degli studenti di una classe quinta.

Sulla base dei risultati riportati nella tabella a lato, determinare la classe modale.

• Per caratteri continui, è possibile determinare la moda soltanto se lavoriamo su una

distribuzione con modalità in classi. Andremo a determinare la classe modale.

• La classe modale deve essere determinata tenendo conto: della frequenza di

ciascuna classe e della sua ampiezza.

• Dobbiamo quindi definire una nuova quantità chiamata densità di frequenza, data

dal rapporto tra la frequenza e l’ampiezza della classe.

• La classe modale è quella che presenta la densità di frequenza più alta (in altre

parole: è classe più affollata o più densamente popolata)

33

La mediana

• La mediana è quella modalità del carattere che consente di suddividere la successione

ordinata di osservazioni in due gruppi aventi la stessa numerosità.

• Poiché dobbiamo ordinare le modalità del carattere osservato, non è possibile

determinare la mediana per caratteri qualitativi sconnessi.

1. Ordiniamo (in modo crescente o decrescente) la nostra serie.

2. Determiniamo la mediana nel seguente modo:

A livello operativo:

𝑀𝑒 =

𝑥(𝑛+1)/2 𝑠𝑒 𝑛 è 𝑑𝑖𝑠𝑝𝑎𝑟𝑖

𝑥𝑛/2, 𝑥𝑛 2 +1 𝑠𝑒 𝑛 è 𝑝𝑎𝑟𝑖

Nel secondo caso (n pari), se le due modalità sono diverse tra loro possono essere sintetizzate con la semisomma se il carattere è quantitativo, altrimenti devono essere tenute in considerazione entrambe (per caratteri qualitativi)

34

Esercizio 6 – La mediana

Attenzione: se lavoriamo con le distribuzioni di frequenza invece che con il protocollo

elementare, per calcolare la mediana dobbiamo lavorare sulle frequenze cumulate.

• All’uscita da una caffetteria americana, ai clienti viene chiesta la dimensione della

bevanda che hanno appena acquistato. I risultati sono riportati nella tabella

seguente:

Formato bevanda Numero di clienti

Piccola 13

Media 25

Grande 21

• Determinare la modalità mediana.

35

I quantili

• I quantili possono essere considerati come una generalizzazione del concetto di

mediana. Lavoriamo quindi anche in questo caso sulla successione ordinata.

• Andremo a cercare quella modalità al di sotto (o al di sopra) della quale si trova una

prefissata proporzione (o percentuale) q di osservazioni.

• I quartili sono 3 e suddividono la successione ordinata in 4 parti, i decili sono 9 e la

suddividono in 10 parti, e così via…

• I percentili sono 99 e suddividono la successione ordinata in 100 parti.

mediana q=1/2

primo quartile q=1/4

terzo quartile q=3/4 secondo quartile

q=2/4=1/2

• Come nel caso della mediana, se lavoriamo con distribuzioni di frequenza, dobbiamo

fare riferimento alle frequenze cumulate. 36

Esercizio 7 – I quantili

• Nella tabella seguente è riportato il numero medio giornaliero di ore trascorse davanti

al computer osservato in un gruppo di bambini di età compresa tra i 10 e i 14 anni.

𝑥𝑖 𝑛𝑖

0 23

1 45

2 47

3 52

4 21

5 12

• Determinare i quartili e il 90° percentile della distribuzione.

37

Variabilità, eterogeneità e concentrazione

Irene Martelli


Breve introduzione teorica

« Non mi fido molto delle statistiche, perché un uomo con la testa nel forno acceso e

i piedi nel congelatore statisticamente ha una temperatura media. »

Charles Bukowski

• Intervallo di variazione e differenza interquartile

• Devianza, varianza e scarto quadratico medio

• Coefficiente di variazione

• Scostamento semplice medio dalla mediana

• Standardizzazione (utile per confronti)

Variabilità

(per caratteri quantitativi)

• Indice di eterogeneità di Gini Eterogeneità

(anche per caratteri qualitativi)

• Rapporto di concentrazione di Gini Concentrazione

(per caratteri cumulabili e trasferibili) 39

L’intervallo di variazione e la differenza interquartile

Intervallo di variazione (o range):

• Se le classi sono costituite da intervalli:

• E’ sensibile a valori anomali, in quanto risente della presenza di valori estremi

• E’ espresso nella stessa unità di misura della variabile X

Differenza interquartile:

• Non è sensibile a valori anomali

• Attenzione: anche se i quartili possono essere calcolati per variabili qualitative

ordinabili, la differenza interquartile può essere calcolata solo per caratteri

quantitativi (si tratta di un’operazione algebrica!)

𝐼𝑣 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

𝐼𝑞 = 𝑄3/4 − 𝑄1/4

Sono di misure di variabilità che non sfruttano tutte le informazioni disponibili,

ma misurano la diversità tra due particolari termini.

𝑥𝑚𝑖𝑛 = estremo inferiore del primo intervallo

𝑥𝑚𝑎𝑥 = estremo superiore dell’ultimo intervallo

40

Esercizio 1 – Intervallo di variazione e differenza interquartile

• Il Rettore di un’università vuole studiare la produttività della ricerca nel suo ateneo.

Come primo passo, decide di rilevare il numero di articoli pubblicati su una rivista dai

ricercatori confermati nel corso dell’ultimo anno.

• La tabella seguente mostra i risultati per la facoltà di Agraria:

N. Articoli N. Ricercatori

0 -| 2 4

2 -| 5 3

5 -| 10 13

10 -| 12 2

Quali sono il carattere osservato e l’unità statistica di riferimento?

Di che tipo è il carattere osservato?

Calcolare l’intervallo di variazione e la differenza interquartile 41

La devianza

1. E’ sempre positiva (somma di quadrati) ed è pari a zero solo se non c’è variabilità

2. E’ espressa nel quadrato dell’unità di misura della variabile X

3. E’ influenzata dal numero delle unità

Devianza, varianza e scarto quadratico medio sono indicatori di variabilità che

misurano la dispersione dei valori osservati attorno ad un valore medio, in

particolare si basano sui quadrati degli scarti dalla media aritmetica.

𝐷𝑒𝑣 𝑋 = 𝑥𝑗 − 𝑥 2=

𝑛

𝑗=1

𝑥𝑗2 − 𝑛𝑥 2

𝑛

𝑗=1

𝐷𝑒𝑣 𝑋 = 𝑥𝑖 − 𝑥 2𝑛𝑖 =

𝑘

𝑖=1

𝑥𝑖2𝑛𝑖 − 𝑛𝑥 2

𝑘

𝑖=1

• Se lavoriamo con il

protocollo elementare:

• Se lavoriamo con la

distribuzione di frequenza:

Formule definitorie e per il calcolo della devianza

42

La varianza

1. E’ sempre positiva ed è pari a zero solo se non c’è variabilità

2. E’ espressa nel quadrato dell’unità di misura della variabile X

3. Non è influenzata dal numero delle unità

𝑉 𝑋 =1

𝑛 𝑥𝑗 − 𝑥

2=

𝑛

𝑗=1

1

𝑛 𝑥𝑗

2 − 𝑥 2𝑛

𝑗=1

𝑉 𝑋 =1

𝑛 𝑥𝑖 − 𝑥 2𝑛𝑖 =

𝑘

𝑖=1

1

𝑛 𝑥𝑖

2𝑛𝑖 − 𝑥 2𝑘

𝑖=1





Formule definitorie e per il calcolo della varianza

La varianza si calcola dividendo la devianza per il numero di unità osservate:

𝑉 𝑋 = 𝑉𝑎𝑟 𝑋 =𝐷𝑒𝑣(𝑋)

𝑛

43

Lo scarto quadratico medio o deviazione standard

1. Per la proprietà di minimo della media aritmetica, è il minimo degli scostamenti

quadratici medi da un qualunque altro valore medio.

2. E’ Sempre maggiore o uguale a zero ed è espresso nell’unità di misura della variabile X

3. Non è influenzato dal numero delle unità

𝑆𝐷 𝑋 =1

𝑛 𝑥𝑗 − 𝑥

2=

𝑛

𝑗=1

1

𝑛 𝑥𝑗

2 − 𝑥 2𝑛

𝑗=1

𝑆𝐷 𝑋 =1

𝑛 𝑥𝑖 − 𝑥 2𝑛𝑖

𝑘

𝑖=1

=1

𝑛 𝑥𝑖

2𝑛𝑖 − 𝑥 2𝑘

𝑖=1




distr. di frequenza:

Formule definitorie e per il calcolo dello scarto quadratico medio

Lo scarto quadratico medio è dato dalla radice quadrata della varianza:

SD 𝑋 = 𝐷𝑆 𝑋 = 𝑆𝑥 2 = 𝑉𝑎𝑟(𝑋)

44

Esercizio 2 – Devianza, varianza e scarto quadratico medio

Ricorda: quando le classi della distribuzione sono ad intervalli, si sceglie come valore

rappresentativo del carattere il valore centrale dell’intervallo (semisomma degli estremi)

Classi di età Provincia A Provincia B

0 -| 6 40 60

6 -| 14 50 82

14 -| 21 30 100

21 -| 25 20 50

25 -| 45 130 70

45 -| 65 120 10

65 -| 80 70 50

Si considerino le distribuzioni per

classi di età della popolazione

residente (espressa in migliaia)

in due province A e B:

• Indicare qual è il carattere osservato e che tipo di carattere è.

• Qual è la numerosità delle due province?

• Calcolare la devianza, la varianza e lo scarto quadratico relativi

al numero medio di anni delle due province. 45

Il coefficiente di variazione

• Devianza

• Varianza

• Scarto quadratico medio

Sono misure di variabilità assolute, ovvero che dipendono

dall’unità di misura del carattere e dal suo ordine di grandezza.

Non sono quindi adatte a effettuare confronti in termini di

variabilità tra distribuzioni.

𝐶𝑉(𝑋) =𝑆𝐷(𝑋)

𝑥

Coefficiente di variazione (o coefficiente di variabilità)

1. E’ un numero puro, che non ha unità di misura (indicatore relativo di variabilità)

2. Può essere utilizzato per confrontare la variabilità:

• Dello stesso carattere in due o più collettivi aventi medie diverse

• Dello stesso carattere espresso in diverse unità di misura

• Di due caratteri diversi per unità di misura e per livello medio 46

Esercizio 3 – Coefficiente di variazione

• Con riferimento all’esercizio 2, quale indicatore è possibile utilizzare per confrontare la

variabilità delle due province?

• Calcolarlo e indicare quale delle due province ha maggior variabilità.

Classi di età Provincia A Provincia B

0 -| 6 40 60

6 -| 14 50 82

14 -| 21 30 100

21 -| 25 20 50

25 -| 45 130 70

45 -| 65 120 10

65 -| 80 70 50

47

Lo scostamento semplice medio dalla mediana

𝑥𝑗 −𝑀𝑒

𝑛

𝑗=1

= 𝑚𝑖𝑛𝑖𝑚𝑜 𝑥𝑖 −𝑀𝑒 𝑛𝑖

𝑘

𝑖=1

= 𝑚𝑖𝑛𝑖𝑚𝑜

• In relazione al


• In relazione alla


• 𝑥𝑗 −𝑀𝑒 sono gli scarti dalla mediana in valore assoluto

• Lo scostamento semplice medio dalla mediana è un minimo

tra tutti gli scostamenti semplici medi (proprietà della mediana)

𝑆𝑀𝐸 =1

𝑛 𝑥𝑗 −𝑀𝑒

𝑛

𝑗=1

𝑆𝑀𝐸 =1

𝑛 𝑥𝑖 −𝑀𝑒

𝑘

𝑖=1

𝑛𝑖

48

Esercizio 4 – Scostamento semplice medio dalla mediana

Individuo Tempo (giorni) per il consumo

di un pacco di biscotti

1 3

2 6

3 15

4 1

5 5

6 35

7 12

8 7

9 5

10 9

• La seguente tabella riporta il tempo (in giorni) impiegato da dieci individui per il

consumo di una confezione di biscotti da 400 grammi:

• Calcolare la mediana

• Calcolare lo scostamento

semplice medio

dalla mediana

• Interpretare il risultato

49

Esercizio 5 – La standardizzazione di variabili

Con 𝑍𝑖 si indica la variabile standardizzata, così definita:

𝑍𝑖 =𝑋𝑗 − 𝑋

𝐷𝑆(𝑋)=

𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑧𝑖𝑜𝑛𝑒 𝑜𝑟𝑖𝑔𝑖𝑛𝑎𝑟𝑖𝑎 − 𝑚𝑒𝑑𝑖𝑎

𝑑𝑒𝑣𝑖𝑎𝑧𝑖𝑜𝑛𝑒 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑

• La standardizzazione è molto utile quando dobbiamo confrontare variabili non omogenee,

quindi con differenti valori medi e differenti variabilità.

• In valore assoluto Paperino

e Pippo hanno segnato 11

punti, ma quale dei due

giocatori, nel contesto della

rispettiva squadra, è il più

bravo?

Squadra A Punti

Gastone 21

Paperina 13

Paperino 11

Qui 7

Quo 6

Qua 5

Nonna Papera 3

Zio Paperone 2

Squadra B Punti

Topolino 12

Pippo 11

Minni 3

Tip 2

Tap 2

Eta Beta 1

50

Le misure di eterogeneità – L’indice di Gini

• L’eterogeneità di un collettivo rispetto ad un carattere si definisce con riferimento al

comportamento delle frequenze (assolute o relative) osservate per le diverse modalità

assunte dal carattere.

• Situazioni estreme

𝐸𝐺 = 1 − 𝑓𝑖2

𝑘

𝑖=1 Indice di eterogeneità di Gini:

• Valore minimo: 𝐸𝐺 = 0 in situazione di omogeneità, ovvero tutte frequenze relative

nulle, tranne una che è pari ad 1

• Valore massimo: 𝐸𝐺 =𝑘−1

𝑘 in situazione di massima eterogeneità, ovvero tutte le

frequenze relative pari a 1 𝑘

Omogeneità: tutte le unità statistiche presentano la stessa modalità,

ovvero una sola modalità ha frequenza assoluta pari ad n, o frequenza

relativa pari ad 1.

Massima eterogeneità: le unità statistiche sono equiripartite tra le

diverse modalità, ovvero tutte le modalità hanno la stessa frequenza

assoluta n/k o relativa pari a 1/k.

51

Esercizio 6 – Misure di eterogeneità

• Un sabato sera una pizzeria ha contato 240 clienti. Di tali clienti sono state registrate le

ordinazioni effettuate per quanto riguarda le pizze scelte.

• Nella seguente tabella sono riportati i risultati:

Pizza 𝒏𝒊

Margherita 62

Marinara 18

Capricciosa 12

Crudo 21

Cotto e funghi 10

Quattro formaggi 9

Bufala e pomodorini 56

Bresaola, rucola e grana 18

Vegetariana 27

Gorgonzola e salsiccia 7

• Costruire sia la distribuzione di

omogeneità, che quella di

massima eterogeneità

• Calcolare l’indice

di eterogeneità di Gini

52

La concentrazione

• Solo per caratteri cumulabili e trasferibili

• Le n unità sono ordinate in base dell’ammontare crescente del carattere

Equidistribuzione

Unità 𝑋𝑖

1 m

2 m

… …

i m

… …

n m

Totale nm

𝑃𝑖 =𝑖

𝑛

indica l’incidenza, sul totale

della popolazione, delle i unità

«più povere»

Massima concentrazione

Unità 𝑋𝑖

1 0

2 0

… …

i 0

… …

n nm

Totale nm 𝑄𝑖 =

𝑋ℎ𝑖ℎ=1

𝑋𝑖𝑛𝑖=1

indica la frazione

dell’ammontare totale del

carattere posseduto dalle

i unità «più povere»

• Vale sempre:

• Soltanto per l’equidistribuzione:

0 ≤ 𝑄𝑖 ≤ 𝑃𝑖 ≤ 1

𝑃𝑛 = 𝑄𝑛 = 1

𝑄𝑖 = 𝑃𝑖

53

Il rapporto di concentrazione di Gini

• Per misurare la concentrazione dobbiamo tenere conto di tutte le

differenze 𝑃𝑖 − 𝑄𝑖 tranne l’ultima che è sempre nulla:

𝑄𝑖 = 𝑋ℎ𝑖ℎ=1

𝑋𝑖𝑛𝑖=1

𝑃𝑖 =𝑖

𝑛

𝐺 = 𝑃𝑖 − 𝑄𝑖

𝑛−1

𝑖=1

dove

• In caso di equidistribuzione si ha: 𝐺 =0

• In caso di massima concentrazione si ha: 𝑄1 = 𝑄2 = ⋯ = 𝑄𝑛−1 = 0

quindi il valore massimo di 𝐺 è pari a 𝐺 = 𝑃𝑖𝑛−1𝑖=1

Rapporto di concentrazione di Gini 𝑔 =

𝑃𝑖 − 𝑄𝑖𝑛−1𝑖=1

𝑃𝑖𝑛−1𝑖=1

= 1 − 𝑄𝑖𝑛−1𝑖=1

𝑃𝑖𝑛−1𝑖=1

0 ≤ 𝑔 ≤ 1 Equidistribuzione Massima concentrazione

54

Esercizio 7 – Rapporto di concentrazione di Gini

Numero di grappoli (in migliaia di unità)

116

82

110

97

80

• Per 5 aziende vinicole presenti su un dato territorio è stato rilevato il numero di grappoli

(in migliaia di unità) presenti sulle viti nei primi giorni di luglio.

• Nella seguente tabella sono riportati i risultati:

Misurare la concentrazione attraverso il rapporto di concentrazione di Gini

e interpretare il risultato 55

Rapporti e numeri indici

56

Irene Martelli

[email protected]

I rapporti statistici

• E’ un numero puro che permette confronti nel tempo e nello spazio indipendentemente

dalla dimensione e dalla natura del fenomeno indagato.

• Diversi tipi di rapporti statistici in base al tipo di legame logico esistente tra i due termini:

• Rapporto di composizione o di parte al tutto: mette in relazione l’intensità o la

frequenza di due fenomeni, uno dei quali (numeratore) può considerarsi una parte

dell’altro.

• Rapporto di coesistenza: mette in relazione le frequenze (o le quantità)

corrispondenti di due modalità di un carattere che coesistono in uno stesso

fenomeno.

• Rapporto di derivazione: mette in relazione una frequenza o una quantità di un

carattere con quella di un altro che può essere considerato un presupposto

necessario del primo.

• Rapporto di durata: mette in relazione la consistenza di un fenomeno con

l’ammontare del suo rinnovamento periodico. Il risultato indica la durata del

fenomeno. 57

Esercizio 1 – Rapporti statistici

La tabella che segue riporta la distribuzione di frequenza doppia del genere

(maschio/femmina) e dell’esito dell’esame di Statistica (promosso/non promosso)

per gli studenti che hanno sostenuto l’esame negli appelli della sessione estiva.

Genere Esito

Totale Promosso Non promosso

M 8 6 14

F 5 6 11

Totale 13 12 25

• Quali rapporti di composizione si possono definire? Commentare i risultati.

58

I numeri indici elementari

• In generale i numeri indici (elementari e complessi) sono particolari rapporti statistici

che misurano sinteticamente le variazioni di fenomeni economici in diverse situazioni

di tempo o di luogo (o comunque diverse da una situazione base)

• Sempre positivi e indipendenti dall’unità di misura (numeri puri)

Numero indice elementare

• 𝑋𝑡 (t= 0,1,…,T) serie storica di un fenomeno economico

• b = base del numero indice = tempo base

• t = tempo corrente

• Variazione % del fenomeno:

• Indice a base fissa, mantiene fisso b:

• Indice a base mobile (a catena), se b = t – 1:

𝑖𝑡𝑏 =𝑥𝑡𝑥𝑏

𝑖𝑡𝑏 − 1 100 =𝑥𝑡𝑥𝑏

− 1 100 =𝑥𝑡 − 𝑥𝑏𝑥𝑏

100

𝑖00 =𝑥0𝑥0

= 1, 𝑖10 =𝑥1𝑥0, 𝑖20 =

𝑥2𝑥0

𝑖10 =𝑥1𝑥0, 𝑖21 =

𝑥2𝑥1, 𝑖32 =

𝑥3𝑥2

59

I numeri indici complessi

• Sintetizzano le variazioni di n grandezze (quindi di n numeri indici elementari)

• Problemi nella costruzione di un indice complesso: • Scelta dei beni: indici rappresentativi o completi • Scelta della base: indici a base fissa o mobile • Scelta del criterio di aggregazione • Scelta del sistema di ponderazione: Laspeyres, Paasche e Fisher

Indice di Laspeyres (a ponderazione fissa)

𝑃𝑡𝐿 =

𝑝𝑚𝑡𝑞𝑚𝑏𝑀𝑚=1

𝑝𝑚𝑏𝑞𝑚𝑏𝑀𝑚=1

𝑏 𝑄𝑡𝐿 =

𝑝𝑚𝑏𝑞𝑚𝑡𝑀𝑚=1

𝑝𝑚𝑏𝑞𝑚𝑏𝑀𝑚=1

𝑏

𝑃𝑡𝑃 =

𝑝𝑚𝑡𝑞𝑚𝑡𝑀𝑚=1

𝑝𝑚𝑏𝑞𝑚𝑡𝑀𝑚=1

𝑏 𝑄𝑡𝐿 =

𝑝𝑚𝑡𝑞𝑚𝑡𝑀𝑚=1

𝑝𝑚𝑡𝑞𝑚𝑏𝑀𝑚=1

𝑏

𝑃𝑡𝐹 = 𝑃𝑡

𝐿 ∙ 𝑃𝑡𝑃

𝑏𝑏𝑏 𝑄𝑡𝐹 = 𝑄𝑡

𝐿 ∙ 𝑄𝑡𝑃

𝑏𝑏𝑏

Indice di Paasche (a ponderazione variabile)

Indice ideale di Fisher (a ponderazione incrociata)

60

Esercizio 2 – Numeri indici

Anno Prezzo unitario

2008 40

2009 42

2010 50

2011 70

2012 82

• Calcolare la serie dei numeri indici % a base fissa 2008 e a base fissa 2010.

• Quali sono le variazioni % dei prezzi nei diversi anni dall’anno base 2008?

• Passare dalla serie dei numeri indici a base fissa 2008 a quella a base fissa 2010.

• Calcolare la serie dei numeri indici % a base mobile.

• Passare dalla serie dei numeri indici a base fissa 2008 a quella a base mobile.

• Passare dalla serie dei numeri indici a base mobile a quella a base fissa 2010.

• Qual è stata la variazione media del prezzo del bene considerato tra il 2009 e il 2011? 61

Distribuzioni di frequenza doppie e connessione

Irene Martelli


Le distribuzioni doppie di frequenza o bivariate

• Definizione: dati due caratteri X e Y, si definisce distribuzione doppia di frequenza

l’insieme delle frequenze congiunte 𝑛𝑖ℎ dove:

• Con 𝑛𝑖ℎ indichiamo le frequenze assolute delle unità che presentano la modalità i-esima

della X e la modalità h-esima della Y.

Riprendiamo l’esempio dell’esame di Statistica che abbiamo visto nella prima esercitazione:

Genere (X)

Esito (Y) Totale

Promosso Non promosso

M 8 6 14

F 5 6 11

Totale 13 12 25

• Il carattere X è il genere e può assumere le modalità M ed F

• Il carattere Y è l’esito e può assumere le modalità P e NP

• Per esempio, la cella evidenziata rappresenta 𝑛𝑀𝑃 ovvero il numero di studenti che presentano la modalità M del carattere X e la modalità P del carattere Y

63

Distribuzioni doppie: schema generale e distribuzioni marginali

𝑦1 … 𝑦ℎ … 𝑦𝑣 Totale

𝑥1 𝑛11 … 𝑛1ℎ … 𝑛1𝑣 𝑛10

⋮ ⋮ ⋮ ⋮ ⋮

𝑥𝑖 𝑛𝑖1 … 𝑛𝑖ℎ … 𝑛𝑖𝑣 𝑛𝑖0

⋮ ⋮ ⋮ ⋮ ⋮

𝑥𝑢 𝑛𝑢1 … 𝑛𝑢ℎ … 𝑛𝑢𝑣 𝑛𝑢0

Totale 𝑛01 … 𝑛0ℎ … 𝑛0𝑣 𝑛

X Y

• In rosso abbiamo la distribuzione doppia dei caratteri X ed Y (frequenze congiunte)

• In blu è evidenziata la distribuzione marginale della X: mi indica quante unità

presentano le diverse modalità del carattere X indipendentemente dalle modalità che le

unità assumono in relazione alla variabile Y.

• In verde è evidenziata la distribuzione marginale della Y. 64

Esercizio 1 – Distribuzioni marginali

• Proprietà che valgono sempre, per costruzione:

• Frequenze marginali del carattere X: 𝑛𝑖0 = 𝑛𝑖ℎ𝑣ℎ=1 per 𝑖 = 1, 2, … , 𝑢

• Frequenze marginali del carattere Y: 𝑛0ℎ = 𝑛𝑖ℎ𝑢𝑖=1 per ℎ = 1, 2, … , 𝑣

• Numerosità totale del collettivo: 𝑛 = 𝑛𝑖ℎ𝑣ℎ=1 =𝑢

𝑖=1 𝑛𝑖0 =𝑢𝑖=1 𝑛0ℎ

𝑣ℎ=1

• Nota bene: le distribuzioni marginali sono distribuzioni univariate.

• Esercizio 2 pag. 157 (Statistica e laboratorio)

La tabella a lato riporta la classificazione

delle atlete di una polisportiva in base

alla statura (cm) e al tipo di sport praticato.

• Qual è l’unità statistica di riferimento?

• Costruire le distribuzioni marginali.

• Quante sono le unità statistiche complessivamente?

Sport

Statura di squadra individuale

160 -| 170 2 12

170 -| 180 8 25

180 -| 190 23 4

65

Le distribuzioni condizionate (1)

• A partire dalla distribuzione doppia posso ottenere le distribuzioni condizionate.

• Distribuzione di X condizionata ad Y: vado a studiare com’è distribuito il carattere X, ma mi

vincolo (condiziono) ad una particolare modalità del carattere Y. Posso avere un numero di

distribuzioni di X condizionate ad Y pari al numero delle modalità del carattere Y (v).

• Per esempio se mi concentro sulla prima modalità di Y:


𝑥1 𝑛11 … 𝑛1ℎ … 𝑛1𝑣 𝑛10

⋮ ⋮ ⋮ ⋮ ⋮


⋮ ⋮ ⋮ ⋮ ⋮



X Y Frequenze

𝑥1 𝑛11

⋮ ⋮

𝑥𝑖 𝑛𝑖1

⋮ ⋮

𝑥𝑢 𝑛𝑢1

Totale 𝑛01

X (𝑌 = 𝑦1)

66

Le distribuzioni condizionate (2)

• Distribuzione di Y condizionata ad X: vado a studiare com’è distribuito il carattere y, ma mi

vincolo (condiziono) ad una particolare modalità del carattere X. Posso avere un numero di

distribuzioni di Y condizionate ad X pari al numero delle modalità del carattere X (u).

• Per esempio se mi concentro sull’ultima modalità di X:

• Nota bene: le distribuzioni condizionate sono distribuzioni univariate.


𝑥1 𝑛11 … 𝑛1ℎ … 𝑛1𝑣 𝑛10

⋮ ⋮ ⋮ ⋮ ⋮


⋮ ⋮ ⋮ ⋮ ⋮



X Y Frequenze

𝑦1 𝑛𝑢1

⋮ ⋮

𝑦ℎ 𝑛𝑢ℎ

⋮ ⋮

𝑦𝑣 𝑛𝑢𝑣

Totale 𝑛𝑢0

Y (𝑋 = 𝑥𝑢)

67

Esercizio 2 – Distribuzioni condizionate

Classificazione delle atlete di una polisportiva in base alla statura (cm) e al tipo di

sport praticato:

• Quante distribuzioni condizionate è possibile costruire? Costruirle.

• Qual è la statura media delle atlete che praticano sport di squadra?

• E quella delle atlete che praticano uno sport individuale?

Sport


160 -| 170 2 12

170 -| 180 8 25

180 -| 190 23 4

68

Esercizio 3 – Distribuzioni di frequenze relative

• Come già sappiamo, in generale a partire dalle distribuzioni di frequenze assolute è

possibile passare alle corrispondenti distribuzioni di frequenze relative (o percentuali).

• Si applica lo stesso procedimento anche per le distribuzioni doppie, per quelle

marginali e per quelle condizionate.

• Nota bene: dobbiamo fare attenzione a cosa rapportiamo le singole frequenze assolute

per ottenere le corrispondenti frequenze relative (percentuali).

Con riferimento alla tabella che riporta la classificazione delle atlete in base alla

statura e al tipo di sport praticato, a partire dai risultati ottenuti negli esercizi 1 e 3,

costruire:

• La distribuzione doppia di frequenze relative.

• Le distribuzioni di frequenze relative marginali.

• Le distribuzioni di frequenze relative condizionate.

69

Breve riassunto teorico – Diversi tipi di associazione

• Associazione o connessione statistica: per valutare se due variabili sono legate.

• Connessione: viene analizzata la tabella doppia. Andiamo a studiare se i due caratteri sono indipendenti oppure no.

• Si usa per tutti i tipi di caratteri (unica analisi se entrambi sono qualitativi)

• Dipendenza in media: presenza di un legame tra le medie delle distribuzioni condizionate e la media marginale.

• Carattere dipendente quantitativo.

• Concordanza: presenza di un legame (assoluto)

• Solo per variabili entrambe quantitative.

• Indipendenza statistica o in distribuzione: il carattere X si dice indipendente in

distribuzione da Y se qualsiasi sia la modalità con cui si manifesta Y, la distribuzione

relativa condizionata di X non cambia. Nota bene: è una relazione simmetrica.

Correlazione: valutazione dell’intensità reciproca del legame tra le due variabili

Dipendenza: esistenza di un legame (lineare) di causalità tra le due variabili

70

Connessione e indipendenza in distribuzione tra due caratteri (1)

• La connessione tra due caratteri di una distribuzione doppia va intesa come

l’allontanamento dall’indipendenza distributiva:

• Quindi per prima cosa dobbiamo capire bene cosa si intende per indipendenza in

distribuzione tra due caratteri. Possiamo avere diversi casi, per esempio (vedi slide Prof.):

Indipendenza distributiva → Connessione nulla

Perfetta dipendenza distr. → Connessione massima

𝑦1 𝑦2 𝑦3 Tot.

𝑥1 𝑛11 0 0 𝑛10

𝑥2 0 𝑛22 0 𝑛20

𝑥3 0 0 𝑛33 𝑛30

𝑥4 𝑛41 0 0 𝑛40

𝑥5 0 𝑛52 0 𝑛50

Tot. 𝑛01 𝑛02 𝑛03 𝑛


𝑥1 𝑛11 𝑛12 𝑛13 𝑛10

𝑥2 0 𝑛22 0 𝑛20

𝑥3 0 0 𝑛33 𝑛30

𝑥4 𝑛41 𝑛42 0 𝑛40

𝑥5 𝑛51 𝑛52 0 𝑛50

Tot. 𝑛01 𝑛02 𝑛03 𝑛

Perfetta dipendenza Dipendenza non perfetta

71


𝑥1 2 2 2 6

𝑥2 1 1 1 3

𝑥3 5 5 5 15

Tot. 8 8 8 24

Perfetta indipendenza

Connessione e indipendenza in distribuzione tra due caratteri (2)

• Quando le frequenze relative condizionate sono uguali

tra loro indipendentemente dalla modalità considerata,

si dice che le variabili sono statisticamente indipendenti.

• Conoscere la modalità 𝑥𝑖 di un’unità non rende più o

meno probabile la sua appartenenza a una specifica

modalità 𝑦ℎ.

• Se Y è indipendente da X allora anche X è indipendente

da Y (è un concetto simmetrico).

• Si può dimostrare (vedi slide Prof.) che, in caso di

perfetta indipendenza in distribuzione,

la generica frequenza congiunta assume il valore:

• Quindi, data una qualsiasi tabella doppia, poiché si dispone dei totali di riga e di

colonna, posso sempre costruire la tabella di indipendenza che contiene le frequenze

congiunte teoriche (per questo sono indicate con l’asterisco) che si avrebbero in caso

di indipendenza.

𝑛𝑖ℎ∗ =

𝑛𝑖0 ∙ 𝑛0ℎ𝑛

2 =6 ∙ 8

24 1 =

3 ∙ 8

24

72

Esercizio 4 – Costruzione della tabella di indipendenza teorica




• Quali sarebbero le frequenze congiunte

se i due caratteri osservati fossero

indipendenti in distribuzione?

Sport


160 -| 170 2 12

170 -| 180 8 25

180 -| 190 23 4

73

Il Chi-quadrato

• Si basa sulle differenze tra le frequenze osservate e le frequenze teoriche.

• Può essere calcolato sia per caratteri quantitativi che per caratteri qualitativi.

• È sempre positivo e tende ad aumentare al crescere del legame tra i due caratteri.

• Il valore minimo che può assumere è pari a zero (caso di indipendenza) e il valore

massimo che può assumere dipende dalle dimensioni della tavola (numero di modalità)

e dal numero di unità considerate.

• Attenzione: il suo valore assoluto non può essere interpretato, tranne che nel caso di

indipendenza (Chi-quadrato = 0). Se diverso da 0 indica che c’è connessione, ma non la

possiamo misurare.

• L’indicatore di connessione Chi-quadrato 𝝌𝟐

χ2 = 𝑛𝑖ℎ − 𝑛𝑖ℎ

∗2

𝑛𝑖ℎ∗

𝑣

ℎ=1

𝑢

𝑖=1

dove 𝑛𝑖ℎ∗ =

𝑛𝑖0 ∙ 𝑛0ℎ𝑛

74

L’indice di connessione normalizzato

• Si può ricavare un indice di connessione normalizzato (che varia tra 0 ed 1) rapportando il

Chi-quadrato al valore massimo che può assumere.

• Si può dimostrare che: χ2 =max 𝑛 ∙ 𝑚𝑖𝑛 𝑢, 𝑣 − 1

• Indice di connessione normalizzato:

• L’indice di connessione normalizzato varia tra 0 ed 1:

0 ≤χ2

𝑛 ∙ 𝑚𝑖𝑛 𝑢, 𝑣 − 1≤ 1

χ2

𝑛 ∙ 𝑚𝑖𝑛 𝑢, 𝑣 − 1

Numero di modalità della X (righe)

Numero di modalità della Y (colonne)

Connessione nulla (indipendenza distributiva)

Connessione massina (perfetta dipendenza

distributiva)

75

Esercizio 5 – Indicatori di connessione




• Calcolare l’indicatore di connessione Chi-quadrato.

• Calcolare l’indice di connessione normalizzato e commentare il risultato.

Sport


160 -| 170 2 12

170 -| 180 8 25

180 -| 190 23 4

76

Esercizio 6 – Esercizio riepilogativo sulla connessione

• Esercizio 4 pag. 159 (Statistica e laboratorio)

Un insieme di 68 individui è stato classificato sulla base delle variabili seguenti:

presenza di affezioni respiratorie croniche X (con modalità sano e malato) e livello di

inquinamento della città di residenza Y (con modalità basso, medio e alto).

• Qual è il numero totale delle unità statistiche?

Qual è il numero di coloro che non sono affetti da patologie respiratorie croniche?

• I due caratteri sono indipendenti in distribuzione?

Calcolare un indicatore che misuri l’eventuale dipendenza.

X

Y Sano Malato

Basso 12 6

Medio 20 13

Alto 4 13

77

Correlazione e regressione

Irene Martelli


Breve riassunto teorico – Diversi tipi di associazione

• Associazione o connessione statistica: per valutare se due variabili sono legate.

• Connessione: viene analizzata la tabella doppia. Andiamo a studiare se i due caratteri sono indipendenti oppure no.

• Si usa per tutti i tipi di caratteri (unica analisi se entrambi sono qualitativi)

• Dipendenza in media: presenza di un legame tra le medie delle distribuzioni condizionate e la media marginale.

• Carattere dipendente quantitativo.

• Concordanza: presenza di un legame (assoluto)

• Solo per variabili entrambe quantitative.

• Indipendenza statistica o in distribuzione: il carattere X si dice indipendente in

distribuzione da Y se qualsiasi sia la modalità con cui si manifesta Y, la distribuzione

relativa condizionata di X non cambia. Nota bene: è una relazione simmetrica.

Correlazione: valutazione dell’intensità reciproca del legame tra le due variabili

Dipendenza: esistenza di un legame (lineare) di causalità tra le due variabili

79

La concordanza

• Solo per caratteri quantitativi: X e Y, variabili quantitative.

• Legame di tipo lineare tra le due variabili: si cerca la direzione prevalente di tale legame.

• Grafico di dispersione → nuvola di punti:

• Se sono disposti lungo una retta,

relazione lineare perfetta:

• Se sono attorno a una retta,

esiste relazione ma non perfetta:

Inoltre:

• Se la nuvola è allungata dal basso verso l’alto: relazione positiva.

• Se la nuvola è allungata dall’alto verso il basso: relazione negativa.

80

Esercizio 1 – Concordanza: grafico di dispersione

• Es. 9 pag. 161 «Statistica e laboratorio»

I seguenti dati si riferiscono alla lunghezza media (Y) e alla larghezza media (X),

entrambe in cm, delle foglie di sei esemplari di una pianta:

X 9 4 10 9 10 6

Y 8 4 18 22 30 8

• Costruire il grafico di dispersione

• Osservare la nuvola di punti e individuare quale tipo di relazione

sussiste tra le due variabili osservate

81

Misura sintetica di concordanza: la covarianza

Ci si chiede, in pratica, se le deviazioni da un termine di

riferimento (media aritmetica) per i due caratteri vadano

nella stessa direzione.

Si considerano quindi gli scostamenti 𝑥 − 𝑥 e 𝑦 − 𝑦 :

1. Scostamenti concordi (entrambi + o -) = I e III quadrante

2. Scostamenti discordi (uno +, l’altro -) = II e IV quadrante

I

III

II

IV

𝑋

𝑌

𝑥

𝑦

Covarianza

• È una misura sintetica di concordanza

• È la media aritmetica dei prodotti degli scarti delle due variabili dalle rispettive medie:

𝜎𝑥𝑦 = 𝑐𝑜𝑣𝑎𝑟 𝑋, 𝑌 =1

𝑛 𝑥𝑗 − 𝑥 𝑦𝑗 − 𝑦 =

1

𝑛 𝑥𝑗𝑦𝑗 − 𝑥 𝑦 =

𝑐𝑜𝑑𝑒𝑣(𝑋, 𝑌)

𝑛

𝑛

𝑗=1

𝑛

𝑗=1

Formula definitoria Formula per il calcolo 82

Indice relativo di concordanza: il coefficiente di correlazione lineare

• Attenzione: la codevianza (e quindi anche la covarianza) è influenzata dall’unità di

misura delle variabili osservate, non è perciò confrontabile. Per effettuare confronti è

necessario un indice relativo.

• Si dimostra che:

• Quindi un indice relativo è:

• Formula alternativa:

𝜎𝑥 e 𝜎𝑦 sono le deviazioni

standard di 𝑋 e 𝑌

𝜎𝑥𝑦 è la covarianza

−𝜎𝑥𝜎𝑦 ≤ 𝜎𝑥𝑦 ≤ 𝜎𝑥𝜎𝑦

𝜌𝑥𝑦 =𝜎𝑥𝑦

𝜎𝑥𝜎𝑦

Coefficiente di correlazione lineare

(di Bravais e Pearson)

• 𝜌𝑥𝑦 = −1

se tra 𝑋 e 𝑌 vi è perfetto legame lineare con caratteri discordi

• 𝜌𝑥𝑦 = 0

se 𝑋 e 𝑌 sono indipendenti o tra loro vi è una relazione non lineare

• 𝜌𝑥𝑦 = 1

se tra 𝑋 e 𝑌 vi è perfetto legame lineare con caratteri concordi

𝜌𝑥𝑦 =𝑐𝑜𝑑𝑒𝑣(𝑋, 𝑌)

𝑑𝑒𝑣 𝑋 𝑑𝑒𝑣(𝑌)=

(𝑥𝑗 − 𝑥 )(𝑦𝑗 − 𝑦 )𝑛𝑗=1

(𝑥𝑗 − 𝑥 )2𝑛𝑗=1 (𝑦𝑗 − 𝑦 )2𝑛

𝑗=1

dove:

83

Esercizio 2 – Covarianza e indice di correlazione lineare




X 9 4 10 9 10 6

Y 8 4 18 22 30 8

• Dopo aver calcolato le medie aritmetiche delle due variabili, osservare i segni

degli scostamenti. Prevalgono quelli concordi o discordi?

Potevo aspettarmi questo risultato?

• Calcolare la covarianza.

• Calcolare l’indice di correlazione lineare.

• Commentare i risultati.

84

Dipendenza e regressione: il modello di regressione lineare (1)

• Consideriamo la direzione dell’associazione tra le due variabili.

• Abbiamo una variabile indipendente o esplicativa (generalmente la X) ed una variabile

dipendente (generalmente la Y).

• Si assume una relazione di tipo lineare → modello statistico di regressione lineare:

• Per ogni unità statistica avremo:

Ordinata all’origine (punto in cui la retta

incontra l’asse Y)

𝑦 = 𝑎 + 𝑏𝑥 + 𝑒

Coefficiente di regressione riassume l’intensità della

dipendenza lineare della Y da X

Termine d’errore

dove 𝑦∗è il valore teorico nel caso di

perfetta dipendenza lineare

𝑒 = 𝑦 − 𝑦∗ Valore osservato di Y

Valore osservato

di X

𝑦𝑗 → valore osservato

𝑦𝑗∗ → valore teorico

𝑦𝑗 = 𝑎 + 𝑏𝑥𝑗 + 𝑒𝑗

𝑦𝑗∗ = 𝑎 + 𝑏𝑥𝑗

𝑒𝑗 = 𝑦𝑗 − 𝑦𝑗∗

𝑥

𝑦

𝑥𝑗

𝑦𝑗

𝐲∗ = 𝐚 + 𝐛𝐱

𝑦𝑗∗

𝑒𝑗

Nota bene: gli errori possono essere negativi (vedi figura)

85

Dipendenza e regressione: il modello di regressione lineare (2)

• Obiettivo: individuare la retta (ovvero stimare i parametri 𝑎 e 𝑏) che più si avvicina ai

punti → criterio di accostamento.

• Metodo dei minimi quadrati: trovare i valori di 𝑎 e 𝑏 che rendono minima la somma dei

quadrati delle differenze tra valore osservato e valore teorico.

𝑦𝑗 − 𝑦𝑗∗

2𝑛

𝑗=1

= 𝑦𝑗 − (𝑎 + 𝑏𝑥𝑗)2= 𝑦𝑗 − 𝑎 − 𝑏𝑥𝑗

2𝑛

𝑗=1

𝑛

𝑗=1

= 𝜑 𝑎, 𝑏 = min

𝐶𝑜𝑑𝑒𝑣 𝑋, 𝑌 = 𝑥𝑗 − 𝑥 𝑦𝑗 − 𝑦 = 𝑥𝑗𝑦𝑗 − 𝑥 𝑦

𝑛

𝑗=1

𝑛

𝑗=1

𝑛 → può essere negativa

𝐷𝑒𝑣 𝑋 = 𝑥𝑗 − 𝑥 2= 𝑥𝑗

2 −

𝑛

𝑗=1

𝑛

𝑗=1

𝑛𝑥 2 → è sempre positiva

𝑏 =𝐶𝑜𝑑𝑒𝑣(𝑋, 𝑌)

𝐷𝑒𝑣(𝑋)=𝐶𝑜𝑑𝑒𝑣(𝑋, 𝑌)/𝑛

𝐷𝑒𝑣(𝑋)/𝑛=𝐶𝑜𝑣𝑎𝑟(𝑋, 𝑌)

𝑉𝑎𝑟(𝑋)=𝜎𝑥𝑦

𝜎𝑥2

𝑎 = 𝑦 − 𝑏𝑥

86

Esercizio 3 – Retta di regressione lineare




X 9 4 10 9 10 6

Y 8 4 18 22 30 8

• Stimare la retta di regressione lineare di Y su X.

• La retta è ascendente o discendente?

• In che punto incontra l’asse delle ordinate?

87

Esercizio 4 – Interpretare il coefficiente di regressione

Il coefficiente di regressione b:

• Indica quanto varia in media Y per ogni variazione unitaria di X →

• Ha il segno della codevianza (o della covarianza):

• 𝑏 > 0 𝐶𝑜𝑑𝑒𝑣 𝑋, 𝑌 > 0 ; retta ascendente; concordanza

• 𝑏 < 0 𝐶𝑜𝑑𝑒𝑣 𝑋, 𝑌 < 0; retta discendente; discordanza

• 𝑏 = 0 𝐶𝑜𝑑𝑒𝑣 𝑋, 𝑌 = 0; retta parallela all’asse delle ascisse (y = 𝑦 ); Y linearmente indipendente da X; indipendenza lineare

variazioni espresse nell’unità di misura della Y


• Interpretare il coefficiente di regressione della retta stimata.

88

Esercizio 5 – Correlazione e regressione

Esistono importanti relazioni tra la regressione e la correlazione, infatti:

• se la correlazione è positiva il coefficiente angolare b della regressione è positivo

• se la correlazione è negativa il coefficiente angolare b della regressione è negativo

• se la correlazione è nulla il coefficiente angolare b della regressione è uguale a 0

𝜌𝑥𝑦 =𝜎𝑥𝑦

𝜎𝑥𝜎𝑦 𝑏 =

𝜎𝑥𝑦

𝜎𝑥2

possiamo osservare che:


• Verificare che nel nostro esercizio vale la relazione tra coefficiente di

correlazione lineare e coefficiente di regressione.

89

L’indice di determinazione lineare R2

• Scomposizione della devianza di Y: 𝐷𝑒𝑣(𝑌)𝑡𝑜𝑡 = 𝐷𝑒𝑣(𝑌)𝑟𝑒𝑔𝑟 + 𝐷𝑒𝑣(𝑌)𝑑𝑖𝑠𝑝

𝑦𝑗 − 𝑦 2=

𝑛

𝑗=1

𝑦𝑗∗ − 𝑦

2+ 𝑦𝑗 − 𝑦𝑗

∗2

𝑛

𝑗=1

𝑛

𝑗=1

Devianza di regressione indica la parte di variabilità della Y

dovuta alla dipendenza lineare dalla X

Devianza di dispersione misura l’allontanamento tra i valori

osservati 𝑦𝑗 e i valori teorici 𝑦𝑗∗

𝑅2 =𝐷𝑒𝑣(𝑌)𝑟𝑒𝑔𝑟

𝐷𝑒𝑣(𝑌)𝑡𝑜𝑡 = 1 −

𝐷𝑒𝑣(𝑌)𝑑𝑖𝑠𝑝𝐷𝑒𝑣(𝑌)𝑡𝑜𝑡

= 𝑦𝑗

∗ − 𝑦 2

𝑛𝑗=1

𝑦𝑗 − 𝑦 2𝑛

𝑗=1

Devianza totale

• Indica la frazione di variabilità di Y da attribuire alla dipendenza lineare da X

Indice di determinazione lineare

• 𝑅2 = 0 per 𝐷𝑒𝑣(𝑌)𝑟𝑒𝑔𝑟 = 0 → Retta non inclinata e devianza di regressione nulla

• 𝑅2 = 1 per 𝐷𝑒𝑣(𝑌)𝑑𝑖𝑠𝑝 = 0 → Tutta la variabilità di Y è dovuta alla dipendenza lineare tra X e Y e la devianza di dispersione è nulla

0 ≤ 𝑅2 ≤ 1

90

Esercizio 6 - Indice di determinazione lineare R2




X 9 4 10 9 10 6

Y 8 4 18 22 30 8

• Scomporre la devianza di Y in devianza di regressione e

devianza di dispersione.

• Qual è la frazione di variabilità di Y da attribuire alla

dipendenza lineare da X?

91

Esercizio 7 – Esercizio riepilogativo su correlazione e regressione


Su 10 banche del territorio forlivese, sono stati osservati il numero di clienti (X) e il

numero di dipendenti (Y), ottenendo le seguenti quantità:

𝑥𝑗 = 2.345

𝑛

𝑗=1

𝑦𝑗 = 180

𝑛

𝑗=1

𝑥𝑗2 = 622.025

𝑛

𝑗=1

𝑦𝑗2 = 3.908

𝑛

𝑗=1

𝑥𝑗𝑦𝑗 = 48.395

𝑛

𝑗=1

• Stimare i parametri della retta di regressione lineare e commentare il valore di 𝑏𝑦𝑥

• In base alla retta stimata, quanti dipendenti dovrebbe avere una banca con 200 clienti?

• Quanta correlazione lineare si realizza tra X e Y, rispetto alla massima ipotizzabile?

• Che percentuale di variabilità del numero di dipendenti è spiegata dalla sua dipendenza

lineare dal numero di clienti?

92

Elementi di probabilità

Irene Martelli


Definizioni di base

Prova aleatoria o esperimento aleatorio:

operazione dove posso avere 2 o più

risultati, ma il risultato che effettivamente

si verifica è incerto.

Spazio fondamentale S: insieme dei

possibili singoli esiti dell’esperimento

aleatorio.

È un insieme esaustivo e disgiuntivo.

Evento elementare: sottoinsieme di S

che contiene un solo elemento

(ciascun singolo esito possibile).

Evento aleatorio E: sottoinsieme di S

(non necessariamente di un solo elemento).

Lancio di un dado

𝑆 = 1, 2, 3, 4, 5, 6

𝑒𝑙𝐸1 = 1 𝑒𝑙𝐸2 = 2 𝑒𝑙𝐸3 = 3

𝑒𝑙𝐸4 = 4 𝑒𝑙𝐸5 = 5 𝑒𝑙𝐸6 = 6

𝐸1 = uscita num. dispari = 1, 3, 5

𝐸2 = uscita num. ≥ a 5 = 5, 6

𝐸3 = uscita num. ≥ a 2 = 2, 3, 4, 5, 6

𝐸6 = uscita num. 6 = 6

Esempio classico

Nota: gli eventi elementari sono eventi aleatori E a tutti gli effetti!

94

Esercizi 1 – Definizioni di base

• Domenica prossima si giocherà la partita di campionato Torino – Juventus, di cui

ovviamente non è ancora noto il risultato (vittoria di una delle due squadre o pareggio)

• Individuare gli eventi elementari e costruire lo spazio fondamentale.

• Quali eventi non elementari si possono costruire a partire dal nostro spazio

fondamentale?

• Si consideri la prova aleatoria «lancio di due monete contemporaneamente»

• Individuare gli eventi elementari e costruire lo spazio fondamentale.

• Individuare almeno due eventi non elementari che si possono costruire a partire

dallo spazio fondamentale.

95

Alcune tipologie di eventi

𝐸1

𝐸2

𝐸3

𝑆

Evento certo 𝑆 = 𝐸1, 𝐸2, 𝐸3, …

Eventi compatibili 𝐸𝑖 ∩ 𝐸𝑗 ≠ ∅

Eventi incompatibili (o disgiunti) 𝐸𝑖 ∩ 𝐸𝑗 = ∅

𝐸2

𝐸3

𝑆

𝐸1

𝑆

𝐸3

𝑆

𝐸1

𝐸2

𝐸3

𝐸1

𝐸2

Evento impossibile 𝐸ℎ = ∅

𝐸1

𝐸2

𝐸3

𝑆

𝐸1

𝐸2

𝑆

Evento 𝐸3

Evento negazione 𝐸3 = 𝑆 − 𝐸3

𝐸3

𝐸3 𝐸1

𝐸2 𝑆

96

La probabilità: riassunto dei concetti fondamentali

• Probabilità di un evento E: si indica con P(E) ed è un numero compreso tra 0 ed 1 che

misura il grado di incertezza del verificarsi dell’evento E.

0 ≤ 𝑃(𝐸) ≤ 1

Evento impossibile ha probabilità 0.

Esempio: che esca la faccia 8 nel lancio di un dado standard

𝐸 = ∅ e P(∅) = 0

Evento certo ha probabilità 1.

Esempio: che esca un numero compreso tra 1 e 6 nel lancio del dado

𝐸 = 𝑆 e 𝑃 𝑆 = 1

• Probabilità dell’evento negazione 𝑬 (non 𝑬):

𝑃 𝐸 = 1 − 𝑃(𝐸)

𝐸1, 𝐸2 ∈ 𝑆

𝑃 𝐸1 ∪ 𝐸2 = 𝑃 𝐸1 + 𝑃 𝐸2 − 𝑃 𝐸1 ∩ 𝐸2

• Diverse definizioni: classica, frequentista, su scommessa e assiomatica.

• Regola dell’addizione o principio delle probabilità totali:

𝑃 𝐸 = n. casi favorevoli

n. casi possibili

Utile per il calcolo «pratico»

(qualsiasi, anche compatibili)

Uti

le p

er le

pro

pri

età

• 𝑃 𝑆 = 1 • 𝑃 𝐸 ≥ 0 ∀ 𝐸 ∈ 𝑆

• 𝑃 𝐸1 ∪⋯∪ 𝐸ℎ = 𝑃 𝐸1 +⋯+ 𝑃 𝐸ℎ

𝐸𝑖 ∩ 𝐸𝑗 = ∅ ∀ 𝑖, 𝑗 (a due a due incompatibili)

Funzione che associa a un evento E un valore numerico P(E) che soddisfa gli assiomi:

97

Esercizio 2 – Probabilità di eventi

Un’urna contiene venti palline numerate da 1 a 20. La prova aleatoria è l’estrazione di una

pallina da tale urna. Dopo aver definito lo spazio fondamentale, si calcoli:

• La probabilità di ciascun evento elementare

• La probabilità degli eventi:

A = «la pallina estratta ha un numero inferiore a 4 oppure ha un numero multiplo di 6»

B = «la pallina estratta ha un numero multiplo di 2 oppure ha un numero multiplo di 5»

C = «la pallina estratta non è un multiplo di 3»

D = «la pallina estratta ha un numero multiplo di 2 e minore di 8»

E = «la pallina estratta ha un numero maggiore di 35»

F = «la pallina estratta ha un numero compreso tra 1 e 20»

98

Eventi dipendenti/indipendenti e probabilità condizionata

Due eventi compatibili possono essere tra loro:

• Indipendenti: se il verificarsi un evento non modifica

la probabilità che si verifichi l’altro.

• Dipendenti: se il verificarsi di un evento modifica

la probabilità che si verifichi l’altro evento.

𝐺

𝑆

𝐸

𝐹

• Dati due eventi compatibili dipendenti E ed F, la probabilità dell’evento E dato che si è

verificato l’evento F viene detta probabilità condizionata di E dato F.

• Se gli eventi E ed F sono indipendenti

la probabilità condizionata coincide con

la probabilità non condizionata:

𝑃 𝐸 𝐹 =𝑃(𝐸 ∩ 𝐹)

𝑃(𝐹)

Probabilità dei casi possibili (è dato che si è verificato F)

Probabilità dei casi favorevoli ad E (sapendo che si è verificato F)

𝑃 𝐸 𝐹 = 𝑃(𝐸)

99

Probabilità dell’intersezione

• La probabilità che si verifichino entrambi

gli eventi (intersezione) è positiva solo per

eventi compatibili.

Se invece gli eventi sono incompatibili:

𝐸 ∩ 𝐹 = ∅ e 𝑃 𝐸 ∩ 𝐹 = 𝑃 ∅ = 0.

• E’ data dal prodotto tra la probabilità condizionata di E dato F e la probabilità di F

oppure dal prodotto tra la probabilità condizionata di F dato E e la probabilità di E:

𝑃 𝐸 ∩ 𝐹 = 𝑃 𝐸 𝐹 ∙ 𝑃 𝐹 = 𝑃 𝐹 𝐸 ∙ 𝑃(𝐸)

• Se gli eventi E ed F sono indipendenti, abbiamo visto che la probabilità condizionata

coincide con quella non condizionata 𝑃 𝐸 𝐹 = 𝑃(𝐸) e 𝑃 𝐹 𝐸 = 𝑃(𝐹), quindi:

𝑃 𝐸 ∩ 𝐹 = 𝑃(𝐸) ∙ 𝑃 𝐹 = 𝑃(𝐹) ∙ 𝑃(𝐸)

Eventi dipendenti

Eventi indipendenti

100

Esercizi 3 - Probabilità condizionate e dell’intersezione (1)

Riprendiamo l’esempio classico del lancio di un dado.

Consideriamo i due eventi: E = «uscita di un numero pari» ed F = «uscita di un numero ≤ 4»

• Calcolare la probabilità dell’evento E

• Calcolare la probabilità dell’evento F

• Qual è la probabilità che sia uscito un numero pari, sapendo che il numero uscito è ≤ 4?


Sia dato un contenitore con 200 biglie ricoperte da un involucro che le rende indistinguibili

alla vista. Si sa però che 40 biglie gialle, 100 bianche e 60 nere. Calcolare:

• La probabilità, pescando a caso, di estrarre una biglia gialla.

• La probabilità, pescando a caso, di estrarre una biglia gialla o una biglia di un qualsiasi

altro colore.

• La probabilità di ottenere 3 biglie gialle, effettuando 3 estrazioni con reintroduzione

delle biglie nel contenitore. 101

Esercizio 4 – Probabilità condizionate e dell’intersezione (2)

• Viene estratta una pallina. Si calcoli la probabilità degli eventi :

I = «la pallina estratta ha un numero pari, dato che è inferiore ad 11»

J = «la pallina estratta ha un numero non multiplo di 3, dato che è maggiore di 16»

• Vengono effettuate due estrazioni con reintroduzione. Si calcoli la probabilità degli eventi:

K = «le palline estratte nei due turni hanno entrambe un numero multiplo di 5»

L = «la pallina estratta nel primo turno ha un numero pari e quella estratta nel

secondo turno ha un numero minore di 11»

Riprendiamo l’esercizio dell’urna con 20 palline numerate da 1 a 20.

• Vengono effettuate due estrazioni senza reintroduzione. Si calcoli la probabilità degli

eventi:

G = «nel primo turno si estrae la pallina col numero 7 e la pallina estratta nel

secondo turno ha un numero pari»

102

Schema delle regole per il calcolo delle probabilità

Unione

Differenza

Intersezione

E condiz. F

Evento Probabilità E ed F

compatibili E ed F

incompatibili

𝑃 𝐸 ∩ 𝐹

𝑃 𝐸 ∪ 𝐹

𝑃 𝐸 − 𝐹

𝑃 𝐸|𝐹

= 𝑃 𝐸 + 𝑃 𝐹 − 𝑃 𝐸 ∩ 𝐹 = 𝑃 𝐸 + 𝑃 𝐹

= 𝑃 𝐸 − 𝑃 𝐸 ∩ 𝐹 = 𝑃 𝐸

= 𝑃 𝐸 𝐹 ∙ 𝑃 𝐹

= 𝑃 𝐹 𝐸 ∙ 𝑃(𝐸)

E ed F Dipendenti

E ed F Indipendenti

= 𝑃(𝐸) ∙ 𝑃 𝐹

= 𝑃(𝐹) ∙ 𝑃(𝐸)

0 (zero)

=𝑃(𝐸 ∩ 𝐹)

𝑃(𝐹)

con 𝑃(𝐹) ≠ 0

= 𝑃 𝐸

103

Distribuzioni doppie, frequenze relative e probabilità

• Data una distribuzione doppia, possiamo

calcolare le frequenze relative e interpretare

tali frequenze come probabilità:

𝑛𝑖0𝑛

= 𝑓𝑖0 = 𝑃(𝑋 = 𝑥𝑖)

𝑛0ℎ𝑛

= 𝑓0ℎ = 𝑃(𝑌 = 𝑦ℎ)

𝑛𝑖ℎ𝑛0ℎ

= 𝑓𝑖|ℎ = 𝑃(𝑋 = 𝑥𝑖|𝑌 = 𝑦ℎ)

𝑛𝑖ℎ𝑛𝑖0

= 𝑓ℎ|𝑖 = 𝑃(𝑌 = 𝑦ℎ|𝑋 = 𝑥𝑖)

𝑛𝑖ℎ𝑛

= 𝑓𝑖ℎ = 𝑃(𝑋 = 𝑥𝑖 ∩ 𝑌 = 𝑦ℎ)

Probabilità congiunte

Probabilità marginali Probabilità condizionate

104

Esercizio 5 – Frequenze relative e probabilità


Un gruppo di persone in età compresa tra 30 e 35 anni è stata classificata secondo

lo stato occupazionale e il possesso di automobile:

Auto nuova

Auto usata

Non possiede auto

Totale

Disoccupato 13 22 16 51

Lavoratore 30 21 7 58

Totale 43 43 23 109

Estraendo una persona a caso, determinare la probabilità:

• Che sia disoccupata

• Che non possieda un auto propria

• Che sia disoccupata e non possieda un auto propria

• Che, dato che la persona estratta lavora, possieda un’auto nuova

Che tipo di probabilità sono (congiunte/marginali/condizionate)? 105

Variabili casuali

Irene Martelli


Cos’è una variabile casuale?

Intuitivamente: una variabile casuale è una variabile che assume determinati valori in modo

casuale (non deterministico).

Definizione: una variabile casuale è una funzione che associa ad ogni evento elementare

dello spazio fondamentale S un unico numero reale.

Quindi in sostanza è una variabile il cui valore numerico è determinato dal risultato di una

prova.

Esempi di variabili casuali:

• l’esito di un’estrazione del Lotto

• il risultato di una partita di calcio

• il voto di un esame

• il numero di autovetture che fanno rifornimento in un determinato distributore in un giorno

• la durata della vita di una persona

• il numero di incidenti stradali in un determinato periodo

𝑋: 𝑆 → 𝓡

𝐸1

𝐸2

𝐸3

𝐸4

𝐸5

𝐸6

𝑆

𝑋

𝑥1

𝑥2

𝑥3

𝑥4

107

Esempio – Definizione di variabile casuale e realizzazione di una v.c.

Consideriamo la prova aleatoria «lancio una moneta per tre volte» e supponiamo di essere

interessati a quante volte esce testa.

Definiamo quindi la variabile casuale «numero di volte in cui esce testa» come una funzione

che associa ad ogni evento dello spazio fondamentale un numero reale pari al num. di teste:

ccc

cct

ctc tcc 0

1

2

3 ctt

tct

ttc

ttt

𝑆 𝑋

𝑋 = numero di volte in cui esce testa

𝑆 = 𝑐𝑐𝑐 , 𝑐𝑐𝑡 , 𝑐𝑡𝑐 , 𝑡𝑐𝑐 , 𝑐𝑡𝑡 , 𝑡𝑐𝑡 , 𝑡𝑡𝑐 , (𝑡𝑡𝑡)

Prima della conclusione della prova

aleatoria non sappiamo quale valore

assumerà la v.c. 𝑋

Dopo aver effettuato la prova aleatoria,

indichiamo con la 𝒙 la realizzazione

della v.c. X.

Per esempio se esce (𝑡𝑐𝑡) avremo che

𝑥 = 2.

𝑋: 𝑆 → 0, 1, 2, 3

108

Esercizio 1 – Definizione di variabile casuale

• La prova aleatoria consiste nel «lancio di un dado standard due volte».

Definiamo le seguenti variabili casuali:

𝑋 = «numero di volte in cui esce un numero pari»

𝑌 = «somma dei numeri ottenuti nei due lanci»

Individuare gli spazi fondamentali più consoni. Quali valori possono assumere le due

variabili casuali definite come funzioni da S ad 𝓡?

• Effettuiamo i due lanci del dado ed otteniamo 6 nel primo e 2 nel secondo .

Quali sono le realizzazioni delle due variabili casuali definite al punto precedente?

109

Esercizio 2 – Variabili casuali discrete e continue

• Una variabile casuale discreta può assumere valori in

un insieme finito (o numerabile) di numeri reali.

• Una variabile casuale continua può assumere tutti i

valori compresi in un intervallo reale.

𝑆 discreto 𝑋 v. c. discreta

𝑆 continuo 𝑋 v. c. continua

• Stabilire la natura (discreta o continua) delle seguenti variabili casuali:

𝑋 = «numero di volte in cui esce testa»

𝑌 = «durata di uno pneumatico»

𝑍 = «numero di pezzi difettosi in 20 prove» (controllo della qualità di un macchinario)

𝑊 = «durata della visita di un utente in una pagina web»

𝑇 = «tempo di attesa prima di poter essere serviti alle poste»

𝑈 = «numero di studenti che passeranno l’esame di Statistica in un corso di 100 studenti» 110

Variabile casuale discreta: distribuzione di probabilità

• Abbiamo visto che una v.c. discreta 𝑋 può assumere valori in un insieme numerabile. Però

(prima di effettuare la prova aleatoria) non è certo quale valore essa assumerà.

• Attraverso la funzione di probabilità possiamo far corrispondere a ciascun valore che la 𝑋

può assumere il rispettivo livello di probabilità.

Proprietà: 𝑃(𝑋 = 𝑥𝑖) ≥ 0 𝑃 𝑋 = 𝑥𝑖 = 1𝑖

𝑃 ∶ 𝑋 → (0,1)

𝑋 = «numero di volte in cui esce testa»

𝑆 = 𝑐𝑐𝑐 , 𝑐𝑐𝑡 , 𝑐𝑡𝑐 , 𝑡𝑐𝑐 , 𝑐𝑡𝑡 , 𝑡𝑐𝑡 , 𝑡𝑡𝑐 , (𝑡𝑡𝑡)

𝑋 ∶ 𝑆 → 0, 1, 2, 3

Livello di probabilità

0 1/8 = 0,125

1 3/8 = 0,375

2 3/8 = 0,375

3 1/8 = 0,125

Tot. 8/8 = 1

𝑃 𝑋 = 0 = 𝑃 𝑐𝑐𝑐 =1

8

𝑃 𝑋 = 1 = 𝑃 𝑐𝑐𝑡 ∪ 𝑐𝑡𝑐 ∪ 𝑡𝑐𝑐 =3

8

𝑃 𝑋 = 2 = 𝑃 𝑐𝑡𝑡 ∪ 𝑡𝑐𝑡 ∪ 𝑡𝑡𝑐 =3

8

𝑃 𝑋 = 3 = 𝑃 𝑡𝑡𝑡 =1

8

• Riprendiamo l’esempio del lancio di una moneta per tre volte:

𝑋 = 𝑥𝑖 𝑃(𝑋 = 𝑥𝑖)

Distribuzione di probabilità

di una v.c. discreta

111

Esercizio 3 – Distribuzione di probabilità di una v.c. discreta

Consideriamo la prova aleatoria «lancio di un dado standard (e regolare) per due

volte» e le variabili casuali definite nell’esercizio 1:



• Determinare le distribuzioni di probabilità delle due variabili casuali.

𝑆 = (11) 2 (21) 3 (31) 4 (41) 5 (51) 6 (61) 7

(12) 3 (22) 4 (32) 5 (42) 6 (52) 7 (62) 8

(13) 4 (23) 5 (33) 6 (43) 7 (53) 8 (63) 9

(14) 5 (24) 6 (34) 7 (44) 8 (54) 9 (64) 10

(15) 6 (25) 7 (35) 8 (45) 9 (55) 10 (65) 11

(16) 7 (26) 8 (36) 9 (46) 10 (56) 11 (66) 12

𝑌 ∶ 𝑆 → 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 Abbiamo visto che:

112

Variabile casuale discreta: funzione di ripartizione

• Un’altra funzione che può essere associata ad una variabile casuale 𝑋 è la funzione di

ripartizione, che associa ad ogni valore 𝑥 la probabilità che la v.c. assuma valori minori

o uguali ad 𝑥.

• Quindi è una funzione che associa ad ogni 𝑥 le probabilità cumulate 𝑃(𝑋 ≤ 𝑥)

𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 = 𝑃(𝑋 = 𝑤)

𝑤≤𝑥

• Esempio: lancio di una moneta per tre volte, 𝑋 = «numero di volte in cui esce testa»:

0 1/8 = 0,125

1 3/8 = 0,375

2 3/8 = 0,375

3 1/8 = 0,125

Tot. 1


0 1/8 = 0,125

1 1/8 + 3/8 = 0,5

2 4/8 + 3/8 = 0,875

3 7/8 + 1/8 = 1

𝑋 = 𝑥𝑖 𝐹 𝑥𝑖 = 𝑃(𝑋 ≤ 𝑥𝑖)

Funzione di ripartizione di una v.c. discreta

0 3 2 1 𝑥

𝐹(𝑥)

1 0,875

0,5

0,125

113

Esercizio 4 – Variabile casuale discreta: funzione di ripartizione





• Determinare le funzioni di ripartizione delle due variabili casuali.

114

Valore atteso e varianza di una variabile casuale discreta

• Il valore medio o valore atteso di una variabile casuale discreta 𝑋 è definito come:

• La varianza di una variabile casuale discreta 𝑋 è definita come:

• Importanti proprietà:

𝐸 𝑋 = 𝑥𝑗 ∙ 𝑃(𝑥𝑗)

𝑗

= 𝜇

𝑉 𝑋 = 𝐸 𝑋 − 𝜇 2 = (𝑥𝑗 − 𝜇)2∙ 𝑃(𝑥𝑗)

𝑗

= 𝜎2

𝐸 𝑎 + 𝑏𝑋 = 𝑎 + 𝑏𝐸(𝑋)

𝑉 𝑎 + 𝑏𝑋 = 𝑏2𝑉(𝑋)

115

Esercizio 5 – Valore atteso e varianza di una v. c. discreta





• Calcolare valore atteso e varianza delle due variabili casuali.

116

La distribuzione di Bernoulli

• Prova aleatoria con due possibili esiti, indicati di solito con 1 (successo) e 0 (insuccesso),

disgiuntivi (o uno o l’altro) ed esaustivi (uno dei due si verifica necessariamente)

• Tutte le prove che producono solo due possibili risultati generano le cosiddette variabili

casuali di Bernoulli: lancio di una moneta, sesso di un nascituro, superamento o meno di

un certo livello di inflazione, …

• La sua funzione di probabilità può essere espressa come:

• Valore atteso e varianza sono:

v.c. di Bernoulli

il valore 1 con probabilità p

il valore 0 con probabilità 1 – p

può assumere

1 p

0 1 – p

Tot. 1


𝑃 𝑋 = 𝑥 = 𝑝𝑥(1 − 𝑝)1−𝑥 per 𝑥 = 0, 1

𝐸 𝑋 = 𝑝 𝑉 𝑋 = 𝑝(1 − 𝑝)

117

Esercizi 6 - Distribuzione di Bernoulli

• Consideriamo la prova aleatoria «lancio di un dado standard (e regolare) per due

volte» e le variabili casuali 𝑍 e 𝑊 definite come:

𝑍 = «esce almeno una volta nei due lanci un numero pari»

𝑊 = «la somma dei numeri ottenuti nei due lanci è maggiore di 8»

• Quali sono le distribuzioni delle due variabili casuali?

• Quali sono le loro distribuzioni di probabilità?

• Calcolare il valore atteso e la varianza delle due variabili casuali (sia applicando

le definizioni di valore atteso e varianza, che utilizzando le formule per la v.c. di

Bernoulli).

118

La distribuzione Binomiale

𝑋 è definita come il «numero di successi ottenuti in una serie di

n prove aleatorie indipendenti», con:

• 𝑃𝑟𝑜𝑏(successo in ogni singola prova) = 𝑝

• 𝑃𝑟𝑜𝑏(insuccesso in ogni singola prova) = 1 − 𝑝

v.c. Binomiale

𝑿~𝑩(𝒏, 𝒑)

𝐸 𝑋 = 𝑛𝑝 𝑉 𝑋 = 𝑛𝑝(1 − 𝑝)

• La sua funzione di probabilità può essere espressa come:

𝑃 𝑋 = 𝑥 = 𝑛𝑥 𝑝𝑥(1 − 𝑝)𝑛−𝑥 per 𝑥 = 0, 1, 2,… , 𝑛

• Valore atteso e varianza sono:

dove: 𝑛𝑥 =

𝑛!

𝑥! 𝑛 − 𝑥 ! 𝑛! = 𝑛 ∙ 𝑛 − 1 ∙ 𝑛 − 2 ∙ ⋯ ∙ 2 ∙ 1 e

119

Esercizio 7 - Distribuzione Binomiale

Consideriamo la prova aleatoria «lancio di un dado standard (e regolare) per 8 volte» e

la variabile casuale definita come:

𝑋 = «numero di volte in cui esce un numero pari in 8 lanci»

• Qual è la distribuzione della variabile casuale?

• Calcolare il valore atteso e la varianza della variabile casuale utilizzando le

formule per la v.c. Binomiale.

• Qual è la probabilità che esca 3 volte un numero pari in 8 lanci?

Es. 19 pag. 214 «Statistica e laboratorio»

Un’azienda che produce televisori spedisce 150 pezzi ad un rivenditore.

Successivamente, l’azienda si accorge di aver spedito al rivenditore 30 televisori

senza telecomando. Scegliendo a caso 8 televisori tra quelli ricevuti dal rivenditore,

qual è la probabilità che non siano estratti televisori senza telecomando? E la

probabilità che sia estratto un solo televisore senza telecomando?

120

Variabile casuale continua: densità di probabilità

• Abbiamo visto che una v.c. continua 𝑋 può assumere tutti i valori compresi in un

intervallo reale.

• A partire dall’insieme dei valori che 𝑋 può assumere, chiameremo funzione di

densità di probabilità la funzione 𝑓(𝑥) per cui l’area sottesa, corrispondente ad un

certo intervallo, è uguale alla probabilità che 𝑋 assuma un valore in quell’intervallo.

• Proprietà delle funzioni di densità:

• 𝑓(𝑥) ≥ 0 sempre

•

• La probabilità che la v.c.

assuma un particolare valore

dell’intervallo è zero.

𝑓 𝑥 𝑑𝑥 = 1

+∞

−∞

𝑃 𝑥𝑎 ≤ 𝑋 ≤ 𝑥𝑏 = 𝑓 𝑥 𝑑𝑥 =𝑥𝑏

𝑥𝑎

0,25

𝑓 𝑥 𝑑𝑥 = 1+∞

−∞

𝑥

𝑓(𝑥)

𝑥𝑎 𝑥𝑏

𝑃 𝑋 = 𝑥𝑎 = 𝑃 𝑋 = 𝑥𝑏 = 0 Attenzione:

(tutta l’area sotto la curva deve essere pari ad 1)

121

V.c. continua: funzione di ripartizione, valore atteso e varianza

• Data una v.c. continua 𝑋, la funzione che fa corrispondere ai valori 𝑥 le probabilità

cumulate 𝑃(𝑋 ≤ 𝑥) viene detta funzione di ripartizione 𝑭(𝒙):

• Il valore atteso di una v.c. continua 𝑋 è definito come:

• La varianza è definita come:

𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 = 𝑓(𝑤)

𝑥

−∞

𝑑𝑤

𝐸 𝑋 = 𝑥 ∙ 𝑓 𝑥

+∞

−∞

𝑑𝑥 = 𝜇

𝑉 𝑋 = 𝐸 𝑋 − 𝜇 2 = (𝑥 − 𝜇)2∙ 𝑓 𝑥

+∞

−∞

𝑑𝑥 = 𝜎2

122

La distribuzione Normale

• La v.c. Normale 𝑋 è una v.c. continua che può assumere valori su tutto l’asse reale.

• Funzione di densità, valore atteso e varianza sono dati da:

𝐸 𝑋 = 𝜇

𝑓 𝑥 =1

𝜎 2𝜋𝑒−12𝑥−𝜇𝜎

2

𝑉 𝑋 = 𝜎2 , 𝜎2 > 0

𝜇 − 𝜎 𝜇 + 𝜎 𝝁

𝝈

𝑥

𝑓(𝑥) 𝑋~𝑁(𝜇, 𝜎)

In forma compatta:

• Proprietà:

• Ogni trasformazione lineare di una v.c. Normale è ancora una v.c. Normale

• La somma di due v.c. Normali indipendenti è ancora una v.c. Normale con media

pari alla somma delle due medie e varianza pari alla somma delle due varianze.

123

La distribuzione Normale standardizzata

• La v.c. Normale standardizzata 𝒁 è una v.c. Normale, che può assumere valori su tutto

l’asse reale, ma che ha media μ = 0 e varianza 𝜎2 = 1 .

• Funzione di densità, valore atteso e varianza sono dati da:

• Importante: per la v.c. normale standardizzata si

dispone di tavole che permettono di calcolare le

aree in corrispondenza degli intervalli assunti dalla z.

Quindi se ho una v.c. Normale 𝑋, posso trasformarla in v.c. Normale Standardizzata 𝑍 e poi

andare a cercare sulle tavole i valori delle probabilità degli intervalli che mi interessano.

• Trasformazione da Normale a Normale Standardizzata:

𝐸 𝑍 = 𝜇 = 0

𝑓 𝑧 =1

2𝜋𝑒−

12 𝑧

2

𝑉 𝑍 = 𝜎2 = 1

𝑍 =𝑋 − 𝜇

𝜎 𝑋~𝑁 𝜇, 𝜎 𝑍~𝑁 0, 1

124

Le tavole della distribuzione Normale standardizzata

𝑃(𝑍 ≤ 𝑧)

𝑃 𝑍 ≤ 0,57 = 0,7157

(mi serve per calcolare in modo indiretto le probabilità che

non sono nella tavola)

𝑃 𝑍 ≤ −0,57 = 1 − 0,7157

Importante: la 𝑍 è simmetrica

Per una tavola diversa vedere pag. 357 «Statistica e laboratorio» 125

Esercizio 7 – Distribuzione Normale (1)


Un’azienda alimentare confeziona pacchi di pasta il cui peso è distribuito come una

normale con media uguale a 500 gr e deviazione standard pari a 8 gr. Calcolare:

• La probabilità che ci sia un pacco dal peso compreso tra 480 e 490 gr

• La probabilità che ci sia un pacco con peso compreso tra i 490 e 510 gr

• La probabilità che ci sia un pacco con peso inferiore ai 490 gr

• La probabilità che ci sia un pacco con peso superiore ai 480 gr


Le altezze dei giocatori delle squadre di calcio di un campionato sono distribuite

normalmente con media 178 cm e scarto quadratico medio 8 cm. Calcolare:

• La probabilità che un giocatore abbia altezza superiore a 190 cm

• La probabilità che un giocatore abbia al massimo altezza pari a 170 cm

126

Esercizio 7 – Distribuzione Normale (2)

Esempio a pag. 203 «Statistica e laboratorio»

Determinare le seguenti probabilità per una v.c. Normale standardizzata 𝑍~𝑁(0, 1)

a. 𝑃(𝑍 < 1,62)

b. 𝑃(𝑍 ≥ 1,62)

c. 𝑃(−1,62 ≤ 𝑍 ≤ 0)

d. 𝑃(−1 ≤ 𝑍 ≤ 1,62)

e. 𝑃 0,5 ≤ 𝑍 ≤ 1,62

f. 𝑃(−1,62 ≤ 𝑍 ≤ −0,5)

127

Distribuzioni campionarie e stima

Irene Martelli


Introduzione: definizioni di base e scopo dell’inferenza

POPOLAZIONE

CAMPIONE

E’ un insieme di unità su cui si può osservare un certo carattere. E’ l’insieme dal quale viene estratto il campione.

• Finita: sappiamo che è composta da 𝑁 unità ed è descritta dai parametri di popolazione:

𝜇 =1

𝑁 𝑥𝑖𝑁𝑖=1 e 𝜎2 =

1

𝑁 (𝑥𝑖 − 𝑥 )2𝑁𝑖=1

• Infinita: composta da unità non tutte determinabili. Indichiamo con Popolazione 𝑋 la variabile casuale 𝑋, caratterizzata da determinati parametri, per esempio valore atteso e varianza di popolazione:

𝜇 = 𝐸(𝑋) e 𝜎2 = 𝐸(𝑋 − 𝜇)2

E’ l’insieme delle unità osservate. Indichiamo con 𝑛 la dimensione del campione. La frazione di campionamento è 𝑛/𝑁.

• Con universo dei campioni (o spazio campionario) 𝜴 indichiamo l’insieme virtuale di

tutti i possibili campioni della stessa numerosità estraibili dalla popolazione.

• Scopo dell’inferenza statistica è ottenere delle informazioni sulla popolazione a partire

dall’osservazione di un campione cercando di commettere il minimo errore (ovviamente

più unità osserviamo, minore è la possibilità di sbagliare). A tale fine è fondamentale che

il campione sia rappresentativo della popolazione. 129

Esercizi – Universo dei campioni


Si vuole estrarre un campione di numerosità 𝑛 = 3 da una popolazione che

consiste di 10 unità statistiche. Quanto vale la frazione di campionamento? Qual è

invece il numero complessivo dei campioni casuali estraibili dalla popolazione, se

adoperiamo il campionamento bernoulliano?

• Es. 2 pag 245 «Statistica e laboratorio»

Data una popolazione formata da 5 unità, determinare l’universo bernoulliano dei

campioni di numerosità pari a 2. Qual è la probabilità che un campione venga

estratto?

Determinare inoltre l’universo bernoulliano dei campioni di numerosità pari a 3.

Quanto vale adesso la probabilità che un campione venga estratto?

130

Campionamento da popolazioni finite e infinite, diversi schemi teorici:

Regola di selezione del campione di tipo

probabilistico.

Per una selezione probabilistica dobbiamo

individuare:

• Lo spazio campionario Ω, formato da

tutti i possibili campioni estraibili con una

medesima tecnica dalla popolazione.

• La probabilità di ogni campione 𝑐 ∈ Ω di

essere estratto

La coppia {Ω, probabilità dei campioni in Ω}

è detta piano di campionamento.

In una popolazione infinita, la n-pla di v.c.

𝑋1, 𝑋2, … , 𝑋𝑛

che compongono il campione casuale di

dimensione 𝑛 presenta le seguenti

proprietà:

• 𝑋1, 𝑋2, … , 𝑋𝑛 sono v.c. indipendenti

• ogni v.c. 𝑋𝑖 possiede la stessa

distribuzione di probabilità della

popolazione 𝑋

… da popolazioni finite

… da popolazioni infinite

Campionamento:

Nota: nelle popolazioni finite in cui la dimensione campionaria è molto più piccola rispetto alla

numerosità della popolazione, si può applicare la teoria del campion. da popolazioni infinite. 131

Le distribuzioni campionarie: la media campionaria

Si tratta di una variabile aleatoria perché prima di avere estratto il campione dall’universo dei campioni non sappiamo quale valore essa assumerà: 𝑥 1 ≠ 𝑥 2 ≠ ⋯ ≠ 𝑥 𝑘

𝐶1

𝐶2

𝐶𝑘

UN

IVER

SO D

EI C

AM

PIO

NI

𝑥 1

𝑥 2

𝑥 𝑘

𝑋 Variabile aleatoria

media aritmetica campionaria

Medie aritmetiche calcolate sulle unità di ciascun singolo campione

• Per 𝒏 piccolo (𝑛 ≤ 30), la distribuzione della v.c. 𝑋 ce la calcoliamo caso per caso (a meno

che il carattere non 𝑋 sia normale: per la proprietà della normale, anche 𝑋 è normale).

• Per 𝒏 grande (𝑛 > 30) o per popolazioni infinite si dimostra (applicando il Teorema

Centrale del Limite) che:

𝑋 ~ 𝑁 𝜇,𝜎

𝑛

• dove 𝜇 e 𝜎 sono i parametri di popolazione

• in qualsiasi modo sia distribuito il carattere 𝑋

Ω

132

Esercizio – Distribuzione della media campionaria

• Esercizio:

Una piccola azienda ha 7 dipendenti e siamo interessati al numero di ore di straordinario

effettuate in una settimana. Questi i risultati nella popolazione di riferimento (𝑁 = 7):

• Campionando con reimmissione (campionamento bernoulliano) quanti campioni con

𝑛 = 2 si possono estrarre?

• Elencare gli elementi da cui è composto l’universo bernoulliano dei campioni.

• Qual è la media di popolazione?

• Determinare la distribuzione della v.c. media aritmetica campionaria.

• Supponiamo di estrarre i dipendenti (5, 7). Qual è la realizzazione della v.c. media

aritmetica campionaria?

Dipendente 1 2 3 4 5 6 7

N. ore di straordinario 3 8 4 7 6 6 4

133

La stima puntuale

Popolazione Campione C di numerosità 𝒏

• 𝑋 variabile casuale con distribuzione nota

• 𝑓(𝑥, 𝜃) funzione di densità della v.c. 𝑋

• 𝜃 parametro di popolazione incognito

• (𝑥1, 𝑥2, …, 𝑥𝑛) campione casuale bernoulliano

• (𝑋1, 𝑋2, …, 𝑋𝑛) v.c. indipendenti e

identicamente distribuite

𝜃 = 𝑡ℎ = 𝑔(𝑥1, 𝑥2, …, 𝑥𝑛) è stima puntuale di 𝜃

Attenzione: la stima è un singolo valore! E’ la realizzazione nel campione della v.c. stimatore nell’universo dei campioni Ω:

𝑇ℎ = 𝑔(𝑋1, 𝑋2, …, 𝑋𝑛)

Popolazione Campione C di numerosità 𝒏

• 𝑋 variabile casuale normale

• 𝑓(𝑥, 𝜃) f.d.d. della v.c. normale

• 𝜃 = 𝜇 = ? parametro incognito

• (𝑥1, 𝑥2, …, 𝑥𝑛) campione casuale semplice

• (𝑋1, 𝑋2, …, 𝑋𝑛) v.c. i.i.d.

• Stima puntuale di 𝜇 :

• Stimatore nell’universo dei campioni:

𝜃 = 𝜇 = 𝑡ℎ = 𝑥

Esempio – stima puntuale della media di una popolazione normale

𝑇ℎ = 𝑋 134

• Abbiamo visto che se X~ 𝑁 𝜇, 𝜎 in popolazione, allora Th = 𝑋 ~ 𝑁 𝜇,𝜎

𝑛

• Il nostro obiettivo è trovare un intervallo di valori all’interno del quale sia compreso il

parametro incognito di interesse 𝝁 con un certo livello di confidenza (grado di fiducia).

• Intervallo di confidenza per la media con varianza nota (vedi slide Prof. per la procedura):

• Tuttuavia, poiché io estraggo un singolo campione, sostituisco ad 𝑋 la media del campione

𝑥 = 𝜇 e ottengo così l’intervallo 𝑥 ± 𝑧𝛼 2 ∙ 𝜎 𝑛 che potrebbe contenere la media

incognita con un grado di fiducia pari a 1 − 𝛼.

La stima per intervalli

1 − 𝛼

𝛼/2 𝛼/2

𝑧𝛼/2 −𝑧𝛼/2

𝛼 = 0,05 = 5%

0,95 = 95%

𝑧𝛼/2 = 1,96 −𝑧𝛼 2 = − 1,96

Esempio:

Nel 2,5% dei campioni possibili, lo stimatore assume valore in questo intervallo (che non contiene il valore del parametro incognito)

La probabilità che l’intervallo contenga il valore del

parametro incognito 𝜇 è 0,95. Livello di confidenza del 95%.

INTERVALLO DI CONFIDENZA

𝑍 =𝑋 − 𝜇

𝜎 𝑛

𝑃 𝑋 − 𝑧𝛼 2 ∙ 𝜎 𝑛 < 𝜇 < 𝑋 + 𝑧𝛼 2 ∙ 𝜎 𝑛 = 1 − 𝛼

135

Esercizi – Stima puntuale e per intervalli della media di popolazione


Un promotore finanziario, per avere un’idea dei prezzi di alcune merci, esamina i prezzi

riportati in diversi mercati, di seguito riportati: (70, 90, 85, 80, 95, 100, 98, 102, 90, 80)

Nella popolazione di riferimento, il prezzo si distribuisce come una v.a. normale con

varianza pari a 225.

• Calcolare una stima corretta per il prezzo medio di popolazione

• Determinare l’intervallo di confidenza al 95%

• Es. 7 pag 246 «Statistica e laboratorio»

In una popolazione di studenti, il punteggio conseguito all’esame di Statistica (X) si

distribuisce secondo una normale con varianza 13,91. In un campione di 40 studenti si

osserva 𝑥𝑗 = 1.00040𝑗=1 .

• Si determini una stima corretta per la media 𝜇 di popolazione

• Si costruiscano gli intervalli di confidenza al 95% e al 99% per la media 𝜇 di

popolazione e si commentino i risultati 136

Esercizi – Stima puntuale e per intervalli della media di popolazione


Durante una prova di selezione per un posto di lavoro viene effettuato un test

scritto. La variabile casuale 𝑋 = «tempo di risposta al test» si distribuisce

normalmente nella popolazione di riferimento, con media incognita e scarto

quadratico medio pari a 4 minuti. In un campione casuale di 20 candidati, si rileva

𝑥𝑗 = 72020𝑗=1 minuti.

• Qual è una stima corretta per il tempo medio di risposta 𝜇 nella

popolazione dei candidati?

• Costruire l’intervallo di confidenza al 99% per 𝜇, commentando il risultato.

137

Data & Analytics

Esercitazioni corso di Statistica con riassunti teorici