89
Esercizi di Statistica Selezione di esercizi proposti durante le esercitazioni dei corsi di Statistica tenute presso la Facolt`a di Economia dell’Universit`a di Salerno Versione del 17 ottobre 2006

Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

Embed Size (px)

Citation preview

Page 1: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

Esercizi di Statistica

Selezione di esercizi proposti durante le esercitazioni

dei corsi di Statistica tenute presso

la Facolta di Economia dell’Universita di Salerno

Versione del 17 ottobre 2006

Page 2: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2

Per fornire un contributo al miglioramento del presente volume, segnalare eventuali errori in essocontenuti a: Marcella Niglio, e-mail: [email protected]

Page 3: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

Indice

1 Statistica Descrittiva 4

1.1 Distribuzioni di frequenza e rappresentazioni grafiche . . . . . . . . . . . . . . . . . 41.2 Indici statistici descrittivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3 Concentrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.4 Distribuzioni Doppie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.5 Numeri Indici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351.6 Interpolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2 Calcolo delle Probabilita 48

2.1 Calcolo delle probabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.2 Variabili Casuali Discrete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562.3 Variabili Casuali Continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3 Inferenza Statistica 70

3.1 Stime puntuali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703.2 Test delle ipotesi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.3 Intervalli di confidenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4 Il Modello di Regressione 84

4.1 Modello di Regressione Lineare Semplice . . . . . . . . . . . . . . . . . . . . . . . . 84

3

Page 4: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

Capitolo 1

Statistica Descrittiva

1.1 Distribuzioni di frequenza e rappresentazioni grafiche

Esercizio 1La societa Gamma s.p.a., dopo aver effettuato una ricerca di personale qualificato per coprire laposizione di responsabile delle relazioni con l’estero, ha ricevuto 20 curriculum vitae da cittadinisia italiani che stranieri. Alcune informazioni, ritenute particolarmente rilevanti dalla societa,sono sintetizzate nella seguente tabella:

Livello minimo

unita genere eta cittadinanza di reddito mensile Anni di esperienza

desiderato lavorativa

1 M 28 italiana 2.3 2

2 M 34 inglese 1.6 8

3 F 46 belga 1.2 21

4 M 26 spagnola 0.9 1

5 F 37 italiana 2.1 15

6 F 29 spagnola 1.6 3

7 M 51 francese 1.8 28

8 F 31 belga 1.4 5

9 F 39 italiana 1.2 13

10 M 43 italiana 2.8 20

11 F 58 italiana 3.4 32

12 F 44 inglese 2.7 23

13 F 25 francese 1.6 1

14 M 23 spagnola 1.2 0

15 F 52 italiana 1.1 29

16 F 42 tedesca 2.5 18

17 F 48 francese 2 19

18 F 33 italiana 1.7 7

19 M 38 tedesca 2.1 12

20 M 46 italiana 3.2 23

Tabella 1.1: Dati raccolti su 20 candidati a seguito di una ricerca di personale qualificato

4

Page 5: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.1. DISTRIBUZIONI DI FREQUENZA E RAPPRESENTAZIONI GRAFICHE 5

1. Definire quali sono le l’unita statistiche oggetto di rilevazione.

2. Identificare quali sono le variabili e le mutabili osservate.

3. Costruire, per tutte le variabili e mutabili, le corrispondenti distribuzioni di frequenza (per levariabili continue costruire distribuzioni di frequenza con quattro classi di modalita di ugualeampiezza).

4. E possibile calcolare le frequenze relative cumulate per tutte le variabili e mutabili oppure enecessario che si disponga solo di dati quantitativi?

2

Soluzione

1. Le unita statistiche della rilevazione sono gli individui rispondenti alla ricerca di personalequalificato effettuata dalla societa Gamma.

2. Le mutabili sono: genere e cittadinanza; le variabili sono: eta, livello minimo di redditomensile desiderato, anni di esperienza lavorativa.

3. Le distribuzioni di frequenza delle due mutabili sono:

Generexi ni

M 8F 12

Totale 20

Cittadinanzaxi ni

italiana 8inglese 2belga 2

spagnola 3francese 3tedesca 2

Totale 20

Per le restanti variabili eta, livello minimo di reddito mensile desiderato ed anni di esperienzalavorativa, sono costruite tre distribuzioni di frequenza con quattro classi di modalita. Inparticolare, dopo aver calcolato l’ampiezza della classe per le tre variabili:

h =max(x) − min(x)

4

si ottiene:

Eta (h = 8.75)classi ni

23| − |31.75 631.75 − |40.5 540.50 − |49.25 649.25 − |58 3

Totale 20

Livello min. reddito (h = 0.625)classi ni

0.9| − |1.525 61.525 − |2.15 82.15 − |2.775 32.775 − |3.4 3

Totale 20

Anni esperienza (h = 8)classi ni

0| − |8 88 − |16 316 − |24 624 − |32 3

Totale 20

Page 6: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

6 CAPITOLO 1. STATISTICA DESCRITTIVA

4. Le frequenze relative cumulate possono essere calcolate sia quando si hanno in esame levariabili che le mutabili in quanto hanno ad oggetto le sole frequenze.

Esercizio 2Utilizzando le distribuzioni di frequenza costruite nell’esercizio 1 per le variabili eta, livello minimodi reddito mensile desiderato e per la mutabile cittadinanza:

1. Calcolare le rispettive frequenze relative e frequenze relative cumulate.

2. Valutare se piu del 70% delle unita statistiche ha un’eta inferiore a 40 anni.

3. Valutare se almeno il 20% accetterebbe l’impiego qualora gli venisse offerto un reddito mensilepari a 1525Euro.

4. E possibile affermare che piu del 30% dei curriculum ricevuti proviene da candidati inglesi?

2

Soluzione

1. Le frequenze relative e relative cumulate delle tre distribuzioni sono:

Etaclassi ni fi Fi

23| − |31.75 6 0.3 0.331.75 − |40.5 5 0.25 0.5540.50 − |49.25 6 0.3 0.8549.25 − |58 3 0.15 1

Totale 20

Livello minimo di redditoclassi ni fi Fi

0.9| − |1.525 6 0.3 0.31.525 − |2.15 8 0.4 0.72.15 − |2.775 3 0.15 0.852.775 − |3.4 3 0.15 1

Totale 20

Cittadinanzaxi ni fi Fi

italiana 8 0.4 0.4inglese 2 0.1 0.5belga 2 0.1 0.6spagnola 3 0.15 0.75francese 3 0.15 0.9tedesca 2 0.1 1

Totale 20

2. Dalla distribzione di frequenza Eta, si osserva che in corrispondenza della classe 31.75−|40.5la frequenza relativa cumulata Fi = 0.55, ovvero il 55% delle unita statistiche ha un’eta≤ 40.5 anni. Quindi dalla verifica risulta che meno del 70% delle unita statistiche ha un’etainferiore a 40 anni e quindi l’affermazione e falsa.

Page 7: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.1. DISTRIBUZIONI DI FREQUENZA E RAPPRESENTAZIONI GRAFICHE 7

3. Dalla prima frequenza relativa cumulata della distribuzione Livello minimo di reddito siosserva che il 30% accetterebbe l’impiego con un reddito ≤ 1525Euro. Quindi e possibilesolo affermare che piu del 20% accoglierebbe la proposta di impiego se venisse offerto unreddito ≤ 1525Euro mentre non si e in grado di individuare la percentuale di coloro cheaccetterebbero l’impiego con un reddito minimo pari a 1525Euro.

4. L’affermazione e falsa in quanto, osservando le frequenze relative della distribuzione Cittadi-nanza, solo il 10% dei curriculum ricevuti proviene da candidati di cittadinanza inglese.

Esercizio 3Utilizzando i dati e le distribuzioni di frequenza dell’Esercizio 1:

1. Rappresentare graficamente i caratteri Cittadinanza e Livello minimo di reddito desideratoutilizzando rispettivamente un diagramma a nastri ed un istogramma di frequenze.

2. Rappresentare la funzione di ripartizione della variabile Livello minimo di reddito desiderato

2

Soluzione

1. Il diagramma a nastri della mutabile Cittadinanza e rappresentato nel seguente grafico:

italiana inglese belga spagnola francese tedesca

cittadinanza

0

2

4

6

8

n

Figura 1.1: Diagramma a nastri della mutabile Cittadinanza

mentre per rappresentare l’istogramma della variabile Livello minimo di reddito desiderato enecessario il preliminare calcolo dell’intensita associata a ciascuna classe:

hi =ni

(xi − xi−1)i = 1, . . . , k

con k il numero di classi, ed i cui valori sono riportati in tabella:

Page 8: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

8 CAPITOLO 1. STATISTICA DESCRITTIVA

Livello minimo di redditoclassi ni hi

0.9| − |1.525 6 9.61.525 − |2.15 8 12.82.15 − |2.775 3 4.82.775 − |3.4 3 4.8

La rappresentazione grafica dell’istogramma e quindi:

0.900 1.525 2.150 2.775 3.400

reddito

0

2

4

6

812.8

9.6

6.4

hi

3.2

Figura 1.2: Istogramma della variabile Livello minimo di reddito

2. La funzione di ripartizione richiede l’utilizzo delle informazioni contenute nella distribuzionedi frequenze Livello minimo di reddito di cui all’esercizio 2, da cui segue la rappresentazione:

0 1 2 3 4reddito

0.0

0.2

0.4

0.6

0.8

1.0

F i

Figura 1.3: Funzione di ripartizione empirica della variabile Livello minimo di reddito

Esercizio 4La societa Stat s.p.a. ha effettuato un’indagine su una popolazione di 15 famiglie sulle quali harilevato tre caratteri: la zona di residenza, il reddito medio mensile familiare ed il numero dicomponenti in eta lavorativa, i cui dati sono riportati nella Tabella 1.2.

Page 9: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.1. DISTRIBUZIONI DI FREQUENZA E RAPPRESENTAZIONI GRAFICHE 9

1. Costruire le distribuzioni di frequenza dei tre caratteri osservati (si costruisca la distribuzionedella variabile RM con quattro classi di modalita di uguale ampiezza).

2. Rappresentare graficamente le variabili RM ed NL.

Reddito medio N. componenti in etaUnita Residenza (×1000Euro) lavorativa

(Res) (RM) (NL)1 Nord 4.25 22 Centro 1.78 13 Nord 10.5 34 Sud 6.11 35 Sud 3.56 26 Centro 8.3 47 Sud 1.52 18 Nord 2.3 09 Centro 1.5 110 Nord 4.3 211 Sud 1.65 012 Sud 3.33 213 Centro 1.4 114 Sud 6.04 415 Nord 7.89 3

Tabella 1.2: Dati relativi alla zona di residenza, al reddito medio mensile familiare ed al numerodi componenti in eta lavorativa di 15 famiglie intervistate

2

Soluzione

1. Le tre distribuzioni richieste per le variabili in esame sono le seguenti:

Residenzaxi ni

Nord 5Centro 4Sud 6

Totale 15

Reddito medio (h = 2.275)classi ni

1.4| − |3.675 83.675 − |5.95 25.95 − |8.225 38.225 − |10.5 2

Totale 15

N. eta lavorativaxi ni

0 21 42 43 34 2

Totale 15

2. Le rappresentazioni grafiche opportune per i dati in esame sono il diagramma a nastri per lavariabile NL e l’istogramma per la variabile RM presentate in Figura 1.4.

Page 10: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

10 CAPITOLO 1. STATISTICA DESCRITTIVA

0 1 2 3 4

NL

0

1

2

3

4

n i

1.400 3.675 5.950 8.225 10.500

RM

0

2

4

6

83.52

2.64

0.88

hi

1.76

Figura 1.4: Diagramma a nastri della variabile NL ed istogramma della variabile RM

1.2 Indici statistici descrittivi

Esercizio 5Utilizzando le distribuzioni di frequenza costruite nell’esercizio 1:

1. Calcolare la media di tutte le variabili quantitative.

2. L’eta media delle unita statistiche e maggiore di 30?

3. La media degli Anni di esperienza lavorativa maturata dalle unita statistiche e almeno paria 10?

4. Calcolare il valore mediano del Livello minimo di reddito mensile desiderato.

5. Calcolare la mediana dell’Eta delle unita statistiche.

6. Calcolare la moda della variabile Anni di esperienza lavorativa

7. Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis-tribuzione di frequenze con 4 classi di modalita di differente ampiezza:

classi ni

0| − |9 89 − |17 317 − |23 623 − |32 3

definire la classe modale e calcolare la moda.

2

Page 11: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.2. INDICI STATISTICI DESCRITTIVI 11

Soluzione

1. Il calcolo delle medie delle distribuzioni di frequenza in classi richiede il preliminare calcolodel valore centrale di ciascuna classe come riportato nel seguito:

Etaclassi ni ci ci × ni

23| − |31.75 6 27.375 164.25031.75 − |40.5 5 36.125 180.62540.50 − |49.25 6 44.875 269.25049.25 − |58 3 53.625 160.875

Totale 20 775

µ = 1N

k∑

i=1

ci × ni = 38.75

Livello minimo di redditoclassi ni ci ci × ni

0.9| − |1.525 6 1.213 7.2781.525 − |2.15 8 1.838 14.7042.15 − |2.775 3 2.463 7.3892.775 − |3.4 3 3.088 9.264

Totale 20 38.635

µ = 1N

k∑

i=1

ci × ni = 1.932

Anni di esperienza lavorativaclassi ni ci ci × ni

0| − |8 8 4 328 − |16 3 12 3616 − |24 6 20 12024 − |32 3 28 84

Totale 20 272

µ = 1N

k∑

i=1

ci × ni = 13.6

2. La media dell’Eta delle unita statistiche e pari a 38.750, quindi risulta maggiore di 30.

3. Il numero di Anni di esperienza lavorativa e pari a 13.6 quindi supera gli almeno 10 annirichiesti dal quesito.

4. Il valore della mediana del Livello minimo di reddito e approssimato utilizzando la seguenteformula:

Me ≈ xi−1 + (xi − xi−1)0.5 − Fi−1

Fi − Fi−1

Quindi identificata la classe mediana, xi−1 − |xi : Fi ≥ 0.5, data da 1.525 − |2.15, il valoreapprossimato della mediana e:

Me ≈ 1.525 + (2.15 − 1.525)0.5 − 0.3

0.7 − 0.3= 1.837

5. Per il calcolo della mediana della variabile Eta valgono le stesse considerazioni fatte al puntoprecedente, quindi:

Me ≈ 31.75 + (40.5 − 31.75)0.5 − 0.3

0.55 − 0.3= 38.75

Page 12: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

12 CAPITOLO 1. STATISTICA DESCRITTIVA

6. La moda della variabile Anni di esperienza lavorativa e pari al valore centrale della classemodale 0| − |8, ovvero Mo = 4

7. Per individuare la classe modale in presenza di classi di diversa ampiezza, e necessario cal-colare l’intensita associata a ciascuna classe xi−1 − |xi, data da:

hi =ni

(xi − xi−1)i = 1, . . . , k

quindi

Anni di esperienza lavorativaclassi ni hi

0| − |9 8 0.899 − |17 3 0.3817 − |23 6 1.0023 − |32 3 0.33

Totale 20

da cui emerge che la classe modale e 17−|23 perche ad essa e associata la massima intensita,ed il valore approssimato della moda e:

Mo ≈ (xi−i + xi)

2=

17 + 23

2= 20

Esercizio 6Utilizzando i dati in Tabella 1.1 relativi alla variabile Livello minimo di reddito e la corrispondentedistribuzione di frequenze nell’esercizio 1:

1. Calcolare i quartili della variabile in esame.

2. Rappresentarne il box-plot.

3. Sono presenti valori eccezionali nei dati?

4. Assumendo che la societa Gamma s.p.a. in occasione di un’altra ricerca di personale qualifi-cato abbia rilevato i seguenti livelli minimi di reddito desiderati da ulteriori 20 candidati:

V2 : 4.4 5.2 2.9 2.9 2.9 4.1 1.5 2.9 2.9 0.74.8 1.5 2.9 1.5 3.4 5.9 0.7 5.9 8.7 2.9

Rappresentare i box-plot paralleli della variabile Livello minimo di reddito desiderato inTabella 1.1 (V 1) e della nuova variabile riportata (V 2).

2

Page 13: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.2. INDICI STATISTICI DESCRITTIVI 13

Soluzione

1. Il calcolo dei quartili in presenza di una distribuzione di frequenze per classi di modalitarichiede nuovamente l’impiego di formule di approssimazione:

Q1 ≈ xi−1 + (xi − xi−1)0.25 − Fi−1

Fi − Fi−1Q3 ≈ xi−1 + (xi − xi−1)

0.75 − Fi−1

Fi − Fi−1

Segue quindi che i quartili richiesti assumono i seguenti valori:

Q1 = 1.421 Q2 ≡ Me = 1.837 Q3 = 2.358

2. La rappresentazione grafica, mediante box-plot, della variabile Livello minimo di redditodesiderato richiede l’impiego dei quartili appena calcolati e di ulteriori informazioni riportatenel seguito:

min(x) = 0.9 max(x) = 3.4

h1 = Q1 − 1.5(Q3 − Q1) = 0.015 H2 = Q3 + 1.5(Q3 − Q1) = 3.763

da cui segue il grafico in Figura 1.5.

Figura 1.5: Box plot del Reddito Desiderato

3. Dal grafico in Figura 1.5 emerge che non sono presenti valori eccezionali nella serie osservata,infatti h1 < min(x) ed H2 > max(x).

4. La rappresentazione mediante box-plot paralleli delle due variabili richiede il preliminarecalcolo dei quartili e dei valori cardine della variabile V 2, nonche la conoscenza del minimo

Page 14: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

14 CAPITOLO 1. STATISTICA DESCRITTIVA

e del massimo valore assunto da V 2 come gia fatto in precedenza per V 1. Tali valori sonopari a:

min(x) = 0.7 Q1 = 2.21 Q2 = Me = 2.9 Q3 = 4.6 max(x) = 8.7 h1 = −1.38 H2 = 8.19

mentre la rappresentazione grafica richiesta e presentata in Figura 1.6.

Emerge immediatamente che V 2 presenta un valore eccezionale, contrassegnato con un as-terisco, in corrispondenza del livello di reddito desiderato 8.7.

Figura 1.6: Box plot paralleli di V1 e V2

Esercizio 7Utilizzando i dati in tabella 1.1:

1. Calcolare la varianza della variabile Livello minimo di reddito desiderato avvalendosi delladistribuzione di frequenze precedentemente costruita per tale variabile nell’esercizio 1.

2. Calcolare la varianza della serie di dati Anni di esperienza lavorativa

3. Utilizzando la serie di dati della variabile Eta, calcolare la varianza dell’eta delle prime10 unita statistiche. In seguito, calcolare la varianza delle successive 10 ed ultime unitastatistiche.

4. La variabilita dell’eta delle prime 10 unita statistiche e maggiore della variabilita dell’etadelle ultime 10 unita?

5. Se si standardizza la variabile Livello minimo di reddito desiderato, quale valore assumonola media e la varianza?

6. E possibile affermare che la mutabile cittadinanza ha un’elevata eterogeneita?

2

Page 15: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.2. INDICI STATISTICI DESCRITTIVI 15

Soluzione

1. Il calcolo della varianza della variabile Livello minimo di reddito e effettuato ricorrendo allaseguente formula:

σ2 =1

N

k∑

i=1

(ci − µ)2ni = µ2 − µ2 con µ2 =1

N

k∑

i=1

c2i ni

A tale scopo e costruita la tabella che segue:

Livello minimo di redditoclassi ni ci c2

i × ni

0.9| − |1.525 6 1.213 8.8281.525 − |2.15 8 1.838 27.0262.15 − |2.775 3 2.463 18.1992.775 − |3.4 3 3.088 28.607

Totale 20 82.660

da cui emerge che µ2 = 4.133 mentre la varianza e pari a σ2 = 4.133 − (1.932)2 = 0.4.

2. La varianza della serie di dati Anni di esperienza lavorativa e calcolata con:

σ2 =1

N

N∑

i=1

(xi − µ)2 = 100.2

3. Utilizzando la serie di dati Eta, segue che la varianza della prima sottoserie data da:

28 34 46 26 37 29 51 31 39 43

e pari a σ21 = 62.44 mentre la seconda sottoserie:

58 44 25 23 52 42 48 33 38 46

ha varianza σ22 = 114.69

4. L’affermazione e falsa in quanto la variabilita della seconda sottoserie e maggiore della va-riabilita della prima sottoserie risultando σ2

2 > σ21 .

5. La media della variabile Livello minimo di reddito desiderato standardizzata e pari a 0 mentrela varianza e 1.

6. L’eterogeneita della mutabile cittadinanza e possibile misurarla con l’indice di mutabilita delGini o con l’indice di entropia di Shannon, rispettivamente pari a:

MGr =k

k − 1

[

1 −k∑

i=1

f2i

]

Hr =k∑

i=1

filog(fi)

log(k)

Page 16: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

16 CAPITOLO 1. STATISTICA DESCRITTIVA

con k il numero di modalita per il cui calcolo si utilizzano le informazioni nella seguentetabella:

Cittadinanzaxi ni fi f2

i log(fi) fi log(fi)italiana 8 0.4 0.16 -0.40 -0.16inglese 2 0.1 0.01 -1.00 -0.10belga 2 0.1 0.01 -1.00 -0.10

spagnola 3 0.15 0.02 -0.82 -0.12francese 3 0.15 0.02 -0.82 -0.12tedesca 2 0.1 0.01 -1.00 -0.10

Totale 20 0.23 -0.70

da cui segue che l’indice di mutabilita del Gini e: MGr = 65 (1 − 0.23) = 0.924

mentre l’indice di entropia di Shannon e: Hr = 0.70log(6) = 0.90

Dai risultati precedenti e possibile affermare che il fenomeno presenta elevata eterogeneita.

Esercizio 8Utilizzando i dati in Tabella 1.1:

1. Misurare l’asimmetria della variabile Livello minimo di reddito desiderato avvalendosi dellacorrispondente distribuzione di frequenze.

2. Osservando i box plots in Figura 1.5: le due variabili V 1 e V 2 presentano uguale asimmetriae variabilita?

3. La distribuzione della variabile Livello minimo di reddito desiderato puo dirsi leptocurtica?

2

Soluzione

1. L’asimmetria della distribuzione della variabile Livello minimo di reddito desiderato e possi-bile misurarla con indici robusti e non robusti. Qualora si preferiscano questi ultimi ci si puoavvalere dell’indice di asimmetria di Fisher:

γ1 =1

Nσ3

k∑

i=1

(xi − µ)3ni

mentre un esempio di indice robusto e la differenza interquartile:

DIr =(Q3 − Q2) − (Q2 − Q1)

(Q3 − Q2) + (Q2 − Q1)

Page 17: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.2. INDICI STATISTICI DESCRITTIVI 17

Il calcolo di γ1 richiede l’utilizzo dei dati nella tabella che segue:

Livello minimo di redditoclassi ni ci (ci − µ)3 × ni

0.9| − |1.525 6 1.213 -2.231.525 − |2.15 8 1.838 -0.0072.15 − |2.775 3 2.463 0.4492.775 − |3.4 3 3.088 4.634

Totale 20 2.846

ed inoltre risultando, dall’esercizio n. 7, che√

σ2 =√

0.4 = 0.632, segue che: γ1 =2.846

20×0.6323 = 0.564.

Il calcolo della differenza interquartile richiede l’utilizzo dei quartili calcolati in precedenza e

quindi DIr = (2.358−1.837)−(1.837−1.421)(2.358−1.837)+(1.837−1.421) = 0.112.

2. L’esame dei box-plots evidenzia come la variabile V 2 presenta maggiore variabilita, misuratain termini di differenza tra quartili, rispetto alla V 1 mentre entrambe mostrano asimmetriapositiva come e immediatamente valutato dall’ osservazione della posizione della mediana neibox rappresentati.

3. Per poter rispondere al quesito e necessario calcolare l’indice di curtosi:

γ2 =1

Nσ4

k∑

i=1

(xi − µ)4ni − 3

dove, da calcoli precedenti, µ = 1.931 e σ = 0.634.

Per rendere piu agevole il calcolo di γ2, puo essere utile avvalersi dei dati nella seguentetabella:

Livello minimo di redditoclassi ni ci (ci − µ)4 × ni

0.9| − |1.525 6 1.213 1.6031.525 − |2.15 8 1.838 0.0012.15 − |2.775 3 2.463 0.2392.775 − |3.4 3 3.088 5.357

Totale 20 7.2

da cui segue che: γ2 = 7.220×0.6344 − 3 = −0.744

Dai risultati ottenuti e possibile affermare che la distribuzione della variabile Livello minimodi reddito non e leptocurtica ma bensı platicurtica in quanto l’indice di curtosi γ2 e pari a-0.744. Quindi l’affermazione e falsa.

Page 18: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

18 CAPITOLO 1. STATISTICA DESCRITTIVA

Esercizio 9La societa Stat di cui all’esercizio 4 desidera fornire al committente dell’indagine maggiori dettaglidescrittivi sui dati presentati in Tabella 1.2, a tale scopo:

1. Calcolare la media e la varianza delle variabili RM ed NL utilizzando le distribuzioni difrequenza precedentemente costruite.

2. Rappresentare il box plot della variabile RM e commentarlo opportunamente

3. Assumendo che per particolari incentivi governativi il reddito mensile medio familiare subiscela seguente trasformazione lineare:

RMN = 0.3 + 1.15 × RM

calcolare la media e la varianza di RMN .

4. Misurare l’asimmetria e la curtosi della variabile RM utilizzando indici non robusti.

5. Misurare l’eterogeneita della variabile Res.

2

Soluzione

1. Il calcolo della media e della varianza delle due variabili e effettuato utilizzando i dati intabella:

Reddito medio - RMclassi ni ci ci × ni c2

i × ni

1.4| − |3.675 8 2.538 20.304 51.5283.675 − |5.95 2 4.813 9.626 46.3305.95 − |8.225 3 7.088 21.264 150.7208.225 − |10.5 2 9.363 18.726 175.332

Totale 15 69.920 423.910

N. eta lavorativa - NLxi ni xi × ni x2

i × ni

0 2 0 01 4 4 42 4 8 163 3 9 274 2 8 32

Totale 15 29 79

Da cui segue che le medie sono pari a:

µRM =1

N

k∑

i=1

ci × ni = 4.66 µNL =1

N

N∑

i=1

xi × ni = 1.93

mentre le varianze sono:

σ2RM = µ2RM

−µ2RM = 28.261−4.6612 = 6.536 σ2

NL = µ2NL−µ2

NL = 5.267−1.9333 = 1.536

2. Il grafico richiesto e riportato in Figura 1.7 da cui emerge l’assenza di valori eccezionalinella variabile di interesse. Inoltre, tenuto conto della posizione delle mediana nel box, echiaramente visibile la presenza di asimmetria positiva nei dati.

Page 19: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.2. INDICI STATISTICI DESCRITTIVI 19

Figura 1.7: Box plot della variabile RM

3. Per la soluzione del presente quesito e necessario utilizzare alcune note regole sulle trasformatelineari di variabili. In particolare si dimostra che data la trasformata lineare y = a + bx conmedia e varianza di x note e rispettivamente indicate con µx e σ2

x, la media e la varianza diy sono calcolare con:

µy = a + bµx σ2y = b2σ2

x

Quindi nel caso in esame, poiche e noto che µRM = 4.661 e σ2RM = 6.536, allora:

µRMN= 0.3 + 1.15 × µRM = 5.660 σ2

RMN= 1.152 × σ2

RM = 8.644

4. Per la misura dell’asimmetria e della curtosi della variabile RM mediante indici non robustiγ1 e γ2, si utilizzano i dati della corrispondente distribuzione di frequenze alla quale si ag-giungono alcune colonne:

Reddito medio - RMclassi ni ci ci × ni (ci − µ)3 × ni (ci − µ)4 × ni

1.4| − |3.675 8 2.538 20.304 -76.549 162.5143.675 − |5.95 2 4.813 9.626 0.007 0.0015.95 − |8.225 3 7.088 21.264 42.887 104.0888.225 − |10.5 2 9.363 18.726 207.911 977.598

Totale 15 69.913 174.256 1244.201

Dalle elaborazioni precedenti risulta inoltre che la media e lo scarto quadratico medio dellavariabile RM sono rispettivamente µRM = 4.661 e σRM = 2.557, quindi:

γ1 =174.256

15 × 2.5573= 0.695 γ2 =

1244.201

15 × 2.5574− 3 = −1.06

Page 20: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

20 CAPITOLO 1. STATISTICA DESCRITTIVA

5. La misura dell’eterogenieta e effettuata in questo caso con l’indice di mutabilita del Gini

MGr =k

k − 1

(

1 −k∑

i=1

f2i

)

per il cui calcolo si utilizzano i dati nella seguente tabella:

Residenzaxi ni fi f2

i

Nord 5 0.33 0.11Centro 4 0.27 0.07Sud 6 0.40 0.16

Totale 15 0.34

Quindi l’indice relativo MGr = 0.987 ed evidenzia la presenza di elevata eterogenieta nellamutabile osservata.

1.3 Concentrazione

Esercizio 10Utilizzando i dati della variabile Livello minimo di reddito nell’esercizio 1 e la corrispondentedistribuzione di frequenze:

1. Misurarne la concentrazione e rappresentare la corrispondente curva di Lorenz.

2. E possibile affermare che il Livello minimo di reddito e equidistribuito?

2

Soluzione

1. La misura della concentrazione del livello minimo di reddito tramite la distribuzione per classidi modalita precedentemente costruita richiede il calcolo del rapporto di concentrazione:

R = 1 −k∑

i=1

(pi − pi−1)(qi + qi−1)

con pi = 1N

i∑

j=1

nj e qi = 1Nµ

i∑

j=1

cjnj per i = 1, 2, . . . , k.

Ricordando che la media del livello minimo di reddito e pari a µ = 1.932 (esercizio 5), segue

che il denominatore delle qi e N · µ =k∑

i=1

ci · ni = 38.635.

Page 21: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.3. CONCENTRAZIONE 21

Utilizzando le formule precedenti, si passa al calcolo delle pi e delle qi, come riportato intabella, e dei termini della sommatoria del rapporto di concentrazione.

Livello minimo di redditoclassi ni ci ci · ni pi qi pi − pi−1 = fi qi + qi−1 (qi + qi−1)fi

0.9| − |1.525 6 1.213 7.278 0.300 0.188 0.30 0.188 0.0561.525 − |2.15 8 1.838 14.704 0.700 0.569 0.40 0.757 0.3032.15 − |2.775 3 2.463 7.389 0.850 0.760 0.15 1.329 0.1992.775 − |3.4 3 3.088 9.264 1 1 0.15 1.760 0.264

Totale 20 38.635 0.822

Segue quindi che R = 1 − 0.822 = 0.178, ovvero il fenomeno presenta bassa concentrazione.

Impiegando i dati in tabella e possibile rappresentare la curva di Lorenz (Figura 1.8) che daevidenza grafica dei risultati numerici riportati.

Figura 1.8: Curva di Lorenz

2. I dati osservati immediatamente escludono la possibilita che il livello minimo di reddito siaequidistribuito in quanto la condizione teorica che deve verificarsi in questa circostanza e che:

x1 = x2 = ... = xN = µ

Quindi l’affermazione e falsa.

Esercizio 11E stata misurata la quantita di nitrati (in mg) contenuta in un litro di 10 tipologie di acque com-mercializzate da un punto vendita, ottenendo i seguenti dati:

15 29 11 18 21 17 34 19 28 41

Page 22: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

22 CAPITOLO 1. STATISTICA DESCRITTIVA

1. Misurare la concentrazione dei nitrati delle acque analizzate e rappresentare la spezzata diLorenz.

2. Puo affermarsi che la concentrazione dei nitrati delle acque analizzate e elevata?

2

Soluzione

1. La misura della concentrazione della serie di dati in esame richiede il preliminare ordinamento,in modo non decrescente, dei dati ed il calcolo dell’indice di concentrazione del Gini:

Rg =

N−1∑

i=1

(pi − qi)

N−1∑

i=1

pi

con pi =i

Ne qi =

1

i∑

j=1

xj

A tale scopo si costruisce la seguente tabella:

i x(i) pi qi (pi − qi)1 11 0.1 0.047 0.0532 15 0.2 0.111 0.0893 17 0.3 0.184 0.1164 18 0.4 0.261 0.1395 19 0.5 0.343 0.1576 21 0.6 0.433 0.1677 28 0.7 0.553 0.1478 29 0.8 0.677 0.1239 34 0.9 0.823 0.07710 41 1 1

Totale 233

da cui emerge che Nµ =N∑

i=1

xi = 233 mentre l’indice di concentrazione del Gini e Rg =

1.0684.5 = 0.237.

La spezzata di Lorenz del fenomeno in esame, che assume la caratteristica forma a gradini,e rappresentata in Figura 1.9.

2. Dai risultati del precedente quesito (indice del Gini) e possibile osservare che i nitrati delleacque analizzate sono poco concentrati quindi nessuna delle acque in esame presenta unlivello di nitrati molto piu elevato rispetto alle altre.

Esercizio 12La societa Stat, utilizzando i dati in Tabella 1.2, vuole fornire alcuni dettagli sulla concentrazionedei redditi delle 15 famiglie intervistate.

Page 23: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.3. CONCENTRAZIONE 23

Figura 1.9: Spezzata di Lorenz

1. Misurare la concentrazione dei redditi medi (RM) e rappresentare la corrispondente curvadi Lorenz (a tale scopo impiegare la distribuzione di frequenze per classi della variabile RMcostruita in precedenza);

2. Il reddito medio presenta maggiore concentrazione al Nord o al Sud?

2

Soluzione

1. La misura della concentrazione della variabile RM richiede il calcolo del rapporto di concen-trazione. A tal fine, come gia precedentemente descritto nell’esercizio 10, si utilizzano i datinella tabella seguente:

Reddito medio - RMclassi ni ci ci × ni pi qi pi − pi−1 = fi qi − qi−1 (qi − qi−1)fi

1.4| − |3.675 8 2.538 20.304 0.533 0.290 0.533 0.290 0.1553.675 − |5.95 2 4.813 9.626 0.666 0.428 0.133 0.718 0.0955.95 − |8.225 3 7.088 21.264 0.866 6 0.732 0.200 1.160 0.2328.225 − |10.5 2 9.363 18.726 1 1 0.133 1.732 0.230

Totale 15 69.920 0.712

da cui segue che il rapporto di concentrazione R = 1 − 0.712 = 0.288.

La curva di Lorenz associata al fenomeno e rappresentata in Figura 1.10 e conferma, anchegraficamente, la contenuta concentrazione del reddito medio tra le famiglie intervistate.

Page 24: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

24 CAPITOLO 1. STATISTICA DESCRITTIVA

Figura 1.10: Curva di Lorenz

2. Per poter rispondere al quesito proposto e necessario misurare la concentrazione del redditomedio delle famiglie residenti al Nord ed al Sud costruendo quindi opportune serie di datiestratte dalla Tabella 1.2 mediante le quali calcolare l’indice di concentrazione del Gini.

NORDi x(i) pi qi pi − qi

1 2.30 0.2 0.079 0.1212 4.25 0.4 0.224 0.1763 4.30 0.6 0.371 0.2294 7.89 0.8 0.641 0.1595 10.50 1 1

Totale 29.24 0.685

SUDi x(i) pi qi pi − qi

1 1.52 0.167 0.068 0.0992 1.65 0.333 0.142 0.1913 3.33 0.500 0.292 0.2084 3.56 0.667 0.452 0.2155 6.04 0.833 0.724 0.1096 6.11 1 0.999

Totale 22.21 0.822

da cui segue che l’indice di concentrazione del Gini delle due sottopopolazioni e rispettiva-mente:

Rg,NORD =0.685

2.0= 0.343 Rg,SUD =

0.822

2.5= 0.329

quindi la concentrazione dei redditi delle famiglie del Nord e del Sud intervistate e simile.

Page 25: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.4. DISTRIBUZIONI DOPPIE 25

1.4 Distribuzioni Doppie

Esercizio 13Utilizzando le serie di dati in Tabella 1.1:

1. Costruire una distribuzione di frequenze doppia per le variabili Genere e Cittadinanza.

2. La presenza di mutabili nella tabella precedentemente costruita, rende impossibile la misuradell’intensita del legame associativo? Motivare la risposta.

3. Costruire una distribuzione di frequenze doppia per le variabili Livello minimo di redditoed Anni di esperienza utilizzando, per ambo le variabili, 4 classi di modalita della stessaampiezza.

2

Soluzione

1. La distribuzione di frequenze richiesta e la seguente:

CittadinanzaGenere belga francese inglese italiana spagnola tedesca

F 2 2 1 5 1 1 12M 0 1 1 3 2 1 8

2 3 2 8 3 2 20

2. L’intensita del legame associativo e misurato con l’indice di Cramer Φ2. Esso per costruzionerichiede il solo utilizzo delle frequenze della distribuzione e quindi e possibile calcolarlo siaquando nella distribuzione doppia si hanno ad oggetto mutabili che variabili.

3. La distribuzione di frequenze doppia delle variabili Livello minimo di reddito ed Anni diesperienza e:

Anni di esperienzaReddito minimo 0| − |8 8 − |16 16 − |24 24 − |32

0.9| − |1.525 3 1 1 1 61.525 − |2.15 4 2 1 1 82.15 − |2.775 1 0 2 0 32.775 − |3.4 0 0 2 1 3

8 3 6 3 20

Esercizio 14Avvalendosi della distribuzione doppia delle variabili Livello minimo di reddito ed Anni di espe-rienza costruita nel precedente esercizio:

Page 26: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

26 CAPITOLO 1. STATISTICA DESCRITTIVA

1. E possibile affermare che tra le variabili Livello minimo di reddito ed Anni di esperienzaesiste un legame lineare negativo? Perche?

2. Misurare l’intensita del legame associativo tra le variabili Livello minimo di reddito ed Annidi esperienza.

3. Misurare la forza del legame lineare tra le variabili Livello minimo di reddito ed Anni diesperienza.

2

Soluzione

1. E possibile valutare la presenza di un legame lineare negativo calcolando la covarianza tra levariabili Livello minimo di reddito ed Anni di esperienza. A tale scopo, essendo gia note lemedie delle variabili marginali della distribuzione doppia precedentemente costruita, e utileavvalersi della seguente forma per la covarianza:

σxy = µxy − µxµy

dove µx e µy sono le medie delle variabili marginali e µxy = 1N

h∑

i=1

k∑

j=1

xiyjnij .

Per il calcolo di µxy risulta inoltre necessario calcolare i valori centrali delle classi di modalitadelle due variabili che sono quindi aggiunti alla precedente tabella:

Anni di esperienza0| − |8 8 − |16 16 − |24 24 − |32

Reddito minimo ci 4 12 20 28

0.9| − |1.525 1.213 3 1 1 1 61.525 − |2.15 1.838 4 2 1 1 82.15 − |2.775 2.463 1 0 2 0 32.775 − |3.4 3.088 0 0 2 1 3

8 3 6 3 20

da cui segue che:

µxy =1

20(14.556 + 14.556 + 24.260 + 33.964 + 29.408 + 44.112 + 36.760 + 51.464 + 9.852 + 98.520+

+123.520 + 86.464) = 28.372

dove ad esempio il primo termine della sommatoria e c1x × c1y ×n11 = 1.213×4×3 = 14.556ed alla stessa maniera si calcolano i restanti termini.

Il valore della covarianza e quindi pari a:

σxy = 28.372 − 1.932 × 13.6 = 2.097

La covarianza cosı calcolata e positiva, quindi le variabili Livello minimo di reddito ed Annidi esperienza presentano un legame lineare positivo. Quindi si conclude che l’affermazionedel quesito in esame e falsa perche la covarianza assume valore positivo.

Page 27: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.4. DISTRIBUZIONI DOPPIE 27

2. La misura dell’intensita del legame associativo richiede il calcolo dell’indice di Cramer Φ2. Atale scopo si calcola prima l’indice di Pizzetti-Pearson:

χ2 =h∑

i=i

k∑

j=1

(nij − n∗ij)

2

n∗ij

e successivamente:

Φ2 =χ2

N [min(h, k) − 1]

L’indice di Pizzetti-Pearson richiede il preliminare calcolo delle frequenze teoriche n∗ij =

ni.×n.j

N con i = 1, . . . , h e j = 1, . . . , k per le quali e utile costrure la seguente tabella:

Anni di esperienzaReddito minimo 0| − |8 8 − |16 16 − |24 24 − |32

0.9| − |1.525 2.40 0.90 1.80 0.90 61.525 − |2.15 3.20 1.20 2.40 1.20 82.15 − |2.775 1.20 0.45 0.90 0.45 32.775 − |3.4 1.20 0.45 0.90 0.45 3

8 3 6 3 20

da cui segue che i termini della sommatoria dell’indice χ2 sono:

χ2 = 0.150 + 0.011 + 0.356 + 0.011 + 0.200 + 0.533 + 0.817 + 0.033 + 0.033 + 0.450 + 1.344 + 0.450 +

+1.200 + 0.450 + 1.344 + 0.672 = 8.054

dove ad esempio il primo termine e(n11−n∗

11)2

n∗11

= (3−2.40)2

2.40 = 0.150 e cosı via i restanti.

L’indice di Cramer e infine pari a Φ2 = 8.05420×3 = 0.134 da cui emerge che le due variabili

presentano un debole legame associativo.

3. La misura della forza del legame lineare e fornita dall’indice di correlazione per la cuicostruzione e richiesto l’utilizzo di alcuni indici gia calcolati in precedenza, dati dalla co-varianza tra le due variabili e dai rispettivi scarti quadratici medi.

Dal primo quesito del presente esercizio risulta che la covarianza tra le variabili Livello minimodi reddito ed Anni di esperienza e σxy = 2.097, mentre dall’esercizio 7 la varianza del Livellominimo di reddito e σ2

x = 0.4 e quindi σx = 0.632. Resta quindi da calcolare la varianza dellavariabile Anni di esperienza per la quale si utilizza la distribuzione di frequenze costruita pertale variabile nell’esercizio 1 alla quale sono aggiunte alcune colonne necessare per il calcolodei momenti della variabile:

Page 28: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

28 CAPITOLO 1. STATISTICA DESCRITTIVA

Anni di esperienzaclassi ni ci ci × ni c2

i × ni

0| − |8 8 4 32 1288 − |16 3 12 36 43216 − |24 6 20 120 240024 − |32 3 28 84 2352

Totale 20 272 5312

Dai dati in tabella si deriva che:

µy =272

20= 13.6 µ2y =

5312

20= 265.6 σ2

y = 256.6−13.62 = 80.64 e quindi σy = 8.98

Utilizzando gli indici statistici opportunamente calcolati, l’indice di correlazione e:

ρxy =2.097

0.632 × 8.98= 0.369

quindi le due variabili presentano un legame lineare positivo piuttosto debole.

Esercizio 15Utilizzando i dati in Tabella 1.2:

1. Costruire la distribuzione di frequenze doppia per le variabili RM ed Res (utilizzando per lavariabile RM quattro classi di modalita di uguale ampiezza).

2. Misurare l’intensita del legame associativo tra le variabili RM e Res.

2

Soluzione

1. La distribuzione di frequenze doppia delle variabili RM e Res e:

ResRM Nord Centro Sud

1.4| − |3.675 1 3 4 83.675 − |5.95 2 0 0 25.95 − |8.225 1 0 2 38.225 − |10.5 1 1 0 2

5 4 6 15

Page 29: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.4. DISTRIBUZIONI DOPPIE 29

2. Come visto nell’esercizio precedente la misura del legame associativo richiede il preliminarecalcolo dell’indice di Pizzetti-Pearson χ2 e la sua successiva normalizzazione data dall’indiceΦ2. A tale scopo si costruisce la seguente tabella delle frequenze teoriche:

ResRM Nord Centro Sud

1.4| − |3.675 2.667 2.133 3.200 83.675 − |5.95 0.667 0.533 0.800 25.95 − |8.225 0.667 0.533 0.800 38.225 − |10.5 1 1 0 2

5 4 6 15

da cui segue che l’indice χ2 e:

χ2 =h∑

i=i

k∑

j=1

(nij − n∗ij)

2

n∗ij

=

= 1.042 + 0.352 + 0.2 + 2.6640.533 + 0.8 + 0.8 + 0.533 + 0.166 + 0.409 + 0.8 = 8.30

e quindi: Φ2 = χ2

N [min(h,k)−1] = 8.3015×2 = 0.277, ovvero le le due variabili hanno un debole

legame associativo.

Esercizio 16Utilizzando nuovamente i dati in Tabella 1.2:

1. Costruire per le variabili RM e NL una distribuzione di frequenze doppia (utilizzando per lavariabile RM quattro classi di modalita della stessa ampiezza e per la variabile NL due classidi modalita di pari ampiezza).

2. Misurare la forza del legame lineare tra RM ed NL impiegando la distribuzione di frequenzedoppia costruita nel precedente quesito.

3. Misurare la covarianza tra la variabile NL ed RMN precedentemente definita con la trasfro-mata lineare:

RMN = 0.3 + 1.15 × RM

4. Quale valore assume la correlazione tra RMN ed NL?

5. Calcolare la covarianza tra le variabili RM ed NL impiegando le due corrispondenti serie didati.

2

Page 30: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

30 CAPITOLO 1. STATISTICA DESCRITTIVA

Soluzione

1. La distribuzione di frequenze doppia delle variabili RM ed NL e:

RM 0| − |2 2 − |41.4| − |3.675 8 0 83.675 − |5.95 2 0 25.95 − |8.225 0 3 38.225 − |10.5 0 2 2

10 5 15

2. Per misurare della forza del legame lineare e possibile avvalersi di alcune informazioni giadisponibili in precedenti quesiti. Infatti ricordando che:

ρRM,NL =σRM,NL

σRMσNL

dove σRM,NL = µRM,NL − µRMµNL , dai risultati nell’esercizio 9 segue che:

µRM = 4.66 σRM = 2.557

La media e la varianza della variabile marginale NL sono calcolate agevolmente utilizzandola tabella che segue:

NLclassi ci ni ci × ni c2

i × ni

0| − |2 1 10 10 102 − |4 3 5 15 45

Totale 15 25 55

e quindi µNL = 1.667, µ2NL = 3.667, σ2

NL = 0.888 e σNL = 0.942.

Resta ora da calcolare il momento misto µRM,NL = 115

4∑

i=1

2∑

j=1

xiyinij per il quale sono ne-

cessari i valori centrali delle classi delle due variabili, ci, riportati in tabella:

0| − |2 2 − |4RM ci 1 3

1.4| − |3.675 2.538 8 0 83.675 − |5.95 4.813 2 0 25.95 − |8.225 7.088 0 3 38.225 − |10.5 9.363 0 2 2

10 5 15

Page 31: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.4. DISTRIBUZIONI DOPPIE 31

Segue quindi che:

µRM,NL =1

15(20.304 + 9.626 + 63.792 + 56.178) = 9.993

mentre la covarianza e: σRM,NL = 2.225.

Dai risultati precedenti il valore della correlazione e:

ρRM,NL =9.993

2.557 × 0.942= 0.923

che evidenzia la presenza di forte legame lineare positivo tra le due variabili.

3. L’impiego di alcune note regole sulle trasformate lineari agevola il calcolo della covarianzatra le variabili NL ed RMN . In particolare ricordando che date due trasformate lineari, U eV :

V = a + bX U = c + dY

la loro covarianza e:

σU,V = bd · σX,Y

l’utilizzo di quest’ultima regola rende immediato il calcolo della covarianza richiesta.

Infatti:

σRMN ,NL = 1.15 · σRM,NL = 2.556

4. La correlazione tra le variabili RMN ed NL e invariata rispetto alla correlazione tra RM edNL in quanto, utilizzando ancora una volta alcune regole sulle trasformate lineari:

ρRMN ,NL =1.15

|1.15|ρRM,NL = 0.923

5. E noto che il calcolo degli indici statistici mediante l’utilizzo delle distribuzioni di frequenzaper classi rende il risultato conseguito approssimato rispetto a quello ottenuto dall’impiegodelle serie di dati. Per tale motivo si ripetono i calcoli della misura della correlazione tra levariabili RM ed NL avvalendosi delle corrispondenti serie di dati in Tabella 1.2.

In particolare i momenti delle due variabili sono calcolati utilizzando i dati nella tabella chesegue da cui si deriva che:

µRM = 4.295 µNL = 1.933 µRM,NL = 11.196 σRM,NL = 2.894

Page 32: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

32 CAPITOLO 1. STATISTICA DESCRITTIVA

i RM NL RM × NL1 4.25 2 8.502 1.78 1 1.783 10.5 3 31.504 6.11 3 18.335 3.56 2 7.126 8.3 4 33.207 1.52 1 1.528 2.3 0 0.009 1.5 1 1.5010 4.3 2 8.6011 1.65 0 0.0012 3.33 2 6.6613 1.4 1 1.4014 6.04 4 24.1615 7.89 3 23.67

Totale 64.43 29 167.94

Esercizio 17Si consideri la seguente distribuzione di frequenze doppia nella quale sono presi in esame il numerodi clienti di 100 aziende (NC) e l’ammontare delle spese di rappresentanza (SR):

NCSR 10 − |20 20 − |30 30 − |40 40 − |50 50 − |60 60 − |70

1 − |3.5 10 8 3 6 12 23.5 − |6 0 4 2 4 1 06 − |8.5 1 5 3 7 11 38.5 − |11 3 0 2 4 0 9

1. Calcolare le medie delle sei distribuzioni condizionate SR|NC.

2. E possibile affermare che le distribuzioni condizionate derivate al punto precedente sono in-dipendenti in media?

3. Misurare la connessione tra le due variabili SR ed NC.

4. Dai risultati precedenti, e possibile affermare che NC ha una forte influenza su SR?

2

Soluzione

1. Il calcolo delle medie condizionate richiede l’utilizzo delle informazioni nella tabella propostache sono integrate con le frequenze marginali ed i valori centrali delle classi di modalita delledue variabili:

Page 33: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.4. DISTRIBUZIONI DOPPIE 33

NCSR 10 − |20 20 − |30 30 − |40 40 − |50 50 − |60 60 − |70

ci 15 25 35 45 55 65

1 − |3.5 2.250 10 8 3 6 12 2 413.5 − |6 4.750 0 4 2 4 1 0 116 − |8.5 7.250 1 5 3 7 11 3 308.5 − |11 9.750 3 0 2 4 0 9 18

14 17 10 21 24 14 100

2. Le medie delle sei distribuzioni condizionate SR|NC sono quindi cosı calcolate:

SR|NC = 15 ni ci × ni

2.250 10 22.504.750 0 0.007.250 1 7.259.750 3 29.25

Totale 14 59µSR|NC=15 = 4.214

SR|NC = 25 ni ci × ni

2.250 8 184.750 4 197.250 5 36.259.750 0 0

Totale 17 73.25µSR|NC=25 = 4.309

SR|NC = 35 ni ci × ni

2.250 3 6.754.750 2 9.507.250 3 21.759.750 2 19.50

Totale 10 57.5µSR|NC=35 = 5.75

SR|NC = 45 ni ci × ni

2.250 6 13.504.750 4 19.007.250 7 50.759.750 4 39.00

Totale 21 122.25µSR|NC=45 = 5.821

SR|NC = 55 ni ci × ni

2.250 12 27.004.750 1 4.757.250 11 79.759.750 0 0.00

Totale 24 111.5µSR|NC=55 = 4.646

SR|NC = 65 ni ci × ni

2.250 2 4.504.750 0 0.007.250 3 21.759.750 9 87.75

Totale 14 114µSR|NC=65 = 8.143

3. Il carattere SR non e indipendente in media da NC in quanto le medie condizionate di SR|NCsono differenti tra di loro ed a loro volta sono differenti dalla media della variabile marginaleSR, quindi la condizione di indipendenza in media data da:

µx|y1= µx|y2

= ... = µx|yh= µx

non e soddisfatta.

4. La misura della connessione e effettuata mediante l’indice ηx|y =

var(µx|yj)

var(x) (dove x ed y

corrispondono rispettivamente ad SR ed NC). Dalla formula appena proposta emerge lanecessita di calcolare la varianza delle medie condizionate e la varianza della variabile mar-ginale SR. A tale scopo si utilizzano le medie delle distribuzioni condizionate del precedentequesito e la loro varianza e calcolata con:

var(µx|yj) =

1

N

h∑

j=1

(µx|yj− µx)2n.j

Page 34: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

34 CAPITOLO 1. STATISTICA DESCRITTIVA

dove risulta necessario calcolare prima la media della marginale SR e successivamente siottiene la varianza delle medie condizionate.

E noto dalla teoria che µx = E[µx|yj] quindi (ed e possibile verificarlo empiricamente) e

indifferente calcolare la media di SR utilizzando la distribuzione marginale SR dalla tabelladoppia costruita nel primo quesito, oppure ottenerla come media delle medie condizionatedelle distribuzioni SR|NC. Infatti nel primo caso si ha che:

SR ci ni ci × ni

1 − |3.5 2.250 41 92.253.5 − |6 4.750 11 52.256 − |8.5 7.250 30 217.508.5 − |11 9.750 18 175.50

Totale 100 537.50

e quindi µSR = 5.375, mentre nel secondo caso:

µSR|NC n.j µSR|NC × n.j

4.214 14 58.9964.309 17 73.2535.75 10 57.5005.821 21 122.2414.646 24 111.5048.143 14 114.002

Totale 100 537.496

la cui media e ancora pari a 5.375.

Le varianze della variabile marginale SR e delle medie condizionate µSR|NC sono inveceottenute con:

SR ci ni c2i × ni

1 − |3.5 2.250 41 207.5633.5 − |6 4.750 11 248.1886 − |8.5 7.250 30 1576.8758.5 − |11 9.750 18 1711.125

Totale 100 3743.751

µSR|NC n.j (µSR|NC − µSR)2 × n.j

4.214 14 18.8714.309 17 19.3185.75 10 1.4065.821 21 4.1774.646 24 12.7558.143 14 107.266

Totale 100 163.793

da cui segue che il momento secondo della variabile marginale SR e µ2SR= 37.438 e quindi

la varianza e σ2SR = 37.438 − (5.375)2 = 8.547 mentre la varianza delle medie condizionate

σ2µSR|NC

= 1.638

Page 35: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.5. NUMERI INDICI 35

L’indice di connessione diventa quindi:

ηSR|NC =

1.638

8.547= 0.438

5. Il risultato conseguito con l’indice di connessione permette di affermare che SR e dipendentein media da NC ma tale influenza non e forte.

1.5 Numeri Indici

Esercizio 18Il proprietario di un hotel chiede al suo consulente contabile alcune informazioni sulle spese sostenuteper l’acquisto di quattro beni negli ultimi 5 anni. A tale scopo gli fornisce alcuni dati relativi alcosto medio unitario (in Euro) ed al numero di unita di beni acquistati nei 5 anni di riferimento:

Televisori Condizionatori Frigo Bar Impianti StereoAnni prezzo quantita prezzo quantita prezzo quantita prezzo quantita

( ×100) ( ×100) ( ×100) ( ×100)1999 2.5 2 4 3 2.8 10 2.6 112000 2.7 7 4.8 6 3.1 2 2.9 52001 2.8 6 5.2 1 3.3 4 3.6 42002 3.1 15 4.9 4 3.5 1 2.8 32003 2.9 9 4.2 7 3.4 3 2.5 6

Il proprietario dell’hotel, allo scopo di avere dati di sintesi, chiede:

1. La serie dei numeri indici a base fissa 2001 dei prezzi dei Televisori

2. La serie dei numeri indici a base mobile dei prezzi dei Televisori

3. Le serie dei numeri indici di Laspeyres e di Paasches con anno base 2000.

2

Soluzione

1. La costruzione della serie dei numeri indici a base fissa 2001 dei prezzi dei Televisori eeffettuata utilizzando i seguenti rapporti:

01It =pt

p01t = 1999, . . . , 2003

pertanto la serie richiesta e:

Page 36: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

36 CAPITOLO 1. STATISTICA DESCRITTIVA

Anno 1999 2000 2001 2002 2003

01It 0.893 0.964 1.00 1.107 1.036

2. La serie dei numeri indici a base mobile e invece costruita con:

t−1It =pt

pt−1t = 1999, . . . , 2003

e quindi:

Anno 1999 2000 2001 2002 2003

t−1It - 1.080 1.037 1.107 0.935

3. I numeri indici di Laspeyres e Paasches con anno base 2000 sono calcolati utlizzando leseguenti formule:

00ILt =

k∑

i=1

pt,iq00,i

k∑

i=1

p00,iq00,i

00IPt =

k∑

i=1

pt,iqt,i

k∑

i=1

p00,iqt,i

t = 1999, . . . , 2003

pertanto le corrispondenti serie sono calcolate utilizzando i dati nella seguente tabella dovesono prima calcolati i singoli termini della sommatoria e successivamente e calcolato l’indice.

Numeri indici di LaspeyresTelevisori Condizionatori Frigo Bar Impianti Stereo Indice di Laspeyres

Anni pt × q0 pt × q0 pt × q0 pt × q0

k∑

i=1

ptiq00,i 00ILt

1999 17.5 24 5.6 13 60.1 0.8792000 18.9 28.8 6.2 14.5 68.4 1.0002001 19.6 31.2 6.6 18 75.4 1.1022002 21.7 29.4 7 14 72.1 1.0542003 20.3 25.2 6.8 12.5 64.8 0.947

In maniera simile e costruita la serie dei numeri indici di Paasches che, a differenza del’indicedi Laspeyres, richiede maggiori calcoli come evidenziato dalle seguenti tabelle.

Page 37: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.5. NUMERI INDICI 37

Numeratori dei numeri indici di PaaschesTelevisori Condizionatori Frigo Bar Impianti Stereo

Anni pt × qt pt × qt pt × qt pt × qt

k∑

i=1

ptiqt,i

1999 5 12 28 28.6 73.62000 18.9 28.8 6.2 14.5 68.42001 16.8 5.2 13.2 14.4 49.62002 46.5 19.6 3.5 8.4 782003 26.1 29.4 10.2 15 80.7

Denominatori dei numeri indici di PaaschesTelevisori Condizionatori Frigo Bar Impianti Stereo

Anni p0 × qt p0 × qt p0 × qt p0 × qt

k∑

i=1

p0iqt,i

1999 5.4 14.4 31 31.9 82.72000 18.9 8.8 6.2 14.5 68.42001 16.2 4.8 12.4 11.6 452002 40.5 19.2 3.1 8.7 71.52003 24.3 33.6 9.3 17.4 84.6

e quindi la serie dei numeri indici di Paasches e:

Anno 1999 2000 2001 2002 2003

00IPt 0.890 1.000 1.102 1.091 0.954

Esercizio 19Un gruppo di consumatori ha rilevato mensilmente i prezzi (in Euro) e le quantita di 4 beni diprima necessita da loro acquistati in un semestre:

Bene A Bene B Bene C Bene DMesi prezzo quantita prezzo quantita prezzo quantita prezzo quantita

Gennaio 1.6 10 3.7 15 0.7 21 7.8 12Febbraio 1.9 14 3.9 12 1.1 26 8.2 15Marzo 2.3 11 4.5 18 1.3 23 8.4 9Aprile 2.1 16 4.2 11 1.6 28 8.5 13Maggio 2.2 9 4.4 16 1.9 24 8.1 12Giugno 2.4 8 4.8 10 2.1 31 8.8 9

1. Calcolare la serie dei numeri indici, a base fissa Marzo, dei prezzi del bene B.

2. Utilizzando quest’ultima serie, effettuare uno slittamento di base riportando i numeri indicialla base Gennaio

Page 38: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

38 CAPITOLO 1. STATISTICA DESCRITTIVA

3. Dai risultati del precedente quesito, e vero che il prezzo del Bene B ha subito un decrementonel mese di Giugno rispetto a Gennaio? Commentare la risposta.

4. Calcolare la serie dei numeri indici a base mobile dei prezzi del bene C.

5. Osservando quest’ultima serie di numeri indici, i prezzi del bene C hanno subito decrementinel breve periodo?

6. Utilizzando la serie dei numeri indici a base mobile, costruire la serie dei numeri indici abase fissa Febbraio.

2

Soluzione

1. La serie dei numeri indici a base fissa Marzo dei prezzi del bene A e generata come segue:

MarzoIt =pt

pMarzot = Gennaio, . . . ,Giugno

quindi la serie completa e pari a:

Mese Gennaio Febbraio Marzo Aprile Maggio Giugno

MarzoIt 0.822 0.867 1.000 0.933 0.978 1.067

2. Per effettuare lo slittamento di base richiesto per la serie MarzoIt, si utilizza la seguenteformula:

GennaioIt =MarzoIt

MarzoIGennaiot = Gennaio, . . . ,Giugno

dove il denominatore rimane costante ed e pari a MarzoIGennaio = 0.822 mentre la seriecompleta dei numeri indici generata da tale cambiamento di base e:

Mese Gennaio Febbraio Marzo Aprile Maggio Giugno

MarzoIt 1.000 1.054 1.216 1.135 1.189 1.297

3. L’affermazione e falsa in quanto GennaioIGiugno = 1.297, ovvero il bene in esame presentaun numero indice maggiore di uno e quindi nel mese di giugno il prezzo del bene B risultamaggiore del prezzo osservato nel mese di Gennaio. In particolare tale incremento e statodel 29.7%.

4. La serie dei numeri indici a base mobile per il bene C e generata, come visto in precedenza,con:

t−1It =pt

pt−1t = Gennaio, . . . ,Giugno

da cui si ottiene:

Page 39: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.5. NUMERI INDICI 39

Mese Gennaio Febbraio Marzo Aprile Maggio Giugno

t−1It - 1.571 1.182 1.231 1.188 1.105

5. Dalla serie dei numeri indici a base mobile si osserva che in tutti i mesi oggetto di rilevazionevi e stato un incremento dei prezzi rispetto al mese immediatamente precedente. Tale incre-mento e piuttosto marcato tra i mesi di Gennaio e Febbraio (in cui i prezzi si sono accresciutidel 57, 1%) e meno elevato tra il mese di Maggio e Giugno in cui l’incremento e del 10, 5%.

6. Per generare la serie dei numeri indici a base fissa del bene C partendo da quelli a basemobile, si utilizza la seguente relazione:

1It = 1I2 · 2I3 · ... · t−2It−1 · t−1It

Nel caso in esame e richiesto di costruire una serie dei numeri indici la cui base fissa noncoincide con il primo mese di rilevazione, come prevede invece la formula presentata, quindisi rende necessario prima costruire la serie dei numeri indici a base fissa Gennaio e successiva-mente, mediante un cambio di base, generare la serie dei numeri indici a base fissa Febbraio.Quindi si ottiene che le due serie da generare sono le seguenti:

Mese Gennaio Febbraio Marzo Aprile Maggio Giugno

GennaioIt 1.000 1.571 1.857 2.286 2.714 3.000

FebbraioIt 0.636 1.000 1.182 1.455 1.727 1.909

dove i numeri indici a base fissa Gennaio sono calcolati con:

GennaioIFebbraio = GennaioIFebbraio = 1.571

GennaioIMarzo =Gennaio IFebbraio · FebbraioIMarzo = 1.571 · 1.182 = 1.857

GennaioIAprile =Gennaio IFebbraio ·Febbraio IMarzo ·Marzo IAprile = 1.571 · 1.182 · 1.231 = 2.286e cos ı via.

mentre il successivo slittamento di base necessario per generare la serie dei numeri indici conbase Febbraio e ottenuto dividendo GennaioIt con il valore di GennaioIFebbraio = 1.571 (pert= Gennaio,...,Giugno).

Esercizio 20Utilizzando i dati dell’esercizio precedente:

1. Costruire la serie dei numeri indici composti di Laspeyres con base Aprile per i 4 beni inesame.

2. Osservando i risultati del precedente quesito, il paniere dei quattro beni esaminati dai con-sumatori ha subito incrementi nei prezzi tra il mese di Aprile ed il mese di Maggio?

3. Costruire la serie dei numeri indici composti di Paasches con base Aprile per i 4 beni inesame.

2

Page 40: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

40 CAPITOLO 1. STATISTICA DESCRITTIVA

Soluzione

1. Come nell’esercizio 18, la costruzione della serie dei numeri indice di Laspeyres puo esseresemplificata utilizzando la seguente tabella:

Numeri indici di LaspeyresBene A Bene B Bene C Bene D Indice di Laspeyres

Mesi pt × qAprile pt × qAprile pt × qAprile pt × qAprile

k∑

i=1

pt,iqAprile,i AprileILt

Gennaio 25.6 40.7 19.6 101.4 187.3 0.797Febbraio 30.4 42.9 30.8 106.6 210.7 0.896Marzo 36.8 49.5 36.4 109.2 231.9 0.986Aprile 33.6 46.2 44.8 110.5 235.1 1.000Maggio 35.2 48.4 53.2 105.3 242.1 1.030Giugno 38.4 52.8 58.8 114.4 264.4 1.125

in cui nell’ultima colonna e presente la serie richiesta.

2. La serie dei numeri indici di Laspeyres evidenzia che il paniere dei beni esaminati ha subitoun incremento del 3% tra il mese di Aprile ed il mese di Maggio e quindi l’effermazione evera.

3. Anche la soluzione del presente quesito segue gli stessi passi dell’esercizio 18. In particolaree calcolato il numeratore ed il denominatore dell’indice di Laspeyres e quindi si passa allacostruzione degli opportuni rapporti.

Nella seguente tabella sono riportati in maniera piu sintetica rispetto all’esercizio precedentei risultati:

Numeri indici di Paasches

Mesik∑

i=1

pt,iqt,i

k∑

i=1

p0,iqt,i Indice di Paasches

Gennaio 179.8 219.6 0.819Febbraio 225 248.9 0.904Marzo 211.8 212 0.999Aprile 235.1 235.1 1.000Maggio 233 226.5 1.029Giugno 211.5 184.9 1.144

Page 41: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.6. INTERPOLAZIONE 41

1.6 Interpolazione

Esercizio 21La societa Gamma s.p.a. utilizzando i dati in tabella 1.1 vuole valutare se un modello di interpo-lazione lineare sia in grado di descrivere la relazione esistente tra le variabili Livello minimo direddito mensile desiderato (RM) ed Anni di esperienza lavorativa(AL). A tale scopo:

1. Rappresentare graficamente le coppie di valori (AL,RM)

2. Osservando la nuvola di punti, e possibile affermare che tra le due variabili esiste un legamelineare positivo?

3. Stimare i parametri del modello di interpolazione lineare:

RM = a + bAL + e

4. Utilizzando il modello di interpolazione stimato, a quale livello minimo di reddito ambirebbeun individuo con 30 anni di esperienza lavorativa?

5. Se la variabile RM aumenta del 40%, le stime del modello di interpolazione restano immutateo cambiano?

6. Se cambiano, riscrivere il nuovo modello di interpolazione stimando i parametri facendo usodelle regole delle trasformate lineari.

2

Soluzione

1. La rappresentazione grafica delle coppie di valori (AL,RM) e fornita dal diagramma scatterin Figura 1.11

Figura 1.11: Diagramma scatter delle coppie di valori (ALi, RMi)

Page 42: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

42 CAPITOLO 1. STATISTICA DESCRITTIVA

2. La nuvola di punti del grafico evidenzia un legame lineare positivo tra le due variabili. Infatti,ad eccezione di qualche punto, tutte le coppie di valori possono essere ben interpolate da unretta crescente.

3. La stima dei parametri a e b del modello di interpolazione lineare e ottenuta con:

a = Y − bX b =SXY

S2X

dove Y = RM ed X = AL

Si rende quindi necessario calcolare la covarianza tra le due variabili in esame, la varianzadella variabile indipendente AL e le medie di ambo le variabili.

In particolare la covarianza e la varianza sono calcolate rispettivamente con:

SXY = mXY − X · Y S2X = m2X

− X2

A tal fine si fa uso dei dati in tabella:

unita RM AL RM × AL AL2

1 2.3 2 4.6 42 1.6 8 12.8 643 1.2 21 25.2 4414 0.9 1 0.9 15 2.1 15 31.5 2256 1.6 3 4.8 97 1.8 28 50.4 7848 1.4 5 7.0 259 1.2 13 15.6 16910 2.8 20 56.0 40011 3.4 32 108.8 102412 2.7 23 62.1 52913 1.6 1 1.6 114 1.2 0 0.0 015 1.1 29 31.9 84116 2.5 18 45.0 32417 2 19 38.0 36118 1.7 7 11.9 4919 2.1 12 25.2 14420 3.2 23 73.6 529

Totale 38.40 280 606.9 5924

Segue quindi che le medie delle due variabili sono X = 28020 = 14 e Y = 38.4

20 = 1.92, il momentomisto mXY = 606.9

20 = 30.345 mentre il momento secondo di AL e m2X= 5924

20 = 296.2.

Si ottiene cosı che:

SXY = 30.345 − 14 × 1.92 = 3.465 S2X = m2X

− X2 = 296.2 − 142 = 100.2

Page 43: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.6. INTERPOLAZIONE 43

Quindi le stime dei parametri sono:

b =3.465

100.2= 0.035 a = 1.92 − 0.035 × 14 = 1.43

ed il modello di interpolazione lineare stimato e:

ˆRM i = 1.43 + 0.035 × ALi i = 1, 2, . . . , 20

4. Assumendo che il modello di interpolazione lineare descrive correttamente il fenomeno oggettodi studio, un individuo con 30 anni di esperienza (ovvero AL = 30) desidera il seguente livellodi reddito:

RM = 1.43 + 0.035 · 30 = 2.48

5. L’incremento del 40% di RM, come atteso, non lascia immutate le stime del modello diinterpolazione. Questo risultato emerge con evidenza se si osserva che tale variazione modificaalcuni indici precedentemente calcolati.

Infatti la nuova variabile e RM ′ = RM + 0.40 × RM ovvero RM ′ = 1.40 × RM e quindi siottiene, utilizzando le regole delle trasformate lineari, che:

la media di RM ′

RM′= 1.40RM = 1.40 × 1.92 = 2.688

la varianza di RM ′

S2RM ′ = 1.402 · S2

RM = 0.949

la covarianza tra AL ed RM’

SAL,RM ′ = 1.40 · SAL,RM = 4.851

che quindi differiscono dai valori precedenti.

6. Utilizzando i risultati del precedente quesito e immediato stimare i parametri del modello diinterpolazione lineare:

RM ′ = a + b × AL + e

Infatti i parametri stimati a e b diventano:

b =SAL,RM ′

S2AL

=4.851

100.2= 0.048 a = RM ′ − b · AL = 2.688 − 0.048 × 14 = 2.016

e quindi il modello stimato e:

ˆRM′i = 2.016 + 0.048 × ALi i = 1, . . . , 20

Page 44: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

44 CAPITOLO 1. STATISTICA DESCRITTIVA

Esercizio 22Utilizzando i risultati dell’esercizio precedente relativi al modello di interpolazione RM = a+bAL+e:

1. Valutare la bonta di accostamento del modello ai dati utilizzando l’indice R2.

2. E vero che il modello stimato spiega almeno il 30% della variabilita totale?

3. Effettuare l’analisi grafica dei residui e commentare i risultati.

2

Soluzione

1. La verifica della bonta di accostamento del modello ai dati e effettuato mediante il calcolodell’indice R2:

R2 =S2

Y

S2Y

dove S2Y

e la varianza dei valori interpolati ( ˆRM) ed S2Y e la varianza della variabile dipen-

dente (RM). A tale scopo si costruisce un’altra tabella, ad integrazione della precedente:

unita RM AL ˆRM ˆRM2

RM2

1 2.3 2 1.500 2.250 5.292 1.6 8 1.710 2.924 2.563 1.2 21 2.165 4.687 1.444 0.9 1 1.465 2.146 0.815 2.1 15 1.955 3.822 4.416 1.6 3 1.535 2.356 2.567 1.8 28 2.410 5.808 3.248 1.4 5 1.605 2.576 1.969 1.2 13 1.885 3.553 1.4410 2.8 20 2.130 4.537 7.8411 3.4 32 2.550 6.503 11.5612 2.7 23 2.235 4.995 7.2913 1.6 1 1.465 2.146 2.5614 1.2 0 1.430 2.045 1.4415 1.1 29 2.445 5.978 1.2116 2.5 18 2.060 4.244 6.2517 2 19 2.095 4.389 4.0018 1.7 7 1.675 2.806 2.8919 2.1 12 1.850 3.423 4.4120 3.2 23 2.235 4.995 10.24

Totale 38.40 280 38.40 76.183 83.400

Page 45: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.6. INTERPOLAZIONE 45

dove i valori interpolati ˆRM i (i = 1, . . . , 20) sono ottenuti con:

ˆRM1 = 1.43 + 0.035 × 2 = 1.50ˆRM2 = 1.43 + 0.035 × 8 = 1.71ˆRM3 = 1.43 + 0.035 × 21 = 2.165

. . .

Dai risultati in tabella e possibile calcolare la media di ˆRM che, come dimostrato dai risultatiteorici, coincide con la media di RM :

ˆRM =38.4

20= 1.92

mentre il momento secondo m2RM

= 76.18320 = 3.809. Segue cosı che la varianza dei valori

interpolati e:

S2ˆRM

= 3.809 − 1.922 = 0.123

mentre la varianza dei valori osservati RM e:

S2RM =

83.4

20− 1.922 = 0.484

Si ottiene infine che:

R2 =0.123

0.484= 0.254

2. Dal valore calcolato dell’indice R2 si osserva che il modello interpolato spiega il 25.4% dellavariabilita totale del fenomeno, quindi l’affermazione e falsa.

3. Per effettuare l’analisi grafica dei residui si rende necessario calcolare i residui stimati ei =RMi − ˆRM i, i = 1, 2, . . . , 20, come presentato in Tabella 1.3.

L’analisi grafica dei residui e poi effettuata rappresentando graficamente le coppie di valori(i, ei) in Figura 1.12 ed (ei, ei−1) in Figura 1.13.

Page 46: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

46 CAPITOLO 1. STATISTICA DESCRITTIVA

unita RM AL ˆRM ei

1 2.3 2 1.500 0.8002 1.6 8 1.710 -0.1103 1.2 21 2.165 -0.9654 0.9 1 1.465 -0.5655 2.1 15 1.955 0.1456 1.6 3 1.535 0.0657 1.8 28 2.410 -0.6108 1.4 5 1.605 -0.2059 1.2 13 1.885 -0.68510 2.8 20 2.130 0.67011 3.4 32 2.550 0.85012 2.7 23 2.235 0.46513 1.6 1 1.465 0.13514 1.2 0 1.430 -0.23015 1.1 29 2.445 -1.34516 2.5 18 2.060 0.44017 2 19 2.095 -0.09518 1.7 7 1.675 0.02519 2.1 12 1.850 0.25020 3.2 23 2.235 0.965

Totale 38.40 280 38.40

Tabella 1.3: Calcolo dei residui stimati del modello di interpolazione

Nella Figura 1.12 si osserva che i punti rappresentati mostrano ancora un andamento cre-scente. Cio lascia ipotizzare che il modello esaminato non sia stato in grado di cogliere tuttala dinamica che lega le due variabili in esame e quindi che il modello di interpolazione li-neare sia stato in grado di spiegare solo parzialmente la relazione esistente tra RM ed AL.Questo risultato e invece meno evidente nel grafico successivo (Figura 1.13). Questo fornisceun’ulteriore conferma di quanto osservato a seguito del calcolo dell’indice R2 il cui valoreaveva gia evidenziato i limiti del modello adattato.

Page 47: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

1.6. INTERPOLAZIONE 47

Figura 1.12: Analisi dei residui: diagramma scatter delle coppie di valori (i, ei)

Figura 1.13: Analisi dei residui: diagramma scatter delle coppie di valori (ei, ei−1)

Page 48: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

Capitolo 2

Calcolo delle Probabilita

2.1 Calcolo delle probabilita

Esercizio 1Dati gli eventi A,B ⊂ Ω e noto che: che P (A) = 1

4 , P (B) = 13 e P (A ∩ B) = 1

6 .

1. Calcolare le seguenti probabilita:

(a) P (A)

(b) P (A ∪ B)

(c) P (A ∩ B)

(d) P (A ∩ B)

2. Se si considera un altro evento C, facente parte dello stesso spazio campione di A e B edincompatibile con A, calcolare P (A ∩ C)

3. Sapendo che P (C) = 18 , calcolare P (A ∪ C).

2

SoluzioneLe probabilita richieste sono le seguenti:

1. Il calcolo delle probabilita proposte richiede l’impiego di alcuni teoremi che sono di volta involta richiamati.

(a) P (A) = 1 − P (A) = 1 − 14 = 3

4 = 0.75

(b) Per il calcolo di P (A∪B) si utilizza uno dei teoremi del calcolo delle probabilita, secondoil quale:

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

da cui segue che:

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) =1

4+

1

3− 1

6=

5

12= 0.417

48

Page 49: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.1. CALCOLO DELLE PROBABILITA 49

(c) Impiegando nuovamente il teorema utilizzato nel quesito (a):

P (A ∩ B) = 1 − P (A ∩ B) = 1 − 1

6=

5

6= 0.833

(d) Dall’uso delle regole del de Morgan:

P (A ∩ B) = P (A ∪ B) = 1 − P (A ∪ B) = 1 − 0.417 = 0.583

2. L’incompatibilita tra gli eventi A e C implica che:

P (A ∩ C) = P (φ) = 0

3. Ricordando che A ∩ C = φ, e possibile quindi impiegare il quarto postulato del calcolo delleprobabilita:

P (A ∪ C) = P (A) + P (C) =1

4+

1

8=

3

8= 0.375

Esercizio 2Dati due eventi A,B ⊂ Ω, e noto che: P (A) = 0.12, P (B) = 0.89 e P (A ∩ B) = 0.07. Calcolarele seguenti probabilita:

1. P (A ∪ B)

2. P (A ∪ B)

3. P (A ∪ B)

4. P (A ∪ B)

2

SoluzioneLe probabilita proposte sono cosı calcolate:

1. P (A ∪ B) = P (A) + P (B) − P (A ∪ B) = 0.12 + 0.89 − 0.07 = 0.94

2. P (A ∪ B) = P (A) + P (B) − P (A ∩ B) (da uno dei teoremi del calcolo delle probabilita)Inoltre, eventualmente aiutandosi con i diagrammi di Venn, e agevole osservare che:

P (A ∩ B) = P (A) − P (A ∩ B)

e quindi:

P (A∪ B) = P (A)+P (B)−P (A)+P (A∩B) = 1−P (B)+P (A∩B) = 1−0.89+0.07 = 0.18

3. La souzione del presente quesito segue gli stessi passi logici del precedente.

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

dove anche in questo caso e facile dimostrare che P (A ∩ B) = P (B) − P (A ∩ B) e quindi:

P (A∪B) = P (A)+P (B)−P (B)+P (A∩B) = 1−P (A)+P (A∩B) = 1−0.12+0.07 = 0.95

Page 50: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

50 CAPITOLO 2. CALCOLO DELLE PROBABILITA

4. Il calcolo di questa probabilita richiede l’uso delle regole del de Morgan, infatti:

P (A ∪ B) = P (A ∩ B) = 1 − P (A ∩ B) = 1 − 0.07 = 0.93

Esercizio 3Dati due eventi A e B, con A,B ⊂ Ω, e noto che P (A) = 0.5 e P (A ∪ B) = 0.6. Calcolare P (B)sotto le seguenti ipotesi:

1. A e B sono indipendenti

2. A e B sono incompatibili

3. P (A|B) = 0.4

2

Soluzione

1. L’indipendenza tra i due eventi A e B implica che:

P (A ∩ B) = P (A)P (B)

Ricordando uno dei teoremi del calcolo delle probabilita:

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

quindi:P (A ∩ B) = P (A) + P (B) − P (A ∪ B)

Sostituendo quest’ultima relazione nella condizione di indipendenza:

P (A)P (B) = P (A) + P (B) − P (A ∪ B)

ovvero 0.5P (B) = 0.5 + P (B) − 0.6 e quindi P (B) = 0.10.5 = 0.2

2. L’incompatibilita tra A e B consente di utilizzare il quarto postulato del calcolo delle proba-bilita:

P (A ∪ B) = P (A) + P (B)

e quindi P (B) = 0.6 − 0.5 = 0.1

3. Dal quinto postulato del calcolo delle probabilita:

P (A|B) =P (A ∩ B)

P (B)

ed utilizzando alcune considerazioni fatte nel quesito 1., il numeratore puo essere riscrittocon:

P (A|B) =P (A) + P (B) − P (A ∪ B)

P (B)

Page 51: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.1. CALCOLO DELLE PROBABILITA 51

Dai risultati forniti segue che

0.4P (B) = 0.5 + P (B) − 0.6

e quindi

0.1 = 0.6P (B) ovvero P (B) =0.1

0.6= 0.17

Esercizio 4Un’urna contiene 15 palline, di cui 5 bianche (B), 7 rosse (R) e 3 nere (N). Calcolare:

1. la probabilita di estrarre una pallina bianca

2. la probabilita di estrarre una pallina bianca o rossa

3. la probabilita di non estrarre una pallina bianca

4. la probabilita che estraendo con reimmissione due palline, una sia bianca ed una sia nera

5. la probabilita che estraendo con reimmissione due palline siano entrambe nere

6. la probabilita che estraendo in blocco (senza reimmissione) due palline, siano entrambe bianche

7. la probabilita che estraendo in blocco (senza reimmissione) due palline almeno una sia bianca.

2

SoluzioneLe probabilita richieste sono:

1. P (B) = 515 = 0.333

2. La prova consiste nell’estrazione di una sola pallina, quindi gli eventi ”estrazione pallina B”e ”estrazione pallina R” sono incompatibili, pertanto P (B ∪R) = P (R) + P (B) = 5

15 + 715 =

1215 = 0.8

3. P (B) = 1 − P (B) = 1 − 0.333 = 0.777

4. I possibili esiti dell’estrazione sono (B ∩ N) ∪ (N ∩ B) che a loro volta sono due eventiincompatibili in quanto o si verifica (B ∩ N) o si verifica (N ∩ B) dall’estrazione.Passando quindi alle probabilita:

P [(B ∩ N) ∪ (N ∩ B)] = P (B ∩ N) + P (N ∩ B)

L’estrazione con reimmissione assicura inoltre l’indipendenza tra i due eventi elementari ”e-strazione B” ed ”estrazione N”, quindi:

P (B ∩N) + P (N ∩B) = P (B) · P (N) + P (N) · P (B) =5

15· 3

15+

3

15· 5

15= 2 · 15

225= 0.133

5. P (N ∩ N) = P (N) · P (N) = 315 · 3

15 = 9225 = 0.04

Page 52: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

52 CAPITOLO 2. CALCOLO DELLE PROBABILITA

6. Per il calcolo di questa probabilita il mancato reimbussolamento della pallina estratta con-diziona la probabilita associata alla successiva estrazione, quindi:

P (B ∩ B) = P (B) · P (B|B) =5

15

4

14= 0.095

7. la parola almeno nel quesito implica che nell’estrazione fatta ci sia una o piu di una pallinabianca, quindi puo accadere (B ∩ B) ∪ (B ∩ B) ∪ (B ∩ B).Passando alle probabilita queste risulteranno condizionate in quanto anche in questo caso lapallina estratta non e piu immessa nell’urna, quindi:

P [(B ∩ B) ∪ (B ∩ B) ∪ (B ∩ B)] = P (B) · P (B|B) + P (B) · P (B|B) +

+P (B) · P (B|B) =5

15· 10

14+

10

15· 5

14+

5

15· 4

14=

4

7= 0.571

Esercizio 5Si lanciano due dadi regolari. Calcolare le seguenti probabilita:

1. P(somma dei puntini e 4)

2. P(somma dei puntini e ≤ 2)

3. P(somma dei puntini e < 0)

4. P(che solo uno dei due dadi presenta sei puntini)

5. P(che entrambi i dadi presentano sei puntini)

6. E piu probabile ottenere un sei dal lancio di un dado regolare o dal lancio di due dadi regolari?

2

SoluzionePer la soluzione di questo esercizio si indichera con Di, con i = 1, 2, . . . , 6, l’esito del lancio deldado, ovvero, ad esempio D1=”lancio il dado ed esce uno”, D4=”lancio il dado ed esce quattro”ecc.Le probabilita richieste sono le seguenti:

1. La somma quattro si ottiene con 1, 3, 2, 2 e 3, 1, quindi:

P (somma 4) = P [(D1∩D3)∪(D2∩D2)∪(D3∩D1)] = P (D1∩D3)+P (D2∩D2)+P (D3∩D1)

le prove associate al lancio del primo e del secondo dado sono inoltre indipendenti quindi:

P (D1 ∩ D3) + P (D2 ∩ D2) + P (D3 ∩ D1) = P (D1) · P (D3) + P (D2) · P (D2) +

+P (D3) · P (D1) =

(

1

6

)2

+

(

1

6

)2

+

(

1

6

)2

=1

12= 0.083

Page 53: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.1. CALCOLO DELLE PROBABILITA 53

2. E evidente che in questo caso che la somma non puo essere minore di 2, quindi si terra contosolo del simbolo di uguaglianza per il calcolo della probabilita:

P (somma ≤ 2) = P (D1 ∩ D1) = P (D1) · P (D1) =

(

1

6

)2

=1

36= 0.028

3. P (somma < 0) = P (φ) = 0

4. la probabilita e:

P [(D6 ∩ D6) ∪ (D6 ∩ D6)] = P (D6 ∩ D6) + P (D6 ∩ D6) = P (D6) · P (D6) + P (D6) · P (D6) =

=1

6· 5

6+

5

6· 1

6= 2 · 5

36=

5

18= 0.278

5. P (D6 ∩ D6) = P (D6) · P (D6) =(

16

)2= 1

36 = 0.0278

6. E noto che la probabilita di avere un sei dal lancio di un dado regolare e 16 = 0.167. La

probabilita di avere un sei dal lancio di due dadi regolari, tenuto conto dei risultati precedenti,risulta invece 0.278.

Quindi si puo concludere che e piu probabile avere un sei dal lancio di due dadi regolari chedal lancio di un solo dado (come era lecito attendersi).

Esercizio 6Si considerino 2 urne contenenti palline bianche (B) e rosse (R):

URNA 1: 10 B 8 R (totale 15)URNA 2: 7 B 13 R (totale 20)

Calcolare:

1. la probabilita che estraendo a caso una pallina da una delle urne sia bianca.

2. la probabilita che estraendo a caso una pallina da una delle urne sia rossa.

3. la probabilita che estraendo a caso una pallina da una delle urne non sia ne rossa ne bianca.

2

SoluzioneIn questo caso il calcolo delle probabilita e condizionata dall’urna dalla quale l’estrazione e ef-fettuata. Se si indicano con U1 ed U2 rispettivamente l’Urna 1 e l’Urna 2 dalle quali e fattal’estrazione, le probabilita richieste sono:

1. P (B) = P [(U1∩B)∪(U2∩B)] = P (U1∩B)+P (U2∩B) = P (U1) ·P (B|U1)+P (U2) ·P (B|U2)

Trovandoci in presenza di due sole urne P (U1) = P (U2) = 12 e quindi le probabilita richieste

sono:

P (U1) · P (B|U1) + P (U2) · P (B|U2) =1

2· 10

18+

1

2· 7

20=

163

360= 0.453

Page 54: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

54 CAPITOLO 2. CALCOLO DELLE PROBABILITA

2. P (R) = P [(U1∩R)∪(U2∩R)] = P (U1∩R)+P (U2∩R) = P (U1) ·P (R|U1)+P (U2) ·P (R|U2)

Seguendo gli stessi passi precedenti:

P (U1) · P (R|U1) + P (U2) · P (R|U2) =1

2· 8

18+

1

2· 13

20=

197

360= 0.547

3. P (R ∩ B) = P[U1 ∩ (R ∩ B)] ∪ [U2 ∩ (R ∩ B)] = P (U1)P (R ∩ B|U1) + P (U2)P (R ∩ B|U2)

E immediato osservare che P (R∩B|Ui) = 0 (per i = 1, 2) in quanto gli eventi sono impossibilidisponendo nelle urne solo di palline rosse e bianche. Quindi P (R ∩ B) = 0

Esercizio 7Un punto di ristoro sta facendo un’indagine sulle abitudini al fumo dei suoi clienti al fine di valutarela necessita di creare una sala fumatori. A tale scopo intervista 200 clienti e rileva per ciascunintervistato il genere e l’abitudine al fumo:

• genere: M, F

• abitudine al fumo: fumatore (FUM), non fumatore (NFUM)

Rileva che dei 200 intervistati, 50 sono uomini fumatori, 30 sono donne non fumatrici ed in totaleha intervistato 80 individui di genere maschile. Calcolare la probabilita che estraendo a caso unindividuo intervistato:

1. sia fumatore: P (FUM)

2. sia una donna: P (F )

3. sia un uomo fumatore: P (M ∩ FUM)

4. sia un uomo o un fumatore: P (M ∪ FUM)

2

SoluzionePer una piu agevole soluzione dell’esercizio e utile costruire una tabella a doppia entrata checontenga le informazioni fornite dalla traccia e che sia opportunamente completata (numeri inrosso):

FUM NFUMM 50 30 80F 90 30 120

140 60 200

Utilizzando i dati in tabella le probabilita richieste sono:

1. P (FUM) = 140200 = 0.7

2. P (F ) = 120200 = 0.6

Page 55: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.1. CALCOLO DELLE PROBABILITA 55

3. P (M ∩ FUM) = 50200 = 0.25

4. P (M ∪ FUM) = P (M) + P (FUM) − P (M ∩ FUM) = 80200 + 140

200 − 50200 = 17

20 = 0.85

Esercizio 8Il Signor Bianchi partecipa ad una trasmissione televisiva durante la quale il conduttore gli mettea disposizione 7 pacchi (numerati da 1 a 7) ciascuno dei quali presenta i seguenti contenuti:

n. pacco 1 2 3 4 5 6 7premio giocattolo 1000 4000 volatile 6000 500 10000

dove il contenuto in denaro dei pacchi 2, 3, 5, 6 e 7 e espresso in Euro.Il Sig. Bianchi, che e a conoscenza dei premi in palio ma non della loro collocazione nei pacchi,deve scegliere in blocco 2 pacchi il cui contenuto rappresenta la sua vincita.

Calcolare le seguenti probabilita:

1. la probabilita che il Sig. Bianchi vinca il volatile

2. la probabilita che il Sig. Bianchi non vinca del denaro

3. la probabilita che il Sig. Bianchi vinca almeno 11 mila Euro

4. la probabilita che il Sig. Bianchi vinca meno di 11 mila Euro.

2

SoluzioneLe probabilita richieste sono le seguenti:

1. Indicato con ”V” l’evento ”il Sig. Bianchi sceglie il pacco con il volatile”, la probabilita ecosı calcolata:

P [(V ∩ V ) ∪ (V ∩ V )] =P (V ∩ V ) + P (V ∩ V ) =

=P (V )P (V |V ) + P (V )P (V |V ) =1

7· 6

6+

6

7· 1

6=

2

7= 0.286

2. Il quesito richiede il calcolo della probabilita che il Sig. Bianchi vinca il volatile ed il giocat-tolo. Indicati con ”V” e ”G” rispettivamente gli eventi ”il Sig. Bianchi sceglie il pacco conil volatile”, ”il Sig. Bianchi sceglie il pacco con il giocattolo”, la probabilita e:

P [(V ∩ G) ∪ (G ∩ V )] =P (V ∩ G) + P (G ∩ V ) =

=P (V )P (G|V ) + P (G)P (V |G) =1

7· 1

6+

1

7· 1

6=

1

21= 0.048

Page 56: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

56 CAPITOLO 2. CALCOLO DELLE PROBABILITA

3. Le combinazioni di pacchi che permettono al Sig. Bianchi di vincere almeno 11000 Euro sonofornite dalle seguenti coppie:

P2, P7; P3, P7; P5, P7; P7, P2; P7, P3; P7, P5

Quindi la probabilita richiesta e:

P (vincita ≥ 11000) = P [(P2 ∩ P7) ∪ (P3 ∩ P7) ∪ (P5 ∩ P7) ∪ (P7 ∩ P2) ∪ (P7 ∩ P3) ∪∪(P7 ∩ P5)] = P (P2 ∩ P7) + P (P3 ∩ P7) + P (P5 ∩ P7) +

+P (P7 ∩ P2) + P (P7 ∩ P3) + P (P7 ∩ P5) =

= P (P2) · P (P7|P2) + P (P3) · P (P7|P3) + . . . + P (P7) · P (P5|P7) =

= 6 ·(

1

7· 1

6

)

= 0.143

4. Questa probabilita e calcolata ricordando che:

P (vincita < 11000) = 1 − P (vincita ≥ 11000)

quindiP (vincita < 11000) = 1 − 0.143 = 0.857

2.2 Variabili Casuali Discrete

Esercizio 9Si consideri la seguente variabile X:

X 1 2 3 4 5pi 1/2 1/5 1/8 1/4 1/3

Puo essere considerata una variabile casuale discreta?

2

SoluzioneRicordando che una variabile casuale discreta e ben definita se e solo se:

pi ≥ 0 ek∑

i=1

pi = 1

la variabile in esame non puo essere casuale in quanto seppure tutte le probabilita sono non negative,

pi ≥ 0 (per i = 1, 2, . . . , k, con k = 5), non e verificato chek∑

i=1

pi = 1.

Page 57: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.2. VARIABILI CASUALI DISCRETE 57

Esercizio 10L’arrivo dei pacchi postali ricevuti giornalmente dall’azienda Beta s.p.a. e descritto dalla seguentevariabile casuale:

X 2 4 5 8pi 1/8 1/4 3/8 p

calcolare:

1. il valore di p

2. il valore atteso di X

3. la varianza di X

4. la probabilita che l’azienda riceva piu di 4 pacchi in un giorno

5. la probabilita che l’azienda riceva almeno 4 pacchi in un giorno.

2

Soluzione

1. Ricordando che la somma delle pi della variabile casuale e 1, p risulta:

p = 1 −(

1

8+

1

4+

3

8

)

=1

4

2. Il valore atteso di X e:

k∑

i=1

xi · pi = 2 · 1

8+ 4 · 1

4+ 5 · 3

8+ 8 · 1

4=

41

8= 5.125

3. La varianza di X e calcolata come differenza tra momenti, V ar(X) = E(X2) − E(X)2, doveil momento secondo:

E(X2) = 4 · 1

8+ 16 · 1

4+ 25 · 3

8+ 64 · 1

4=

239

8= 29.875

Quindi la varianza e:

V ar(X) = 29.875 − (5.125)2 = 3.609

4. Questa probabilita risulta:

P (X > 4) =3

8+

1

4=

5

8= 0.625

Page 58: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

58 CAPITOLO 2. CALCOLO DELLE PROBABILITA

5. La probabilita di ricevere almeno 4 pacchi e:

P (X ≥ 4) =1

4+

3

8+

1

4=

7

8= 0.875

Esercizio 11Un esperimento casuale si compone di 15 prove ed il suo modello probabilistico che lo descrive euna variabile casuale Binomiale X ∼ B(15; 0.4). Calcolare:

1. la probabilita di avere 4 successi

2. la probabilita di avere non piu di 4 successi

3. la probabilita di avere almeno 3 successi

4. la probabilita di avere piu di 15 successi

2

SoluzioneLa variabile in esame e la Binomiale X ∼ B(n, p) che, come noto, ha distribuzione di probabilita:

P (X = x) =

(

nx

)

px(1 − p)n−x con x ∈ [0, n]

con media E(X) = n · p e varianza V ar(X) = n · p · (1 − p). Quindi:

1. Il valore atteso e E[X] = 15 ·0.4 = 6 mentre la varianza e V ar(X) = 15 ·0.4 ·0.6 = 3.6

2.

P (X = 4) =

(

154

)

0.44 · 0.611 =15!

4!11!0.44 · 0.611 = 0.1268

3.

P (X ≤ 4) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) =

=

(

150

)

0.40 · 0.615 +

(

151

)

0.41 · 0.614 +

(

152

)

0.42 · 0.613 +

+

(

153

)

0.43 · 0.612 +

(

154

)

0.44 · 0.611 =

= 0.00047 + 0.0047 + 0.02194 + 0.06339 + 0.1268 = 0.2173

4.P (X ≥ 3) = 1 − P (X < 3) = 1 − 0.02711 = 0.97289

5. La probabilita richiesta in questo caso e relativa ad un evento impossibile quindi:

P (X > 15) = P (φ) = 0

Page 59: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.2. VARIABILI CASUALI DISCRETE 59

Esercizio 12E noto che un calciatore su 10 rigori ne mette a segno 7. Calcolare la probabilita che tirando 20rigori:

1. ne mette a segno almeno 3

2. ne mette a segno piu di 18

3. non sbaglia alcun rigore

2

SoluzioneL’esercizio ha ad oggetto eventi che presentano una chiara dicotomia: il calciatore ”segna il rigore”,”non segna il rigore” e la probabilita di successo (ovvero ”segna il rigore”) e p = 7

10 = 0.7Quindi e possibile rispondere al quesito utilizzando una variabile casuale Binomiale che e in gradodi descrivere il fenomeno in esame: X ∼ B(20, 0.7). Segue quindi che:

1. La probabilita che il giocatore metta a segno almeno tre rigori e:

P (X ≥ 3) = 1 − P (X < 3) = 1 − [P (X = 0) + P (X = 1) + P (X = 2)] =

= 1 −[(

200

)

0.70(1 − 0.7)20 +

(

201

)

0.71(1 − 0.7)19 +

(

202

)

0.72(1 − 0.7)18]

Tutte le probabilita tra le parentesi quadre sono approssimabili a zero, quindi:

P (X ≥ 3) = 1 − P (X < 3) ≈ 1

2. La probabilita che il giocatore metta a segno piu di 18 rigori e:

P (X > 18) = P (X = 19) + P (X = 20) =

(

2019

)

0.719(1 − 0.7)1 +

(

2020

)

0.720(1 − 0.7)0 =

= 20 · 0.719(0.3) + 0.720 = 0.0068 + 0.0008 = 0.0076

3. Dai risultati precedenti: P (X = 20) = 0.0008

Esercizio 13Dovete sostenere un esame scritto sotto forma di quiz con 5 domande per ognuna delle qualila risposta e vero o falso. Per superare la prova bisogna rispondere correttamente ad almeno 3domande. Calcolare la probabilita di superare l’esame rispondendo a caso.

2

SoluzioneLa soluzione del quesito puo essere fornita utilizzando la variabile casuale Binomiale.Sapendo che ciascuna domanda prevede due sole possibili risposte vero o falso, la probabilita dirispondere correttamente e p = 0.5 che puo essere intesa come probabilita di successo nella rispostaalla domanda del quiz.

Page 60: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

60 CAPITOLO 2. CALCOLO DELLE PROBABILITA

Poiche la risposta e valutata dalla commissione in maniera dicotomica ”corretta” ”non corretta”,il fenomeno in esame puo essere descritto da una variabile casuale Binomiale B(5, 0.5), dove N=5e il numero di prove (quesiti nel nostro caso) e p = 0.5 e la probabilita di successo.Ricordando che per superare la prova bisogna rispondere correttamente ad almeno tre domande(ovvero a tre o piu domande), il problema si riduce quindi a calcolare la probabilita P (X ≥ 3),con X ∼ B(5, 0.5).Quindi, ricordando la distribuzione di probabilita della Binomiale:

P (X = x) =

(

nx

)

px(1 − p)n−x con x ∈ [0, n]

segue che:

P (X ≥ 3) =

5∑

i=3

(

5i

)

0.5i(1 − 0.5)5−i = 0.3125 + 0.15625 + 0.03125 = 0.5

ovvero fornendo risposte a caso alle domande del quiz, la probabilita di superare la prova e pari a0.5.

Esercizio 14La probabilita che un giocatore di basket faccia canestro al tiro libero e 0.7. Assumendo che in unapartita vi siano 15 tiri liberi, calcolare:

1. la probabilita che il giocatore metta a segno tutti i tiri liberi

2. la probabilita che il giocatore metta a segno 14 tiri liberi

2

SoluzioneIndicato con ”T” l’evento che il giocatore di basket metta a segno il tiro libero ed osservando chela sua probabilita di successo e 0.7, le probabilita richieste possono essere calcolate con semplicita.In particolare, la dicotomia dell’esito del tiro libero del giocatore rende il fenomeno descrivibilecon una variabile casuale Binomiale B(15; 0.7) e quindi:

1. P (T = 15) =

(

1515

)

(0.7)15 · (1 − 0.7)0 = 0.0047

2. P (T = 14) =

(

1514

)

(0.7)14 · (1 − 0.7) = 0.03

Esercizio 15Sia X una variabile casuale di Poisson con parametro λ = 4. Calcolare:

1. il valore atteso e la varianza di X

2. P (X = 2)

Page 61: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.2. VARIABILI CASUALI DISCRETE 61

3. P (X > 2)

4. la probabilita che X sia almeno pari a 2.

2

Soluzione

1. Dai risultati teorici relativi alla variabile casuale di Poisson E(X) = V ar(X) = λ, quindi ilvalore atteso e la varianza di X sono entrambi pari a 4.

2. Utilizzando la distribuzione di probabilita della variabile casuale di Poisson:

P (X = x) =e−λ · λx

x!con x > 0

P (X = 2) = e−4·42

2! = 0.1465

3.

P (X > 2) = 1 − P (X ≤ 2) = 1 − [P (X = 0) + P (X = 1) + P (X = 2)] =

= 1 −[

e−4 · 40

0!+

e−4 · 41

1!+ 0.1465

]

= 1 − [0.0183 + 0.0733 + 0.1465] = 0.7622

4. L’affermazione equivale al calcolo della probabilita P (X ≥ 2) che, utilizzando i risultatiprecedenti, e pari a:

P (X ≥ 2) = 0.1465 + 0.7622 = 0.9087

Esercizio 16Un ingresso autostradale possiede 5 caselli. Sapendo che il numero di auto che arrivano ai caselliin un minuto si distribuisce come una variabile casuale di Poisson con λ = 3, calcolare:

1. la probabilita che in un minuto non arrivino auto

2. la probabilita che in un minuto arrivino 2 auto

3. la probabilita che vi siano auto incolonnate per l’attraversamento del casello

2

SoluzioneLa variabile che descrive il fenomeno e X ∼ P (λ), con λ = 3.

1. La probabilita che non arrivino auto per un minuto e:

P (X = 0) =e−330

0!= e−3 = 0.0498

Page 62: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

62 CAPITOLO 2. CALCOLO DELLE PROBABILITA

2. La probabilita che arrivino 2 auto in un minuto e:

P (X = 2) =e−332

2!=

e−3 · 92

= 0.224

3. La probabilita che vi siano auto incolonnate per l’attraversamento del casello equivale a direche sono arrivate piu di 5 auto (ovvero un numero di auto superiore ai caselli disponibili) equindi:

P (X > 5) = 1 − P (X ≤ 5) = 1 − [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) +

+P (X = 4) + P (X = 5)] = 1 −(

0.0498 + e−33 + 0.224 +e−333

3!+

e−334

4!+

e−335

5!

)

=

= 1 − (0.0498 + 0.1494 + 0.224 + 0.224 + 0.168 + 0.1008) = 0.084

2.3 Variabili Casuali Continue

Esercizio 17Sia X ∼ N(5; 14), calcolare le seguenti probabilita:

1. P (X < 2)

2. P [(X − µ) > 4]

3. P (|X| > 1)

4. P [(X − µ) < 0.5]

5. P (|X − µ| < 3)

6. P (X > 2 ∩ X < 4)

7. P (X < 3 ∪ X > 9.5)

2

SoluzioneData la variabile casuale X ∼ N(5; 14), le probabilita richieste sono:

1.

P (X < 2) = P

(

Z <2 − 5

3.74

)

= P (Z < −0.80) = Φ(−0.80) =

= 1 − Φ(0.80) = 1 − 0.7881 = 0.2119

2.

P [(X − µ) > 4] = P

(

Z >4

3.74

)

= P (Z > 1.07) = 1 − Φ(1.07) =

= 1 − 0.8577 = 0.1423

Page 63: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.3. VARIABILI CASUALI CONTINUE 63

3.

P (|X| > 1) = P (X < −1 ∪ X > 1) = P

(

Z <−1 − 5

3.74∪ Z >

1 − 5

3.74

)

=

= P (Z < −1.60 ∪ Z > −1.07) = 1 − P (−1.60 < Z < −1.07) =

avvalendosi della simmetria della variabile casuale Normale

= 1 − P (1.07 < Z < 1.60) = 1 − [Φ(1.60) − Φ(1.07)] =

= 1 − (0.9452 − 0.8577) = 0.9125

4.

P [(X − µ) < 0.5] = P [(X − µ) ≥ 0.5] = P

(

Z ≥ 0.5

3.74

)

=

= P (Z ≥ 0.13) = 1 − Φ(0.13) = 1 − 0.5517 = 0.4483

5.

P (|X − µ| < 3) = P [−3 < (X − µ) < 3] = P (−0.80 < Z < 0.80) = Φ(0.80) − Φ(−0.80) =

= 2 · Φ(0.80) − 1 = 2 · 0.7781 − 1 = 0.5562

6.

P (X > 2 ∩ X < 4) = P (2 < X < 4) = P (−0.80 < Z < −0.27) = P (0.27 < Z < 0.8) =

= Φ(0.8) − Φ(0.27) = 0.7881 − 0.6064 = 0.1817

(anche in questo caso si e fatto uso della simmetria della variabile casuale Normale)

7.

P (X < 3 ∪ X > 9.5) = i due eventi in esame sono incompatibili e quindi dal quarto postulato

= P (X < 3) + P (X > 9.5) = P (Z < −0.53) + P (Z > 1.20) =

= [1 − Φ(0.53)] + [1 − Φ(1.20)] = (1 − 0.7019) + (1 − 0.8849) =

= 0.4132

Esercizio 18Sia X ∼ N(5; 14) e sia Y una sua trasformata lineare: Y = 4 + 3X. Calcolare:

1. P (|Y | > 20)

2. P (Y < 4 ∪ Y > 1)

3. P [(Y − µ) < 3.9]

4. P (Y < 9 ∩ Y > 5)

2

Page 64: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

64 CAPITOLO 2. CALCOLO DELLE PROBABILITA

SoluzioneData la variabile casuale X ∼ N(5; 14), la sua trasformata lineare Y = 4 + 3X, per la proprietariproduttiva della variabile casuale Normale, ha distribuzione ancora Normale ma con valore attesoe varianza date rispettivamente da:

E(Y ) = E(4 + 3X) = 4 + 3 · E(X) = 4 + 3 · 5 = 19V ar(Y ) = 32 · V ar(X) = 9 · 14 = 126

ovvero Y ∼ N(19, 126). Quindi le probabilita sono calcolate con:

1.

P (|Y | > 20) = P (Y < −20 ∪ Y > 20) =

l’incompatibilita dei due eventi permette di utilizzare ancora una volta il quarto postulato

= P (Y < −20) + P (Y > 20) = P

(

Z <−20 − 19

11.22

)

+ P

(

Z >20 − 19

11.22

)

=

= P (Z < −3.48) + P (Z > 0.09) = 1 − Φ(3.48) + 1 − Φ(0.09) =

= 0.0003 + 0.0.4641 = 0.4644

2. P (Y < 4 ∪ Y > 1) = P (Ω) = 1ovvero almeno una delle due disuguaglianze e sempre verificata.

3.

P [(X − µ) < 3.9] = P

(

Z <3.9

11.22

)

= P (Z < 0.35) = 0.63684.

P (Y < 9 ∩ Y > 5) = P (5 < Y < 9) = P

(

5 − 19

11.22< Z <

9 − 19

11.22

)

=

= P (−1.25 < Z < −0.89) = P (0.89 < Z < 1.25) =

= Φ(1.25) − Φ(0.89) = 0.8944 − 0.8133 = 0.0811

Esercizio 19Si consideri la seguente variabile casuale X ∼ N(4; 37) e si calcolino le seguenti probabilita:

1. P [(X − µ) > 1.3 ∪ X > 4.5]

2. P [|X| < 5 ∩ (X − µ) < 0.5]

3. P (|X − µ| < 2)

4. P (|X| > 3 ∪ |X| < 1)

5. P (|X − µ| < 1.5 ∩ X > 0)

6. P (|X − µ| > 1.5 ∩ X > 0)

2

Page 65: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.3. VARIABILI CASUALI CONTINUE 65

SoluzioneUtilizzando la variabile casuale X ∼ N(4; 37) le probabilita richieste sono le seguenti:

1.

P [(X − µ) > 1.3 ∪ X > 4.5] = P [(X − µ) ≤ 1.3 ∪ X > 4.5] =

= P

[

Z ≤ 1.3

6.08∪ Z >

4.5 − 4

6.08

]

= P [Z ≤ 0.21 ∪ Z > 0.08] = P (Ω) = 1

2.

P [|X| < 5 ∩ (X − µ) < 0.5] = P [−5 < X < 5 ∩ (X − µ) < 0.5] =

= P

[−5 − 4

6.08< Z <

5 − 4

6.08∩ Z <

0.5

6.08

]

= P [(−1.48 < Z < 0.16) ∩ Z < 0.08] =

= P [−1.48 < Z < 0.08] = Φ(0.08) − Φ(−1.48) = Φ(0.08) − [1 − Φ(1.48)] =

= 0.5319 − (1 − 0.9306) = 0.4625

3.

P [|X − µ| < 2] = P [|X − µ| ≥ 2] = P [(X − µ) ≤ −2 ∪ (X − µ) ≥ 2] =

= P

[

Z ≤ −2

6.08∪ Z ≥ 2

6.08

]

= P [Z ≤ −0.33 ∪ Z ≥ 0.33] =

a seguito dell’incompatibilita dei due eventi

= P (Z ≤ −0.33) + P (Z ≥ 0.33) = [1 − Φ(0.33)] + [1 − Φ(0.33)] = 2 · [1 − Φ(0.33)] =

= 2 · (1 − 0.6293) = 0.7414

4.

P (|X| > 3 ∪ |X| < 1) = P [(X < −3 ∪ X > 3) ∪ (−1 < X < 1)] =

= P

[(

Z <−3 − 4

6.08∪ Z >

3 − 4

6.08

)

∪(−1 − 4

6.08< Z <

1 − 4

6.08

)]

=

= P [(Z < −1.15 ∪ Z > −0.16) ∪ −0.82 < Z < −0.49] =

= P (Z < −1.15) + P (−0.82 < Z < −0.49) + P (Z > −0.16) =

utilizzando la simmetria della variabile casuale Normale

= [1 − Φ(1.15)] + Φ(0.82) − Φ(0.49) + Φ(0.16) = 0.1251 + 0.7939 − 0.6879 + 0.5636 = 0.7947

5.

P (|X − µ| < 1.5 ∩ X > 0) = P [−1.5 < (X − µ) < 1.5 ∩ X > 0] =

= P

(−1.5

6.08< Z <

1.5

6.08∩ Z >

−4

6.08

)

= P [(−0.25 < Z < 0.25) ∩ Z > −0.66] =

= P (−0.25 < Z < 0.25) = Φ(0.25) − [1 − Φ(0.25)] = 2 · Φ(0.25) − 1 = 2 · 0.5987 − 1 = 0.1974

Page 66: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

66 CAPITOLO 2. CALCOLO DELLE PROBABILITA

6.

P (|X − µ| > 1.5 ∩ X > 0) = P [((X − µ) < −1.5 ∪ (X − µ) > 1.5) ∩ X > 0] =

= P [(Z < −0.25 ∪ Z > 0.25) ∩ Z > −0.66] = P (−0.66 < Z < −0.25) + P (Z > 0.25) =

utilizzando la proprieta di simmetria della variabile casuale Normale

= P (0.25 < Z < 0.66) + P (Z > 0.25) = Φ(0.66) − Φ(0.25) + [1 − Φ(0.25)] =

= Φ(0.66) + 1 − 2 · Φ(0.25) = 0.7454 + 1 − 2 · 0.5987 = 0.548

Esercizio 20Sia X ∼ N(2; 15), calcolare le seguenti probabilita:

1. P [|X| < 1.5 ∪ (X − µ) < 0]

2. P [X ≤ 3 ∪ (X − µ) > 0.5]

3. P [(X − µ) < 1.8 ∩ X = 2]

2

SoluzioneData la variabile casuale X ∼ N(2; 15), le probabilita sono:

1.

P [|X| < 1.5 ∪ (X − µ) < 0] = P [−1.5 < X < 1.5 ∪ (X − µ) < 0] =

= P (−0.90 < Z < −0.13 ∪ Z < 0) = P (Z < 0) = 0.5

2.

P [X ≤ 3 ∪ (X − µ) > 0.5] = P [X > 3 ∪ (X − µ) > 0.5] =

= P (Z > 0.26 ∪ Z > 0.13) = P (Z > 0.13) = 1 − Φ(0.13) = 0.4483

3. P [(X − µ) < 1.8 ∩ X = 2] = P (X = 2) = 0

Esercizio 21Sia X ∼ N(4; 37), si calcolino i seguenti percentili:

1. P (X < x0) = 0.67

2. P (X > x0) = 0.1423

3. P [(X − µ) < x0] = 0.8413

2

Page 67: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.3. VARIABILI CASUALI CONTINUE 67

SoluzioneIl calcolo dei percentili e effettuato ricordando che data la v.c. X ∼ N(4; 37), la probabilitaP (X < x0) = P (Z < z0), dove Z e la v.c. Normale standardizzata N(0, 1) e z0 = x0−µ

σ .Da quest’ultima relazione segue che x0 = z0 · σ + µ, ovvero se sono noti z0 ed i parametri (µ e σ)della variabile casuale Normale X, e possibile risalire al valore di x0.Quindi i percentili della variabile X ∼ N(4; 37) saranno i seguenti:

1. P (X < x0) = 0.67Consultando le tavole della variabile casuale Normale standardizzata Φ(z0) = 0.67 cor-risponde a z0 = 0.44, quindi:

x0 = 0.44 · 6.08 + 4 = 6.675

2. P (X > x0) = 0.1423E noto che P (X ≤ x0) = 1 − P (X > x0), quindi P (X ≤ x0) = 1 − 0.1423 = 0.8577.Il percentile corrispondente a 0.8577 e z0 = 1.07 ed allora:

x0 = 1.07 · 6.08 + 4 = 10.506

3. P [(X − µ) < x0] = 0.8413In questo caso z0 = x0/σ, ovvero x0 = z0 · σ. Quindi osservando che a 0.8413 corrispondez0 = 1, allora x0 = 1 · 6.08 = 6.08

Esercizio 22Sia X ∼ t(15) calcolare le seguenti probabilita:

1. P (X > 1.341)

2. P (X < 2.602)

3. P (1.753 < X < 2.947)

4. P (X < −1.341)

5. P (X > −0.691)

2

SoluzioneLe probabilita richieste sono:

1. P (X > 1.341) = 0.1

2. P (X < 2.602) = 1 − 0.01 = 0.99

3. P (1.753 < X < 2.947) = 0.05 − 0.005 = 0.045

4. P (X < −1.341) =per la simmetria della variabile casuale tP (X < −1.341) = P (X > 1.341) = 0.10

Page 68: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

68 CAPITOLO 2. CALCOLO DELLE PROBABILITA

5. P (X > −0.691) =ancora una volta sfruttando la simmetria della variabile casuale tP (X > −0.691) = P (X < 0.691) = 1 − P (X > 0.691) = 1 − 0.25 = 0.75

Esercizio 23Sia X ∼ t(15) calcolare i seguenti percentili:

1. P (X > x0) = 0.05

2. P (X > x0) = 0.025

3. P (X < x0) = 0.9

4. P (X > x0) = 0.95

2

SoluzioneUtilizzando le tavole della v.c. t, i percentili sono i seguenti:

1. x0 = 1.753

2. x0 = 2.131

3. Ricordando che per la simmetria della variabile casuale t-Student P (X < x0) = 1 − P (X ≥x0), quindi P (X ≥ x0) = 1 − P (X < x0) = 1 − 0.90 = 0.10 e segue che: x0 = 1.341

4. Anche in questo caso si fa uso della simmetria della variabile casuale t-Student rispettoall’origine degli assi. In particolare, e noto che l’area sottesa alla sua funzione di densitanell’intervallo (−∞, 0) e 0.5 e lo stesso vale per l’intervallo [0,+∞). Quindi affiche la pro-babilita sia quella indicata dall’esercizio, ovvero P (X > x0) = 0.95, il valore di x0 deveessere negativo. A tale scopo, per fini esplicativi, il percentile e fatto precedere da un segnonegativo e la probabilita e indicata con P (X > −x0) = 0.95. Inoltre se P (X > −x0) = 0.95allora P (X ≤ −x0) = 0.05 e quindi utilizzando nuovamente la simmetria della t-StudentP (X ≤ −x0) = P (X ≥ x0) = 0.05 Segue che il percentile corrispondente a 0.05 e x0 = 1.753e quindi −x0 = −1.753.

Esercizio 24Sia X ∼ χ2

(5) , si calcolino le seguenti probabilita:

1. P (X > 11.0705)

2. P (X > 0.5543)

3. P (X < 12.8325)

4. P (X < 1.61031)

2

Page 69: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

2.3. VARIABILI CASUALI CONTINUE 69

SoluzionePer calcolare le probabilita richieste bisogna utilizzare, in maniera opportuna, le due tavole dellavariabile casuale χ2

(g). In particolare limitando l’attenzione al caso g = 5:

1. P (X > 11.0705) = 0.05

2. P (X > 0.55430) = 1 − 0.01 = 0.99

3. P (X < 12.8325) = 1 − 0.025 = 0.975

4. P (X < 1.61031) = 0.1

Esercizio 25Sia X ∼ χ2

(5) , si calcolino i seguenti percentili:

1. P (X > x0) = 0.01

2. P (X < x0) = 0.9

3. P (X < x0) = 0.05

4. P (X > x0) = 0.05

2

SoluzioneI percentili sono i seguenti:

1. x0 = 15.0863

2. La P (X < x0) = 1 − P (X ≥ x0), quindi P (X ≥ x0) = 1 − 0.90 = 0.10 ed il percentilecorrispondente e x0 = 9.23635

3. x0 = 1.14547

4. x0 = 11.0705

Page 70: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

Capitolo 3

Inferenza Statistica

3.1 Stime puntuali

Esercizio 1Un campione casuale di 20 unita e estratto da una popolazione X ∼ f(µ, σ2), dove f e una funzionedi densita:

2.62, 9.78, 1.11, 6.39, 6.81, 4, 4.74, 0.48, 3.96, 0.64, 0.91, 6.51, 5.77, 6.7, 8.75, 9.96, 7.64, 5.7, 9.9, 0.63

Stimare i parametri incogniti µ e σ2 di X avvalendosi di stimatori non distorti.

2

SoluzioneE dimostrato in teoria che uno stimatore non distorto per la media µ e la media campionaria

X = 1n

n∑

i=1

xi mentre uno stimatore non distorto per la varianza σ2 e s2 = 1n−1

n∑

i=1

(xi − x)2.

Utilizzando i dati campionari ed avvalendosi dei dati in Tabella 3.1, la stima della media e x = 5.15mentre la stima della varianza e s2 = 10.62.

Esercizio 2Data la popolazione X ∼ N(14; 56) da cui e estratto un campione di 20 unita, calcolare le seguentiprobabilita:

1. P (X > 3)

2. P (|X − µ| < 1.2)

3. Sia Y = 2.1 − 3.4X, calcolare la probabilita: P [Y < 2 ∪ (Y − µ) > 3.1].

2

70

Page 71: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

3.1. STIME PUNTUALI 71

i xi (xi − x)2

1 2.62 6.42 9.78 21.443 1.11 16.324 6.39 1.545 6.81 2.766 4 1.327 4.74 0.178 0.48 21.819 3.96 1.4210 0.64 20.3411 0.91 17.9812 6.51 1.8513 5.77 0.3814 6.7 2.415 8.75 12.9616 9.96 23.1417 7.64 6.218 5.7 0.319 9.9 22.5620 0.63 20.43

Totale 103 201.72

Tabella 3.1: Tabella Esercizio 1 - Inferenza Statistica

SoluzioneSi dimostra che, date le ipotesi sulla popolazione, la distribzione della media campionaria in oggettoe:

X ∼ N

(

14,56

20

)

quindi le probabilita desiderate sono:

1. P (X > 3) = P(

Z > 3−141.67

)

= P (Z > −6.59) = 1

2. P (|X − µ| < 1.2) = P [−1.2 < (X − µ) < 1.2] = P (−0.72 < Z < 0.72) = 0.5284

3. Dalla trasformata lineare della variabile casuale X in esame, Y = 2.1 − 3.4X, risulta inoltreche Y ∼ N(−45.5; 32.37) e quindi la probabilita richiesta e:

P [Y ≥ 2 ∪ (Y − µ) > 3.1] = P

(

Z ≥ 2 + 45.5

5.69∪ Z >

3.1

5.69

)

= P (Z ≥ 8.35 ∪ Z > 0.54) =

= P (Z > 0.54) = 1 − Φ(0.54) = 1 − 0.7054 = 0.2946

Page 72: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

72 CAPITOLO 3. INFERENZA STATISTICA

Esercizio 3Si consideri la popolazione X ∼ f(x, θ), con θ = (µ, σ2) e con µ = 2, σ2 = 14. Si estragga da Xun campione casuale di n = 50 unita e calcolare le seguenti probabilita:

1. P (|X| < 1.8)

2. P [(X − µ) < 1]

3. Sia Y = 2 − 3X, calcolare:P [Y > 1 ∩ (Y − µ) < 3]

2

SoluzioneIn questo caso e presa in esame la media campionaria in presenza di un campione casuale estrattoda una popolazione con distribuzione incognita e con parametri µ = 2 e σ2 = 14. Tenuto contodella elevata numerosita delle unita campionarie e quindi avvalendosi del Teorema Limite Centralesegue che:

X ∼ N

(

2,14

50

)

e cosı facendo uso della distribuzione di X, le probabilita richieste sono:

1.

P (|X| < 1.8) = P (−1.8 < X < 1.8) = P

(−1.8 − 2

0.53< Z <

1.8 − 2

0.53

)

=

= P (−7.17 < Z < −0.38) = Φ(−0.38) − Φ(−7.17) = Φ(7.17) − Φ(0.38) =

= 1 − Φ(0.38) = 1 − 0.6480 = 0.352

2. P [(X − µ) < 1] = P (Z < 1.89) = Φ(1.89) = 0.9706

3. Dalla trasformata lineare Y = 2 − 3X, segue che Y ∼ N(−4; 2.52) e quindi:

P [Y > 1∩(Y −µ) < 3] = P

(

Z >1 + 4

1.59∩ Z <

3

1.59

)

= P (Z > 3.14∩Z < 1.89) = P (φ) = 0

Esercizio 4L’andamento della produttivita dei dipendenti di un call center (misurata in termini di numerodi contatti per ora) e descritta da una variabile casuale X ∼ N(13; 45). Estraendo un campionecasuale di 15 nominativi di operatori, calcolare la probabilita che la loro produttivita media siamaggiore di 21.

2

SoluzioneAnche in questo caso sono utilizzati i risultati teorici relativi alla distribuzione della media cam-pionaria. In particolare dai dati forniti emerge che:

Page 73: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

3.2. TEST DELLE IPOTESI 73

X ∼ N

(

13;45

15

)

e quindi la probabilita che il numero medio di contatti del campione di operatori e maggiore di 21e:

P (X > 21) = P

(

Z >21 − 13

1.73

)

= P (Z > 4.62) = 0

ovvero gli operatori in media non sono in grado di contattare piu di 21 nominativi.

3.2 Test delle ipotesi

Esercizio 5Dalla popolazione X ∼ N(µ, σ2) e estratto un campione casuale di 15 unita che assumono i seguentivalori:

6.33; 0.39; 2.09; 5.81; 5.86; 4.87; 4.00; 8.18; 5.72; 8.05; 1.77; 6.27; 9.71; 0.95; 4.56

Sottoporre a test, con livello di significativita pari a 0.05, che la media di X sia pari a 3.

2

SoluzioneIl test in oggetto e relativo ad una media con varianza incognita avente sistema di ipotesi:

H0 : µ = 3H1 : µ 6= 3

mentre la statistica test e:

tc =

√n·(x − µ0)

s∼ t(n−1)

con regione critica |tc| > t(n−1;1−α/2).Dai dati campionari emerge che:

tc =

√15 · (4.97 − 3)√

7.48= 2.79

mentre i valori tabulati sono t(14;1−0.025) = 2.145 e t(14;0.025) = −2.145. Quindi ad un livello disignificativita del 5% rifiuto H0 .

Esercizio 6Il partito politico Alfa decide di proporre la candidatura del Sig. Bianchi. E noto che per essereeletti bisogna avere almeno il 25% dei voti del distretto elettorale.Per valurare il gradimento della candidatura del Sig. Bianchi, e intervistato un campione di 80

Page 74: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

74 CAPITOLO 3. INFERENZA STATISTICA

individui di cui 37 risultano favorevoli al potenziale candidato. Sottoporre a test, con α = 0.05,che il signor Bianchi riceva una percentuale di voti pari al 25% o superiore al 25%, ovvero:

H0 : p = 0.25

H1 : p > 0.25

2

SoluzioneIl test in esame e quello su una proporzione la cui statistica test e:

Zc =p − p0

p0(1−p0)n

∼ N(0, 1)

Dalle informazioni campionarie p = 3780 = 0.4625. Quindi la statistica calcolata diventa:

Zc =0.4625 − 0.25√

0.25(1−0.25)80

= 4.389

Poiche il test e unidirezionale ed il valore critico z(1−α) = 1.64, rifiuto H0 ad un livello di significa-tivita α = 0.05.

Esercizio 7Utilizzando i valori del campione estratto nell’esercizio 5, sottoporre a test (con α = 0.05) ilseguente sistema di ipotesi:

H0 : σ2 = 8H1 : σ2 6= 8

2

SoluzioneAvvalendosi dei risultati delle stime dell’Esercizio 5 e ricordando che la statistica del test in esamee:

χ2c =

(n − 1) · s2

σ20

∼ χ2(n−1)

segue che:

χ2c =

(15 − 1) · 7.48

8= 13.09

mentre i valori che delimitano la regione di accettazione sono χ2(14;1−0.025) = 26.119 e χ2

(14;0.025) =

5.629, quindi ad un livello di significativita del 5% accetto H0.

Page 75: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

3.2. TEST DELLE IPOTESI 75

Esercizio 8La societa Alpha desidera monitorare il fatturato settimanale delle sue aziende situate in Lombardiaed in Sicilia. A tale scopo estrae un campione di 6 aziende lombarde e 4 siciliane che hanno iseguenti fatturati settimanali (espressi in migliaia di Euro):

Lombardia 20.4; 24.8; 30.2; 16.8; 15.3; 13.8Sicilia 19.5; 33.6; 21.9; 25.7

Sottoporre a test (con α = 0.05) che il fatturato medio delle aziende in Lombardia e uguale a quellodelle aziende in Sicilia.

2

SoluzioneIl test in oggetto e relativo al confronto tra medie sotto l’ipotesi che le popolazioni di riferimentosiano indipendenti (non emerge dalla traccia alcuna indicazione che lasci pensare ad un legame didipendenza tra le popolazioni da cui sono estratti i campioni). Quindi il sistema di ipotesi e ilseguente:

H0 : µ1 = µ2

H1 : µ1 6= µ2

mentre la statistica test di riferimento e:

tc =X1 − X2

(m − 1) · s21 + (n − 1) · s2

2

·√

m · n(m + n − 2)

m + n∼ t(m+n−2)

con regione critica |tc| > t(n+m−2;1−α/2).Dai dati campionari segue che:

tc =20.22 − 25.17√197.75 + 114.18

·√

6 · 4(6 + 4 − 2)

6 + 4= −1.231

Osservando che t(8;1−0.025) = 2.306 e t(8;0.025) = −2.306 segue che ad un livello di significativitadel 5% accetto H0.

Esercizio 9E stata effettuata un’indagine statistica presso un punto vendita volta a valutare la disponibilitadei consumatori ad acquistare prodotti a marchio commerciale. A tale scopo e stato intervistatoun campione di n = 40 unita e 18 persone si sono mostrate disponibili all’acquisto di tali prodotti.Si sottoponga a test, con α = 0.05, che il 60% della popolazione sia disponibile all’acquisto deiprodotti a marchio commerciale contro l’alternativa che tale percentuale sia inferiore.

2

SoluzioneIl test in esame e quello su una proporzione avente sistema di ipotesi:

H0 : p = p0

H1 : p < p0

Page 76: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

76 CAPITOLO 3. INFERENZA STATISTICA

con statistica test:

Zc =

√n · (p − p0)

p0 · (1 − p0)∼ N(0; 1)

e regione critica Zc < z(α).

Dai dati rilevati sul campione intervistato p = 1840 = 0.45 e quindi:

Zc =

√40(0.45 − 0.60)√

0.60 · 0.40= −1.936

Osservando dalle tavole che z(0.05) = −1.64, rifiuto H0 ad un livello di significativita del 5%.

Esercizio 10L’indagine precedente e stata ripetuta presso un altro punto vendita e su 56 intervistati, 21 eranodisponibili ad acquistare prodotti a marchio commerciale. Si sottoponga a test che la proporzionedi clienti disponibili all’acquisto di prodotti a marchio commerciale e uguale nei due punti vendita.

2

SoluzioneIl test richiesto e di confronto tra proporzioni con sistema di ipotesi:

H0 : p1 = p2

H1 : p1 6= p2

e con statistica test:

Zc =p1 − p2

p(1 − p)[1/n + 1/m]∼ N(0; 1) dove p =

n · p1 + m · p2

n + m

Dai dati campionari emerge che p = 0.406 e:

Zc =0.45 − 0.375

0.406(1 − 0.406)[1/40 + 1/56]= 0.738

Ricordando che la regione critica del test e |Zc| > z(1−α/2), i valori che la delimitano sono z(0.025) =−1.96 e z(1−0.025) = 1.96 . Quindi H0 e accettata ad un livello di significativita del 5%.

Esercizio 11Un’azienda commerciale ha effettuato un’indagine campionaria mediante la quale ha chiesto a 18clienti l’ammontare di spesa settimanale effettuata presso il proprio punto vendita, rilevando iseguenti dati:

2.91; 6.54; 19.74; 16.05; 2.55; 17.24; 6.99; 2.55; 18.26; 6.59; 17.52; 17.11; 4.39; 1.24; 1.33; 13.17; 10.12; 4.06

A seguito della ristrutturazione dei locali l’azienda commerciale ha nuovamente intervistato il cam-pione dei 18 clienti chiedendo loro l’ammontare della spesa settimanale sostenuta presso l’eserciziocommerciale, ottenendo le seguenti risposte:

Page 77: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

3.2. TEST DELLE IPOTESI 77

1.46; 12.02; 7.2; 17.24; 10.84; 0.1; 5.23; 15.91; 9.67; 12.11; 3.06; 3.96; 9.09; 16.81; 10.5; 17.57; 10.57; 16.43

Sottoporre a test, con α = 0.05, che la media della spesa dei clienti dell’azienda commerciale primae dopo la ristrutturazione sia rimasta invariata.

2

SoluzioneIl test proposto e di confronto tra medie con dati appaiati avente il seguente sistema di ipotesi:

H0 : µ1 = µ2

H1 : µ1 6= µ2

e con statistica test:

tc =

√n(X2 − X1)

s21 + s2

2 − 2s12

∼ t(n−1)

Dai dati campionari risulta che la statistica calcolata e:

tc =

√18(9.99 − 9.35)

45.55 + 31.14 − 2 · (−12.69)= 0.269

mentre i valori che delimitano la regione di accettazione sono t(17;1−0.025) = 2.11 e t(17;0.025) =−2.11. Quindi ad un livello di significativita del 5% accetto H0.

Esercizio 12Le taglie degli abiti realizzati da un atelier hanno distribuzione N(µ, σ2). L’azienda ritiene che,affinche non vi sia merce invenduta, e necessario che la variabilita delle taglie realizzate sia σ2 > 30.Per valutare se tale condizione e verificata tra i capi disponibili, si estrae un campione casuale di15 capi le cui taglie sono:

55, 49, 55, 38, 41, 53, 43, 38, 47, 38, 47, 39, 52, 42, 56Sottoporre a test, con α = 0.05, che:

H0 : σ2 = 30

H1 : σ2 > 30

2

SoluzioneIl test da utilizzare in questo caso e quello su una varianza (con media incognita) la cui statisticatest e:

χ2c =

(n − 1)s2

σ20

∼ χ2(n−1)

dove, dai dati campionari risulta che s2 = 46, 314 ed n = 15. La statistica calcolata sara quindi:

Page 78: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

78 CAPITOLO 3. INFERENZA STATISTICA

χ2c =

14 · 46.314

30= 21, 613

Il test e unidirezionale e dalle tavole della variabile casuale χ2 si osserva che χ2(n−1,1−α) = χ2

(14,1−0.05) =23.685 e quindi accetto H0 ad un livello di significativita α = 0.05.

Esercizio 13La distribuzione dei numeri di visite domiciliari per influenze stagionali effettuate presso gli assistitidi 2 medici di famiglia nell’anno 2002 ha rispettivamente le seguenti distribuzioni X1 ∼ N(µ1, σ

2)e X2 ∼ N(µ2, σ

2).I due medici vogliono valutare, sulla base di un campione di 15 assistiti, se il numero medio divisite domiciliari da loro effettuate sono uguali.A tale scopo sono estratti i seguenti campioni:

numero visite domiciliari presso 15 assistitimedico 1 4 4 5 2 9 5 10 1 8 6 1 5 3 3 6medico 2 9 8 0 0 2 4 7 4 2 7 2 10 5 1 7

1. Fissato un livello di significativita α = 0.05, verificare il seguente sistema di ipotesi:

H0 : µ1 = µ2

H1 : µ1 6= µ2

2. Il medico 2 nell’anno 2003 ha somministrato il vaccino antinfluenzale ai 15 assistiti delcampione 2002 ed il numero di visite che ha effettuato presso di loro e il seguente:

8, 1, 8, 8, 3, 5, 6, 4, 1, 8, 3, 3, 6, 2, 4

Verificare, con un opportuno test, se il numero medio di visite del medico 2 nel 2003 e rimastoinvariato o si e ridotto rispetto al 2002. Ovvero fissato α = 0.05, verificare il seguente sistemadi ipotesi:

H0 : µ2,2002 = µ2,2003

H1 : µ2,2002 > µ2,2003

3. Il medico 2 desidera inoltre valutare, sulla base dei dati campionari osservati negli anni 2002e 2003, l’eventuale presenza di correlazione tra le visite domiciliari per influenze stagionalieffettuate nei due anni di riferimento (con α = 0.05), sottoponendo a test il seguente sistemadi ipotesi:

H0 : ρ = 0

H1 : ρ 6= 0

2

Page 79: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

3.2. TEST DELLE IPOTESI 79

Soluzione

1. Il primo test in esame ha ad oggetto il confronto tra medie di due popolazioni indipendenti.A tale scopo la statistica test e:

tc =X1 − X2

s√

1m + 1

n

∼ t(m+n−2)

dove s2 =(m−1)s2

1+(n−1)s2

2

m+n−2 e la cui regione critica, nel caso bidirezionale in esame e |tc| >t(n+m−2;1−α/2). Dai dati campionari emerge che m = 15, n = 15, x1 = 4.8, x2 = 4.533,s21 = 7.314, s2

2 = 10.981, pertanto:

tc =4.8 − 4.533

3.025 ·√

115 + 1

15

= 0.242

e quindi poiche t(28,1−0.025) = 2.048 e t(28,0.025) = −2.048, accetto H0.

2. La seconda parte del caso esaminato richiede il confronto di due medie in presenza di datidipendenti. In particolare si sono osservate le unita campionarie prima e dopo la sommini-strazione del vaccino ai clienti del medico 2. Quindi il test da utilizzare e quello di confrontotra medie con dati appaiati:

tc =

√n(X − Y )

s2x + s2

y − 2sxy

∼ t(n−1)

dove sxy = 1n−1

n∑

i=1

(xi − x)(yi − y)

Segue che n = 15, X = 4.533, Y = 4.667, s2x = 10.981, s2

y = 6.524 mentre sxy = 0.047,quindi:

tc =

√15(4.533 − 4.667)√

10.981 + 6.524 − 2 · 0.047= −0.124

Ricordando che il test e unidirezionale, la regione critica e data da: tc > t(n−1,1−α). Poichet(14,1−0.05) = 1.761, accetto H0.

3. Il test sul coefficiente di correlazione si avvale della seguente statistica:

tc =r ·

√n − 2√

1 − r2∼ t(n−2)

dove r e la stima del coefficiente di correlazione e la regione critica e |tc| > t(n−2;1−α/2).

Utilizzando i dati campionari emerge che:

tc =0.006 ·

√15 − 2√

1 − 0.0062= 0.022

Page 80: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

80 CAPITOLO 3. INFERENZA STATISTICA

mentre i valori tabulati sono t(13;1−0.025) = 2.16 e t(13;0.025) = −2.16.Quindi dato α = 0.05, accetto l’ipotesi nulla del test.

Esercizio 14L’ufficio statistico dell’universita Beta ha estratto un campione casuale di 500 laureati dell’annosolare 2004. Avvalendosi dei loro dati disponibili presso la segreteria studenti vuole valutarel’eventuale presenza di legame associativo tra il voto di laurea ed il tempo impiegato (espressoin anni) per il conseguimento del titolo.

A tale scopo si avvale dei dati in tabella:

VL \Anni 3 4| − |5 6| − |7 oltre 760| − |80 15 46 19 45 12580 − |100 13 32 40 34 119100 − |105 37 58 18 19 132105 − |110 19 27 34 44 124

84 163 111 142 500

Sottoporre a test, con α = 0.05, l’indipendenza tra le variabili V L ed Anni

2

SoluzioneLa verifica dell’indipendenza tra le variabili V L ed Anni e effettuata utilizzando un test nonparametrico avente sistema di ipotesi:

H0 : X ed Y sono indipendenti

H1 : X ed Y non sono indipendenti

la cui statistica e:

χ2c =

k∑

i=1

h∑

j=1

(nij − n∗ij)

2

n∗ij

∼ χ2(k−1)(h−1) con n∗

ij ≥ 5

e con regione critica χ2c > χ2

[(k−1)(h−1);1−α]

La statistica test evidenzia la necessita di costruire la tabella delle frequenze teoriche n∗ij :

VL \Anni 3 4| − |5 6| − |7 oltre 760| − |80 21 40.75 27.75 35.5 12580 − |100 19.992 38.794 26.418 33.796 119100 − |105 22.176 43.032 29.304 37.488 132105 − |110 20.832 40.424 27.528 35.216 124

84 163 111 142 500

Page 81: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

3.3. INTERVALLI DI CONFIDENZA 81

in cui si osserva che ciascuna frequenza n∗ij soddisfa la condizione teorica richiesta dal test n∗

ij ≥ 5.Si puo pertanto passare a determinare la statistica calcolata:

χ2c = 1.714 + 0.676 + 2.759 + 2.542 + 2.445 + 1.19 + 6.983 + 0.001 + 9.909 + 5.206 +

+4.361 + 9.118 + 0.161 + 4.458 + 1.522 + 2.191 = 55.236

Il valore teorico χ2[(4−1)(4−1);1−0.05] = 16.919 e quindi si conclude che ad un livello di significativita

del 5% rifiuto H0.

3.3 Intervalli di confidenza

Esercizio 15Un’azienda ha commissionato ad una societa di software la riprogettazione del proprio sito web.Dopo che quest’ultimo e stato messo on-line vuole studiare gli effetti del rinnovo esaminando ilnumero di contatti giornaliero al sito. Sotto l’ipotesi che tali contatti hanno distribuzione Gaus-siana, N(µ, σ2), seleziona un campione casuale di 10 giorni in cui il numero di contatti e stato ilseguente:

giorni 1 2 3 4 5 6 7 8 9 10n. contatti 226 803 625 871 326 288 724 149 637 807

1. Costruire un intervallo di confidenza per la media dei contatti giornalieri della popolazione,fissando α = 0.05.

2. Costruire un intervallo di confidenza per la media dei contatti giornalieri della popolazione,fissando α = 0.02.

2

Soluzione

1. L’intervallo di confidenza per la media della popolazione e dato da:

x − t(n−1;1−α/2)s√n≤ µ ≤ x + t(n−1;1−α/2)

s√n

tale che:

P

(

x − t(n−1;1−α/2)s√n≤ µ ≤ x + t(n−1;1−α/2)

s√n

)

= 1 − α

Dai dati campionari emerge che:

x = 545.6 ed s = 271

mentre t(n−1;1−α/2) = t(9;1−0.025) = 2.262.

Page 82: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

82 CAPITOLO 3. INFERENZA STATISTICA

Avvalendosi di tali risultati l’intervallo di confidenza, con α = 0.05, e:

[

545.6 − 2.262271√

10; 545.6 + 2.262

271√10

]

ovvero[351.75; 739.45]

2. Ad un livello di confidenza α = 0.02 l’intervallo risultera di ampiezza maggiore, infatti inquesto caso t(9;1−0.01) = 2.821 e l’intervallo di confidenza e:

[

545.6 − 2.821271√

10; 545.6 + 2.821

271√10

]

quindi[303.85; 787.35]

Esercizio 16Il partito XX desidera sottoporre al consiglio comunale una modifica al piano del traffico. Pervalutare il gradimento della proposta decide di intervistare un campione casuale di 20 cittadiniresidenti ai quali chiede di manifestare il prorio accordo o disaccordo in merito ricevendo le seguentirisposte:

cittadino 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20risposta 0 1 1 1 0 0 0 0 0 1 0 0 0 0 0 1 1 1 1 0

dove 1=accordo mentre 0=disaccordo.

1. Stimare la proporzione di cittadini favorevoli alla modifica del piano del traffico.

2. Costruire un intervallo di confidenza per la proporzione di popolazione favorevole alla modificadel piano del traffico (con α = 0.05).

2

Soluzione

1. La stima della proporzione e p = 120

20∑

i=1

xi = 820 = 0.4, dove:

xi =

1 se ”accordo”

0 se ”disaccordo”

2. L’intervallo di confidenza per la proporzione p e:

p − z1−α/2

p(1 − p)

n≤ p ≤ p + z1−α/2

p(1 − p)

n≤ p

Page 83: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

3.3. INTERVALLI DI CONFIDENZA 83

tale che:

P

(

p − z1−α/2

p(1 − p)

n≤ p ≤ p + z1−α/2

p(1 − p)

n

)

= 1 − α

Dalle tavole della variabile casuale Normale standardizzata, N(0, 1), si osserva che z(1−0.025) =1.96 e quindi l’intervallo di confidenza per p e:

[

0.4 − 1.96

0.4 · 0.6

20; 0.4 + 1.96

0.4 · 0.6

20

]

ovvero:[0.185; 0.615]

Page 84: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

Capitolo 4

Il Modello di Regressione

4.1 Modello di Regressione Lineare Semplice

Esercizio 1E stato intervistato un campione di 10 famiglie alle quali e stato richiesto il luogo di residenza, ilreddito mensile e le spese per la cura personale mensile:

Famiglia Residenza Reddito (R) Cura Personale (C)(×1000 Euro) (×1000 Euro)

1 Nord 1.16 0.682 Centro 7.26 2.713 Nord 6.09 2.034 Sud 2.58 0.845 Sud 3.82 1.546 Centro 9.43 3.117 Sud 5.31 1.798 Nord 5.61 2.469 Nord 5.17 2.3510 Sud 5.71 2.37

1. stimare i parametri del seguente modello di regressione lineare semplice:

C = a + bR + e

2. verificare la bonta di accostamento del modello stimato ai dati osservati

3. sottoporre a test, con α = 0.05, il seguente sistema di ipotesi:

H0 : b = 0

H1 : b 6= 0

2

84

Page 85: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

4.1. MODELLO DI REGRESSIONE LINEARE SEMPLICE 85

Soluzione

1. Il grafico richiesto per la rappresentazione delle coppie di valori e i presentato in Figura 4.1da cui e possibile osservare la presenza di un legame lineare positivo tra le due variabili inesame.

Figura 4.1: Diagramma scatter delle coppie di valori (Ri, Ci)

2. Le stime dei parametri a e b del modello di regressione sono date da:

b =SR,C

S2R

a = C − bR

Come gia evidenziato per il modello di interpolazione, e utile avvalersi dei dati nella tabellaseguente per agevolare i calcoli necessari alla stima dei due parametri:

Famiglia R C C × R C2 R2

1 1.16 0.68 0.789 0.462 1.3462 7.26 2.71 19.675 7.344 52.7083 6.09 2.03 12.363 4.121 37.0884 2.58 0.84 2.167 0.706 6.6565 3.82 1.54 5.883 2.372 14.5926 9.43 3.11 29.327 9.672 88.9257 5.31 1.79 9.505 3.204 28.1968 5.61 2.46 13.801 6.052 31.4729 5.17 2.35 12.15 5.523 26.72910 5.71 2.37 13.533 5.617 32.604

Totale 52.14 19.88 119.193 45.073 320.316

Segue quindi che:

C = 110

10∑

i=1

Ci = 1.988 R = 110

10∑

i=1

Ri = 5.214 mR,C = 110

10∑

i=1

Ri · Ci = 11.919

SR,C = mR,C − R · C = 1.554 m2C = 110

10∑

i=1

C2i = 4.507 m2R = 1

10

10∑

i=1

R2i = 32.032

Page 86: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

86 CAPITOLO 4. IL MODELLO DI REGRESSIONE

S2C = m2C − C2 = 0.555 S2

R = m2R − R2 = 4.846

quindi le stime dei parametri sono:

b =1.554

4.846= 0.321 a = 1.988 − 0.321 · 5.214 = 0.314

3. La bonta di accostamento ai dati e valutata con l’indice R2. Ricordando che:

R2 = r2R,C (dove rR,C e la stima dell’indice di correlazione)

e facile calcolare: R2 =(

0.948√0.555·4.846

)2

= 0.899. Il valore assunto dall’indice R2 evidenzia

la rilevante capacita del modello nel cogliere la variabilita del fenomeno osservato, ovvero piuparticolare il modello stimato coglie l’89.9% della variabilita totale del fenomeno.

4. Il test sul parametro b e fondato sul seguente sistema di ipotesi:

H0 : b = 0H1 : b 6= 0

avente statistica test:

tc =b

sb

∼ t(n−2) con s2b

=s2

n · S2P

e regione critica |tc| > t(n−2;1−α/2).

Il calcolo di tc richiede la preliminare stima della varianza degli errori ei (indicata con s2):

ei = Ci − Ci dove Ci = 0.314 + 0.321 · Ri i = 1, 2, . . . , 10

tale che s2 = 1n−2

n∑

i=1

e2i

Si rende quindi necessaria l’aggiunta di ulteriori colonne alla tabella precedente:

Famiglia R C Ci ei e2i

1 1.16 0.68 0.686 -0.006 02 7.26 2.71 2.644 0.066 0.0043 6.09 2.03 2.269 -0.239 0.0574 2.58 0.84 1.142 -0.302 0.0915 3.82 1.54 1.54 0 06 9.43 3.11 3.341 -0.231 0.0537 5.31 1.79 2.019 -0.229 0.0528 5.61 2.46 2.115 0.345 0.1199 5.17 2.35 1.974 0.376 0.14110 5.71 2.37 2.147 0.223 0.05

Totale 52.14 19.88 0.567

Page 87: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

4.1. MODELLO DI REGRESSIONE LINEARE SEMPLICE 87

da cui emerge che la stima della varianza degli errori e s2 = 0.071 mentre la statistica testassume valore: tc = 0.321√

0.001

Confrontando quest’ultimo con i valori tabulati t(8;1−0.025) = 2.306 e t(8;0.025) = −2.306, epossibile concludere che ad un livello di significativita del 5% rifiuto l’ipotesi nulla del test.

Esercizio 2Utilizzando i dati dell’esercizio 1 del corrente capitolo ed il modello in esso stimato:

1. Effetturare l’analisi grafica dei residui del modello stimato

2. Fissato α = 0.05, la costante a puo essere considerata significativamente diversa da 0?

2

Soluzione

1. L’analisi grafica dei residui e generalmente effettuata avvalendosi dei diagrammi scatter dellecoppie di valori (i, ei) ed (ei, ei−1).

Il primo dei due grafici e presentato in Figura 4.2 da cui non merge la presenza di strutturanelle coppie di valori e quest’assenza di struttura e ulteriormente confermata dalla Figura 4.3dove sono rappresentate le coppie (ei, ei−1).

Figura 4.2: Diagramma scatter delle coppie di valori (i, ei)

Tale valutazione grafica conferma la validita del modello stimato nel rappresentare la strut-tura dei dati osservati come gia verificato, con una procedura differente, nel precedenteesercizio con l’indice R2.

2. Per verificare se l’intercetta del modello e significativamente diversa da zero, fissato α = 0.05,e necessario costruire un test su a avente sistema di ipotesi:

H0 : a = 0H1 : a 6= 0

Page 88: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

88 CAPITOLO 4. IL MODELLO DI REGRESSIONE

Figura 4.3: Diagramma scatter delle coppie di valori (ei, ei−1)

e statistica test:

tc =a

sa∼ t(n−2) con s2

a =s2 · m2R

n · S2R

dove m2R e il momento secondo della variabile indipendente R, S2R e la varianza di quest’ultima,

s2 e la varianza degli errori mentre la regione critica e |tc| > t(n−2;1−α/2)

Utilizzando i risultati del precedente esercizio segue che:

s2a =

0.071 · 32.032

10 · 4.846= 0.047

e quindi la statistica test e tc = 1.448.

Fissato α = 0.05 i valori che delimitano la regione di accettazione del test sono t(8;1−0.025) =2.306 e t(8;0.025) = −2.306, quindi H0 e accettata, ovvero il parametro a non e significativa-mente diverso da zero.

Esercizio 3E stata effettuata una ricerca medica su un campione di 350 pazienti, volta a valutare la relazioneesistente tra l’assunzione di sale (SL) e la pressione sanguigna (PS).Dai dati campionari e emerso che il consumo medio giornaliero di sale e 25.4 mg e la media dellapressione sanguigna massima e 117.8. E inoltre emerso che la varianza campionaria di SL e 134.3mentre quella di PS e 75.9 mentre la loro correlazione e 0.521.L’equipe medica ritiene che la relazione tra SL e PS e ben descritta da un modello di regressionelineare semplice:

PS = a + b · SL + e

1. Stimare i parametri a e b del modello di regressione

2. Verificare la bonta di accostamento del modello ai dati

2

Page 89: Esercizi di Statistica - labeconomia.unisa.it · Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalita`

4.1. MODELLO DI REGRESSIONE LINEARE SEMPLICE 89

Soluzione

1. La stima dei parametri del modello richiede la conoscenza della covarianza tra SL e PS.Osservando che:

SSL,PS = rSL,PS · SSLSPS

la covarianza sara SSL,PS = 0.521 ·√

134.3 · 75.9 = 52.60.

Quindi le stime dei due parametri sono:

b =SSL,PS

S2SL

=52.60

134.3= 0.39 a = 117.8 − 0.39 · 25.4 = 107.89

2. La bonta di accostamento del modello ai dati e possibile valutarla con l’indice R2. Utilizzandola relazione R2 = r2

SL,PS segue che R2 = 0.271 e quindi il 27.1% della variabilita totale delfenomeno osservato e spiegato dal modello di regressione lineare stimato.